2007-04-13

Bücher mit freier OCR-software einlesen

Seit kurzem zeit steht tesseract als freie OCR software zur verfügung und Google bezuschusst offensichtlich die weiterentwicklung dieses programms. 5 werke habe ich mit tesseract erfasst und zum korrekturlesen bei den Distributed Proofreaders eingestellt:
  • The glaciers of the Alps (1896) by Tyndall, John
  • The life and writings of Henry Fuseli 1-3 (1831) by Fuseli, Henry
  • Roses and rose growing [1908] by Kingsley, Rose Georgina
  • A defence of the Hessians (1899) by Rosengarten, J. G.
  • Tieck's essay on the Boydell Shakspere gallery (1912) by Danton, George H.
Davon haben 3 bücher bereits die erste »proofreading round« passiert.

No comments: