OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von Optical Character Recognition – Phase III gestartet

OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) [Phase 3], Koordinierungsprojekt

Projektträger
Herzog August Bibliothek Wolfenbüttel (HAB), Berlin-Brandenburgische Akademie der Wissenschaften (BBAW), Staatsbibliothek zu Berlin (SBB), Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB), Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG)
Gefördert durch
Deutsche Forschungsgemeinschaft (DFG)
PLZ des Projektträgers
38304
Ort des Projektträgers
Wolfenbüttel
Land
Deutschland
Vom - Bis
01.04.2021 - 31.07.2024
Von
Lena Hinrichsen, Herzog August Bibliothek Wolfenbüttel

OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von Optical Character Recognition – Phase III gestartet

Im Koordinierungsprojekt sowie in vier Implementierungs- und drei Modulprojekten wird in den kommenden Jahren an der Weiterentwicklung der OCR-D-Software gearbeitet und die Massendigitalisierung von VD 16, 17 und 18 vorbereitet.

Seit 2015 arbeitet die DFG-Förderinitiative an der Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) von historischen Drucken und konnte bereits eine prototypische OCR-Software [1] vorlegen. Diese ist mit ihrer Vielzahl an verfügbaren Werkzeugen für eine große Bandbreite an unterschiedlichen Anwendungsszenarien geeignet. In Phase III steht die konzeptionelle Vorbereitung für die automatische Generierung von Volltexten für die Verzeichnisse der im deutschen Sprachraum erschienenen Drucke des 16., 17. und 18. Jahrhunderts im Fokus. Außerdem arbeiten vier Implementierungsprojekte daran, OCR-D in bestehende Anwendungen und Infrastrukturen zu integrieren, während drei Modulprojekte OCR-D-Werkzeuge weiter optimieren.

Am 30. Juli fand unser Kick-off-Workshop statt, der die Phase III von OCR-D einläutete. Das Team des Koordinierungsprojekts gab eine Einführung in die Ziele und öffentlichen Kommunikationskanäle von OCR-D [2], in Status und Pläne der OCR-Software [3] sowie der Web-API [4] und in den Umgang mit Ground Truth Daten in OCR-D [5]. Zudem gab das Koordinierungsprojekt einen Einblick in die bisherige Praxis der Softwareentwicklung in OCR-D [6] mit Möglichkeiten, mitzuwirken. Darüber hinaus stellten sich die Implementierungs- und Modulprojekte der interessierten Community und unseren Kooperationspartnern in kurzen Vorträgen [7] vor.

Die UB Braunschweig, die SLUB Dresden und die UB Mannheim erweitern OCR-D und Kitodo für die produktive Massendigitalisierung; die SUB Göttingen und die GWDG arbeiten an der Performanceoptimierung, indem sie OCR-D auf einem Hochleistungscluster einsetzen; das GEI Braunschweig, das HCI und das ZPD der Universität Würzburg werden OCR-D-Werkzeuge in OCR4all verfügbar machen; die ULB Sachsen-Anhalt wird OCR-D in ihre Open-Source-Massendigitalisierungsinfrastruktur implementieren. Während diese Projektpartner an vier Implementierungsszenarien arbeiten, werden drei Projekte die OCR-D-Module aus Phase II verbessern: die UB Mannheim entwickelt ein werkspezifisches Training mit Tesseract und Calamari; die JGU Mainz und die FAU Erlangen-Nürnberg treiben die Erkennung von Schriftgruppen für besser passende OCR-Modelle voran; und das Projekt der SUB Göttingen und der GWDG optimiert die Zuverlässigkeit, Durchsuchbarkeit und feingranulare Referenzierung des Langzeitarchivs OLA-HD.

In unserem Chat-Kanal, der Gitter-Lobby [8], halten wir Sie stets über öffentliche OCR-D-Veranstaltungen auf dem Laufenden und Sie können sich mit unserer Community austauschen. Weitere Informationen darüber, wie Sie mit OCR-D in Kontakt treten und zu OCR-D beitragen können, finden Sie auf unserer Website [9]. In der Gitter-Lobby und auf unserer Website werden wir Sie zudem informieren, sobald Sie sich in unseren Newsletter eintragen können, der demnächst eingerichtet wird.

[1]https://github.com/OCR-D
[2]https://ocr-d.de/assets/kick-off/phase3.pdf
[3]https://ocr-d.de/assets/kick-off/spec_core_ocrd_all.pdf
[4]https://ocr-d.de/assets/kick-off/web-api.pdf
[5]https://ocr-d.de/assets/kick-off/gt.pdf
[6]https://ocr-d.de/assets/kick-off/software-development.pdf
[7]https://ocr-d.de/assets/kick-off/lightning-talks.pdf
[8]https://gitter.im/OCR-D/Lobby
[9]https://ocr-d.de/de/platforms

OCR-D: DFG-funded Initiative for Optical Character Recognition Development - Phase III started

The OCR-D coordination project as well as in four implementation and three module projects will continue to improve the OCR-D software in the coming years, paving the way for the mass digitisation of all works in the VD 16, 17 and 18.

Since 2015, the DFG funding initiative has been working on the further development of Optical Character Recognition (OCR) processes for historical prints and has already been able to present a prototypical OCR software [1]. With its multitude of available tools, this software is suitable for a wide range of different application scenarios. In phase III, the focus is on the conceptual preparation for the automatic generation of full texts for VD 16, VD 17 and VD 18.In addition, four implementation projects are working on integrating OCR-D into existing applications and infrastructures, while three module projects are further optimising OCR-D tools.

On 30 July, our kick-off workshop took place, ushering in Phase III of OCR-D. The coordination project team gave an introduction to OCR-D's goals and public communication channels [2], the OCR-D software status and plans [3] and web API [4], and how to handle Ground Truth data in OCR-D [5]. In addition, the coordination project gave insights into the previous practice of software development in OCR-D [6] including opportunities to contribute. Furthermore, the implementation and module projects presented themselves to the interested community and our cooperation partners in short presentations [7].

UB Braunschweig, SLUB Dresden and UB Mannheim are extending OCR-D and Kitodo for productive mass digitisation; SUB Göttingen and GWDG are working on performance optimisation by deploying OCR-D on a High-Performance Cluster; GEI Braunschweig, HCI and ZPD of the University of Würzburg will make OCR-D tools available in OCR4all; ULB Sachsen-Anhalt will implement OCR-D in its Open Source mass digitisation infrastructure. While these project partners are working on four implementation scenarios, three projects will improve the OCR-D modules from Phase II: UB Mannheim is developing work-specific training with Tesseract and Calamari; JGU Mainz and FAU Erlangen-Nuremberg are improving font group recognition for better-fitting OCR models; and the SUB Göttingen and GWDG project is optimising the reliability, searchability and granular referencing of OCR results in the long-term archive OLA-HD.

In our chat channel, the Gitter lobby [8], we always keep you up to date on public OCR-D events and you are welcome to join our community. For more information on how you can get in touch and contribute to OCR-D, please visit our website [9]. We will also let you know in the Gitter lobby and on our website once you can subscribe to our newsletter, which will be launched soon.

[1]https://github.com/OCR-D
[2]https://ocr-d.de/assets/kick-off/phase3.pdf
[3]https://ocr-d.de/assets/kick-off/spec_core_ocrd_all.pdf
[4]https://ocr-d.de/assets/kick-off/web-api.pdf
[5]https://ocr-d.de/assets/kick-off/gt.pdf
[6]https://ocr-d.de/assets/kick-off/software-development.pdf
[7]https://ocr-d.de/assets/kick-off/lightning-talks.pdf
[8]https://gitter.im/OCR-D/Lobby
[9]https://ocr-d.de/en/platforms

Redaktion
Veröffentlicht am
03.09.2021
Klassifikation
Region(en)
Weitere Informationen