OCR-D Koordinierungsprojekt - Projektdetails
Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) Phase 3
www.sub.uni-goettingen.de/projekte-forschung/projektdetails/projekt/ola-hd-ein-ocr-d-langzeitarchiv-fuer-historische-drucke/
www.sub.uni-goettingen.de/projekte-forschung/projektdetails/projekt/operandi-ocr-d-performance-optimisation-and-integration/
www.sub.uni-goettingen.de/projekte-forschung/projektdetails/projekt/ola-hd-service-ein-generischer-dienst-fuer-die-langzeitarchivierung-historischer-drucke/
Das Ziel des Projekts „OCR-D“ ist es, die Volltexttransformation von historischen Drucken aus dem 16.-18. Jahrhundert konzeptionell und technisch vorzubereiten. Dafür wurde eine Open Source OCR-D-Software entwickelt, die den Prozess der Volltexterkennung in einzelne Schritte zerlegt, sodass der jeweils optimale Workflow für die zu prozessierenden Drucke erstellt werden kann, um damit wissenschaftlich verwertbare Volltexte zu generieren.
In Phase 3 des Projekts soll die Software stabilisiert und deren Anwendung in Massendigitalisierung eingeleitet werden. Die Software soll nutzerfreundlicher und skalierbar werden. Um diese Ziele zu erreichen, bedarf es eines Koordinierungsgremiums, das die einheitliche Entwicklung von Schnittstellen und verschiedenen Komponenten der OCR-D-Software sowie projektübergreifende Implementierungsdetails wie Lastverteilung, Deployment und Datenhaltung koordiniert.
Die Koordinierung wird von fünf Einrichtungen übernommen (Herzog August Bibliothek, Berlin-Brandenburgische Akademie der Wissenschaften, Staatsbibliothek zu Berlin, SUB Göttingen und Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)), die sich mit unterschiedlichen Schwerpunkten einbringen. Die SUB Göttingen, zusammen mit der GWDG, trägt insbesondere zur Qualitätssicherung, Optimierung, zur Sicherstellung der Repositorien und der Verstetigung der Software bei.
Leitung / Koordination
Partnerinstitutionen
- Berlin-Brandenburgische Akademie der Wissenschaften
- Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
- Niedersächsische Staats- und Universitätsbibliothek Göttingen
- Staatsbibliothek zu Berlin - Preußischer Kulturbesitz