Stud. Hilfskraft "Texterfassung historischer Dokumente" (BBAW Berlin)

Stud. Hilfskraft "Texterfassung historischer Dokumente" (BBAW Berlin)

Arbeitgeber
Berlin-Brandenburgische Akademie der Wissenschaften
Ort
Berlin
Land
Deutschland
Vom - Bis
01.08.2016 - 31.12.2016
Bewerbungsschluss
17.07.2016
Von
DFG-Projekt Weiterentwicklung von Verfahren für die Optical-Character-Recognition

Für das von der DFG geförderte Projekt Weiterentwicklung von Verfahren für die Optical-Character-Recognition (OCR), Koordinierungsprojekt (OCR-D) an der Berlin-Brandenburgischen Akademie der Wissenschaften sucht das Projekt zum frühestmöglichen Zeitpunkt, zunächst befristet bis zum 31.12.2016
drei studentische Hilfskräfte für 41h/Monat.

Die automatische Texterkennung wird in den kommenden Jahren weiter an Bedeutung gewinnen. Vor allem in den digital getriebenen Geisteswissenschaften sind die Anforderungen und der Wunsch nach digitalen Volltexten von Drucken aus den Beständen der Bibliotheken heute schon groß. Das DFG-Projekt OCR-D arbeitet an der technischen Vorbereitung der koordinierten, maschinellen Massenvolltextdigitalisierung von digitalisierten Drucken des 16.-19. Jahrhunderts. Höchste Priorität wird bei der Vervolltextung auf die Qualität der Text- und Strukturerfassung gelegt, um wissenschaftlich nutzbare Daten für die zukünftige Forschung zu gewinnen. Weitere Informationen finden Sie unter
www.ocr-d.de.

Für das Projekt werden studentische Hilfskräfte mit einem geisteswissenschaftlichen oder informationswissenschaftlichen Profil gesucht, die folgende Aufgaben bearbeiten:

geisteswissenschaftliches Profil
------------------------------------------
- Qualitätskontrolle von Bilddigitalisaten/Scans
- Strukturierung von Werken anhand der Bilddigitalisate
- Unterstützung bei der Qualitätssicherung (Identifikation und Korrektur von Erfassungs-, Auszeichnungs-, Druck- und anderen Fehlern)
- ggf., je nach Vorkenntnissen, Korrektur und Anreicherung von TEI-XML-kodierten Volltexten
- Kontrolle und ggf. Korrektur von Metadaten

informationswissenschaftliches Profil
-------------------------------------------------
- Unterstützung in der Anwendung, dem Training und Anpassung von OCR-Werkzeugen
- Entwicklung und Pflege von Datenbanken
- Programmierung von Konversion- und Transformationsverfahren im Bereich XML

Entsprechend der Profile ergeben sich folgende Anforderungen
-------------------------------------------------------------------------------------
- Akribische, selbstständige Arbeitsweise sowie grundsätzliche Vertrautheit mit der Typographie
und den wesentlichen Strukturelementen historischer Drucke
- Grund- und erweiterte Kenntnisse in XML, XSLT sowie und zu den Richtlinien der Text Encoding Initiative (TEI) sind wünschenswert
- Umgang und Erfahrung der digitalen Bildbearbeitung sind wünschenswert
- Datenbankerfahrung
- Erfahrungen und Kenntnisse einer gängigen Skriptsprache: Perl, Python
- Ebenfalls wünschenswert sind Erfahrungen im Bereich von neuronalen Netzen
- Begeisterung für und Interesse an der Arbeit mit historischen Dokumenten in der Verbindung mit dem Computer

Bewerbungen von Frauen sind ausdrücklich erwünscht. Bewerbungen von Schwerbehinderten werden bei gleicher Qualifikation vorrangig berücksichtigt. Bitte senden Sie Ihre aussagekräftige Bewerbung mit Lebenslauf bis zum 17.07.2016 per E-Mail an das OCR-D, Weiterentwicklung von Verfahren für die Optical-Character-Recognition (OCR), Koordinierungsprojekt, ocrd@bbaw.de.

Redaktion
Veröffentlicht am
Klassifikation
Region(en)
Weitere Informationen
Land Veranstaltung
Arbeitssprache(n)
Deutsch
Sprache