KI-gestützte Texterkennung (OCR/HTR) bei "kleinen" Sprachen Zentral- und Osteuropas

KI-gestützte Texterkennung (OCR/HTR) bei "kleinen" Sprachen Zentral- und Osteuropas

Veranstalter
Collegium Carolinum, Forschungsinstitut für die Geschichte Tschechiens und der Slowakei in Kooperation mit der Universität Augsburg
Veranstaltungsort
Collegium Carolinum, Hochstr. 8
Gefördert durch
Deutsche Forschungsgemeinschaft (DFG); Universität Augsburg
PLZ
81669
Ort
München
Land
Deutschland
Findet statt
Hybrid
Vom - Bis
14.09.2023 -
Deadline
11.09.2023
Von
Martina Niedhammer, Collegium Carolinum, Forschungsinstitut für die Geschichte Tschechiens und der Slowakei (München)

Der Workshop beschäftigt sich mit der Bedeutung "kleiner" Sprachen für die historische Quellenarbeit zum östlichen Europa und erprobt bereits bestehende IT-Lösungsansätze für den Forschungsalltag.

KI-gestützte Texterkennung (OCR/HTR) bei "kleinen" Sprachen Zentral- und Osteuropas

Automatische Text- und zunehmend auch Handschriftenerkennung (OCR / HTR) spielen im historischen Arbeitsalltag eine nicht zu unterschätzende Rolle. Dabei wird jedoch häufig übersehen, dass entsprechende Modelle oftmals anhand „großer“ Sprachen, wie Englisch oder Deutsch, entwickelt wurden, weshalb ihr Nutzen für „kleine“ Sprachen begrenzt ist. Im Workshop nehmen wir mit dem östlichen Europa eine Region in den Blick, in der Historiker:innen traditionell mit einer Vielzahl „kleiner“ Quellensprachen konfrontiert werden und fragen einerseits nach den Spezifika der Forschungsarbeit mit eben diesen Sprachen. Andererseits erproben und diskutieren wir Lösungsansätze, die für die Forschungspraxis „kleiner“ Sprachen bereits entwickelt wurden.

Das besondere Augenmerk der eintägigen Veranstaltung liegt auf der Verzahnung von methodischer Reflexion und Praxis, weshalb neben Historiker:innen auch Kolleg:innen aus den Digital Humanities, der IT und dem Bibliothekswesen beteiligt sind. Auf diese Weise möchten wir unter anderem folgende Fragen adressieren: Welchen Mehrwert kann das ursprünglich in der Soziolinguistik entwickelte Konzept der „kleinen“ Sprache für die historische Forschung zu Zentral- und Osteuropa entfalten? Inwieweit knüpft es an die Selbstwahrnehmung von historischen Akteur:innen und / oder die praktische Frage nach der Sichtbarkeit und Zugänglichkeit von Quellen an? Anders gefragt: Gibt es auch große „kleine“ Sprachen? Inwiefern sind dabei auch das Nebeneinander mehrerer „kleiner“ Sprachen oder Interferenzen mit „großen“ Sprachen, die sich in Quellen häufig finden, von Bedeutung?

Interessierte Gäste sind nach vorheriger Anmeldung herzlich willkommen. Eine digitale Zuschaltung per Zoom ist auf Anfrage möglich. Teilnehmende sind eingeladen, für die Hands-on-Session gedruckte und handschriftliche Quellenbeispiele (in digitalisierter Form) aus ihrer eigenen historischen Forschungsarbeit zum östlichen Europa mitzubringen. Zur besseren Planung bitten wir um eine entsprechende Nachricht bis einschließlich 11. September 2023 an martina.niedhammer@collegium-carolinum.de

Programm

09.00–09.30 Uhr
Martina Niedhammer (München) / Jana Osterkamp (Augsburg): „Kleine“ Sprachen in den Geschichtswissenschaften. Probleme und Herausforderungen einer Quellen- und Analysekategorie

09.30–10.15 Uhr
Keynote
Michael Moser (Wien): Das „Ruthenische“ im habsburgischen Galizien (1772–1918): Aspekte der Sichtbarkeit und Nachhaltigkeit einer großen „kleinen“ Sprache

10.15–10.45 Uhr
Kaffeepause

Slavische Sprachen: Wege zur „digitalen Gleichberechtigung“
Moderation: Johannes Gleixner (München)

10.45–11.15 Uhr
Annette Höslinger-Finck (Wien): Die Neukatalogisierung der Ruthenica-Sammlung an der Österreichischen Nationalbibliothek: neue Zugänge mithilfe von KI?

11.15–12.15 Uhr
Kay-Michael Würzner / Robert Sachunsky (Dresden) / Wito Böhmak (Bautzen): Quelloffene Workflows zur automatischen Texterkennung für ressourcenarme Sprachen am Beispiel des Obersorbischen

Mittagessen

13.30–15.30 Uhr
Hands-on-Session
Moderation: Michael Kabelka (Augsburg)
Niklas Platzer (Florenz) / Florian Langhanki (Würzburg): Praktischer Teil mit eigenen Quellenbeispielen der Teilnehmenden

15.30–16.00 Uhr
Kaffeepause

Diasporasprachen im östlichen Europa und ihre Quellen
Moderation: Martina Niedhammer (München)

16.00–17.30 Uhr
Arpine Maniero (München) / Jürgen Heyde (Leipzig): Erfahrungen aus der Praxis: Armenisch und Armeno-Kipčak (online)

Daria Vakhrushova (München, Düsseldorf): Erfahrungen aus der Praxis: Jiddisch (online)

Alexej Tikhonov (Freiburg i. Br.): Von der Handschrift zum Algorithmus: HTR in der Slavistischen Linguistik und darüber hinaus. Das Beispiel nichtlateinischer Alphabete

Abschlussdiskussion und gemeinsames Abendessen

Kontakt

Dr. Martina Niedhammer
E-Mail: martina.niedhammer@collegium-carolinum.de

Redaktion
Veröffentlicht am