Epigraphische Datenbank Heidelberg

Cover
Titel
Epigraphische Datenbank Heidelberg (EDH).
Herausgeber
Forschungsstelle Epigraphische Datenbank Heidelberg, DE <epigraphische.datenbank@urz.uni-heidelberg.de>
Veröffentlicht durch
Heidelberger Akademie der Wissenschaften: Heidelberg, DE <http://www.haw.baden-wuerttemberg.de/>
Von
Andreas Hartmann, Philologisch-Historische Fakultät, Universität Augsburg

Elektronische Datenbanken sind aus der Arbeit des Epigraphikers heute kaum noch fortzudenken. In Deutschland existieren mit der Epigraphischen Datenbank Heidelberg (EDH) und der Epigraphischen Datenbank Clauss-Slaby (EDCS) 1 gleich zwei bedeutende Datenbankprojekte auf dem Gebiet der lateinischen Epigraphik.

Die EDH wurde 1986 von Géza Alföldy, dem damaligen Heidelberger Ordinarius für Alte Geschichte, mit den Mitteln des ihm verliehenen Gottfried-Wilhelm-Leibniz-Preises gegründet 2. Ziel war die Erfassung und inhaltliche Erschließung aller lateinischen Inschriften. Flankiert wurde die Unternehmung vom Aufbau einer Bibliographie sowie einer Fotothek. Im Jahr 1993 wurde die EDH als Forschungsstelle der Heidelberger Akademie der Wissenschaften institutionalisiert und 1995 in das Akademien-Programm der Bund-Länder-Kommission aufgenommen. Als Online-Datenbank ist die EDH seit 1997 im Internet verfügbar, wobei die Suchmöglichkeiten nach und nach ausgebaut und die Fotothek digitalisiert wurden. Zuletzt kamen im Rahmen eines Relaunches der Weboberfläche eine geographische Datenbank sowie darauf basierende Visualisierungen und eine Umkreissuche hinzu.

Eine Würdigung der EDH kommt kaum umhin, einen Vergleich mit der EDCS anzustellen. Die grundsätzlichen Unterschiede liegen auf der Hand: Den umfassendsten Datenbestand bietet derzeit die EDCS, zumal diese auch Inschriften auf Instrumentum domesticum möglichst vollständig erfasst. Dies führt beispielsweise dazu, dass die EDH für die als vollständig bearbeitet geltende Provinz Raetia nur 999 Texte ausweist, während die EDCS 3085 bietet (Stand 14.09.2018). Die schnelle Generierung von Textmasse erfolgte in der EDCS freilich um den Preis einer Reduktion auf eine reine Volltextdatenbank, also den Verzicht auf alle erschließenden Metadaten jenseits der Fundortangaben. Erst in jüngster Zeit werden Informationen zu Datierungen und zur jeweiligen Inschriftengattung ergänzt. Die EDCS führt zwar verschiedene Textausgaben als Konkordanz auf, für den Nutzer ist aber nicht ersichtlich, welcher Edition der Text der Datenbank eigentlich folgt. Einen Anspruch auf eine eigenständige kritische Prüfung des Materials erhebt die EDCS ebenfalls nicht. Sie ist als reines Findmittel konzipiert, das dem Epigraphiker helfen soll, relevante Texte und ihre gedruckten Editionen zu finden. Dabei legt die EDCS die Beschränkung auf lateinische Inschriften noch strenger aus als die EDH, denn griechische Texte werden nicht einmal dort erfasst, wo sie Teil von mehrsprachigen Inschriften sind.

Im Gegensatz dazu zielte die EDH auf eine Neubewertung der publizierten Texte wenigstens auf der Grundlage von Fotografien sowie die dichte Beschreibung der verzeichneten Monumente (nicht allein der Texte!) mit möglichst normierten Metadaten 3. Angesichts des dadurch gegebenen Arbeitsaufwandes strebte die EDH sehr früh Kooperationen und die Einbettung in ein internationales Netzwerk an: Seit 2003 bestehen die technischen Voraussetzungen für die Einbeziehung externer Mitarbeiter. Im selben Jahr wurde unter Beteiligung der EDH die internationale Datenbankföderation EAGLE gegründet 4. Daraus ergab sich eine Arbeitsteilung bei der Inschriftenerfassung insbesondere mit der Epigraphic Database Rome 5, der Epigraphic Database Bari 6 und der HispaniaEpigraphica online7. Darüber hinaus ist die EDH auch Teil des Pelagios-Netzwerkes zur Vernetzung historischer Ortsdaten 8. Diese Verpflichtung gegenüber dem Kooperationsgedanken kommt auch darin zum Ausdruck, dass die Daten der EDH unter einer CC BY-SA 4.0-Lizenz zur freien Nachnutzung zur Verfügung stehen 9. Dies mag für die traditionelle Nutzung als Findmittel unbedeutend sein, für Projekte, die auf Textmining oder die Erzeugung semantisch annotierter Textsammlungen abzielen, ist es ein Quantensprung. Texte der EDH können somit prinzipiell in nutzerfreundlichen Annotationswerkzeugen wie Recogito weiterverwendet werden 10. Es wäre daher dringend zu wünschen, dass auch die anderen wichtigen epigraphischen Datenbanken dem Beispiel der EDH folgen.

Dies ist umso wichtiger, da bei einer Betrachtung der großen epigraphischen Textdatenbanken auffällt, dass die Volltextsuche vergleichsweise rudimentär ausgestaltet ist. Es fehlen eine umfassende Unterstützung für reguläre Ausdrücke (wie sie etwa in papyri.info realisiert ist), die Nutzung von Lemmatisierung und Wortstammreduktion (wie sie in Volltextdatenbanken wie dem TLG oder Perseus genutzt werden) sowie die Integration einer Fuzzy Search-Funktionalität. Eine Darstellung von Suchergebnissen im KWIC-Schema bieten derzeit nur die Searchable Greek Inscriptions des PHI, freilich ohne die Option einer rückläufigen Sortierung 11. Vielversprechend wäre wohl auch die Anwendung von Werkzeugen zur maschinellen Mustererkennung auf epigraphische Texte (erprobt vornehmlich anhand literarischer Texte im Rahmen des Leipziger eAQUA-Projektes) 12. Nun kann man mit einigem Recht einwenden, dass solche differenzierten Abfragemöglichkeiten wohl nur von einem kleinen Teil der Nutzer wirklich angewendet werden und die knappen Ressourcen insofern besser in den möglichst umfassenden Ausbau der Textbasis investiert werden sollten. Umso wichtiger ist es jedoch, die Datenpools in einem standardisierten Format freizugeben, um sie mit externen Werkzeugen analysieren zu können.

Es liegt auf der Hand, dass das Konzept der EDH methodisch anspruchsvoller ist als das der EDCS, zumal die Nutzung elektronischer Ressourcen als bloßes Findmittel immer weniger den heutigen Arbeitsgewohnheiten entspricht. Dies gilt für klassische Einzelforschung, noch mehr aber für maschinelle Analysen, in denen keine intellektuelle Prüfung der ausgewerteten Texte mehr erfolgt. Gleichzeitig ergibt sich aus der an sich sinnvollen Arbeitsteilung mit anderen Datenbanken das Problem, wie diese Daten wieder unter einer funktionalen Metasuchoberfläche zusammengeführt werden können. Die derzeitige EAGLE-Oberfläche ist hier ein erster Schritt, bedarf aber weiterer Verbesserung. Im Rahmen von EAGLE findet der Nutzer im Übrigen auch die Texte der EDCS und vieler anderer epigraphischer Datenbanken. Die Matching der aus verschiedenen Quellen stammenden Texte auf der Basis von Trismegistos-IDs ist dabei das zentrale Problem, das in wesentlichen Teilen, aber noch keineswegs vollständig gelöst ist 13. Eine wichtige Leistung von EAGLE ist ferner die Zurverfügungstellung des normierten Erschließungsvokabulars seiner Teildatenbanken als Linked Open Data 14.

Die Förderung der EDH als Arbeitsstelle der Heidelberger Akademie wird 2020 auslaufen, was einmal mehr die Frage nach der Nachhaltigkeit digitaler Forschungsinfrastrukturen in den Fokus rückt. Die Probleme sind im Falle der EDH im Grunde dieselben wie an vielen Orten: Die dauerhafte Absicherung der Erzeugung von qualitätsgesicherten Daten – seien es Bibliographien oder Quellencorpora – für die Forschung passt nur schwer in Förderstrukturen, die im Regelfall auf kurzfristige Laufzeiten abstellen und „Innovation“ zum zentralen Bewertungskriterium erheben. Ferner treten viele Digitalprojekte der ersten Stunde derzeit in eine kritische Periode des Übergangs ein, wenn ihre Begründer aus dem Dienst ausscheiden. Nun könnte man natürlich den derzeitigen Zustand einfrieren. Einmal abgesehen davon, dass auch dann die Serverinfrastruktur und die Weboberfläche der dauernden Pflege bedürfen, wäre damit jedoch das zentrale Versprechen digitaler Hilfsmittel gebrochen: Das Angebot wäre kein dynamisches mehr, das sich beständig dem aktuellen Wissensstand anpasst, sondern ein statisches, das genauso veraltet wie seine gedruckten Pendants.

Die Zukunft der EDH im weiteren Kontext der digital epigraphy ist derzeit Gegenstand eines Diskussionsprozesses, der auch auf einer internationalen Ebene geführt wird 15. Das Ziel einer epigraphischen Editionsplattform in Analogie zu papyri.info wird man als Nutzer nur begrüßen können. Unabhängig von der Realisierung solcher Pläne sind aber die in Heidelberg erzeugten Daten ein bleibendes Vermächtnis, das dank der freien Lizenzierung mit Sicherheit einen wesentlichen Grundstein zukünftiger digitaler Arbeitsmittel im Bereich der antiken Epigraphik darstellen wird.

1 Vgl. https://edh-www.adw.uni-heidelberg.de; http://www.manfredclauss.de bzw. http://db.edcs.eu (diese und alle folgenden Links kontrolliert am 20.09.2018).

2 Eine ausführliche Dokumentation der Projektgeschichte findet sich unter https://edh-www.adw.uni-heidelberg.de/projekt/geschichte.

3 Zum Konzept der EDH vgl. https://edh-www.adw.uni-heidelberg.de/projekt/konzept. Einen Eindruck vom differenzierten Metadatenkonzept gewinnt man am besten anhand der erweiterten Suchmaske: https://edh-www.adw.uni-heidelberg.de/inschrift/erweiterteSuche. Vergleichbares bietet die EDCS nicht.

4 „Electronic Archive of Greek and Latin Epigraphy“: http://www.eagle-eagle.it, bereits mit Metasuche http://www.eagle-eagle.it/Italiano/portale_it.htm. Im Rahmen einer dreijährigen Projektförderung durch die EU (2014-2016) entstand auf diesen Vorarbeiten aufbauend das „Europeana network of Ancient Greek and Latin Epigraphy“: https://www.eagle-network.eu. Dieses aggregiert Daten aus einer wesentlich größeren Zahl von Einzeldatenbanken: https://www.eagle-network.eu/resources/search-inscriptions, unter anderem auch der EDCS.

5 Vgl. http://www.edr-edr.it, zuständig für Inschriften aus Italien.

6 Vgl. http://www.edb.uniba.it, zuständig für christliche Inschriften.

7 Vgl. http://eda-bea.es, zuständig für Inschriften aus Spanien. Alle weiteren Provinzen bearbeitet die EDH.

8 Vgl. http://commons.pelagios.org. Die Metadaten der EDH fließen entsprechend in die Suche unter http://peripleo.pelagios.org ein.

9 Vgl. https://edh-www.adw.uni-heidelberg.de/data/export.

10 Vgl. https://recogito.pelagios.org. Derzeit ermöglicht Recogito das Tagging von Personen- und Ortsbezeichnungen mit einer graphischen Nutzeroberfläche, d.h. ohne direkte Manipulation des Markup-Codes. Eine Unterstützung des Leidener Klammersystems bzw. des EpiDoc-Standards ist nicht implementiert. Trotz dieser derzeit noch vorhandenen Einschränkungen ist abzusehen, dass die semantische Annotation von Volltexten in absehbarer Zeit auch für weniger technikaffine Historiker zu einem handhabbaren Werkzeug werden wird.

11 Vgl. https://epigraphy.packhum.org.

12 Im Bereich der Papyrologie wird bereits die Möglichkeit erkundet, solche Verfahren für die Generierung von Ergänzungsvorschlägen für fragmentarische Texte zu nutzen (Rücker, Michaela: Die Möglichkeiten der automatischen Textergänzung auf Papyri, in: Neue Methoden der geisteswissenschaftlichen Forschung. Eine Einführung in das Portal eAQUA I, hrsg. von Ch. Schubert u. G. Heyer (Working Papers Contested Order No.1), Leipzig 2010, S. 91-100, http://nbn-resolving.de/urn:nbn:de:bsz:16-ea-115562).

13 Die Abfrage von Trismegistos-IDs ist seit Juni 2018 über eine API möglich: https://www.trismegistos.org/dataservices/texrelations/documentation.

14 Vgl. https://www.eagle-network.eu/resources/vocabularies.

15 Vgl. dazu Feraudi-Gruénais, Francisca; Grieshaber, Frank: Digital Epigraphy am Scheideweg? / Digital Epigraphy at a crossroads?, http://archiv.ub.uni-heidelberg.de/volltextserver/22141; Feraudi-Gruénais, Francisca; Grieshaber, Frank; Cowey, James; Lougovaya-Ast, Julia: Report on the first epigraphy.info workshop in Heidelberg, March 21st-23rd, 2018, http://archiv.ub.uni-heidelberg.de/volltextserver/24397; Feraudi-Gruénais, Francisca; Grieshaber, Frank: Empfehlungen für eine offene kollaborative Plattform für die antike Epigraphik - epigraphy.info / Recommendation for an open collaborative platform for ancient epigraphy - epigraphy.info, http://archiv.ub.uni-heidelberg.de/volltextserver/24674.

Redaktion
Veröffentlicht am
Redaktionell betreut durch