Datenbanken zu Personeninformationen etablieren sich zusehends als Forschungsinstrument in den Geschichtswissenschaften. Meist aus Personenindizes oder aus Regestenausgaben entwachsen, entfalten sich digitale Informationssammlungen von dem Status des funktionalen Nebenprodukts zu ergiebigem Forschungsmaterial. Beispielhaft demonstriert wurde dies in der Sektion „Datenbanken für die Mediävistik und die Renaissance in Forschung und Lehre“ auf dem Historikertag 2012 in Mainz, welche von MICHAEL MATHEUS (Rom), HEDWIG RÖCKELEIN (Göttingen) und RAINER C. SCHWINGES (Bern) geleitet wurde und am 27. September stattfand.1 Der folgende Bericht möchte vorrangig die Besonderheiten der Datenbanken beleuchten und die damit verbundenen Fragen diskutieren. Die Fallbeispiele aus der Forschung sollen ebenfalls besprochen, jedoch nicht inhaltlich beurteilt werden.
Drei Personendatenbanken wurden mitsamt Beispielen für ihre geschichtswissenschaftliche Anwendung vorgestellt: Das digitale Personenregister der Germania Sacra (GS)2, das Repertorium Academicum Germanicum (RAG) 3 und das Repertorium Germanicum Online (RGO)4, letzteres als Teil des Portals Romana Repertoria Online (RRO)5. Gemeinsam sind diesen Datenbanken die unentgeltliche Nutzbarkeit, der barrierefreie Zugang und die offene Lizenzierung im Sinne von Open Access6. Mit der Verfügbarkeit von Metadaten und Zitationsmöglichkeiten ist das Standardisierungsniveau der Datenbanken vergleichsweise hoch. Michael Matheus beschrieb Datenbanken als „Publikationen im offenen Prozess“, welche sich der Interaktion mit Nutzern und der engen Zusammenarbeit mit Akademien, Bibliotheken und Informatikern aufgeschlossen zeigen sollten, um das allgemeine Ziel der zuverlässigen Überlieferung realisieren zu können. Perspektivisch seien die Datenbanken zudem nicht nur für Personen- und Ortsgeschichte von Interesse, sondern ebenso für Forschungsvorhaben in z.B. sozialgeschichtlichen, medizinhistorischen oder musikwissenschaftlichen Feldern.
Im Einzelnen stellten zunächst Michael Matheus und JÖRG HÖRNSCHEMEYER (Rom) das Portal Romana Repertoria Online vor, welches am Deutschen Historischen Institut in Rom angesiedelt ist und die Datenbestände des Instituts systematisch gebündelt präsentiert. Es umfasst elf Projekte, darunter sowohl digitale Editionen als auch Datenbanken, unter denen das Repertorium Germanicum Online (RGO) für diese Sektion von besonderem Interesse war. Es enthält das Quellenmaterial des Repertorium Germanicum (RG) und des Repertorium Poenitentiariae Germanicum (RPG) und umfasst somit insgesamt circa 160.000 deutsche Personen, Kirchen und Orte der Jahre 1378–1492 aus allen vatikanischen Registerserien und Kameralbeständen (=RG) sowie aus allen an Pönitentiarie gerichteten Suppliken (=RPG). Die Besonderheit des RGO liegt nicht nur in der gleichzeitigen Durchsuchbarkeit von RG und RPG, sondern auch in dem Angebot unterschiedlicher Recherchezugänge, welche sowohl ein gezieltes Suchen als auch ein „Stöbern“ in den Beständen ermöglichen. Die intelligent programmierte Datenbank fängt zudem Varianten von Personen- und Ortsnamen sowie unterschiedliche Schreibweisen ab 7 und hilft bei der Auflösung von Abkürzungen. Die Personendatensätze sind außerdem mit einer GND 8 versehen, was mittlerweile zum Standard gehört.
Anschließend präsentierten Hedwig Röckelein und BÄRBEL KRÖGER (Göttingen) das Digitale Personenregister der Germania Sacra. Das sogenannte Handbuch der Kirche des alten Reiches besteht seit 1917 und verzeichnet Bistümer, Klöster und Stifte sowie die dazugehörigen Personendaten in bislang 63 Bänden. Die Datenbank der GS, die Mitte Oktober veröffentlicht wurde, bietet einen bandübergreifenden Zugang, über den derzeit circa 9.000 Personendatensätze recherchierbar sind (wahlweise auch bandspezifisch). Redaktionell befindet sich die Digitalisierung der Inhalte auf einem hohen Niveau. Für circa 5 Prozent der Personen ist zudem eine GND verfügbar, die mithilfe von BEACON-Dateien 9 mit anderen Datenbeständen verlinkt sind. Bei der Identifizierung von möglicherweise identischen Personen in verschiedenen Bänden der GS offenbart sich eine relevante Eigenheit der digitalen Grundlagenforschung: Bei Personen geringer Bekanntheit (d.h. welche nur selten oder singulär belegbar sind), würde ein automatischer Abgleich keine soliden Ergebnisse hervorbringen. An dieser Stelle kann von der digitalen Technik keine Lösung erwartet werden, sondern der fachkundige Nutzer muss die Sachlage in jedem Einzelfall selbst beurteilen.
Nachfolgend stellten Rainer C. Schwinges und SUSE ANDRESEN (Bern) das Repertorium Academicum Germanicum vor. Dieses Projekt hat die graduierten Gelehrten des Alten Reiches zwischen 1250 und 1550 zum Gegenstand. Im Gegensatz zu den beiden anderen Datenbanken besitzt es keine Grundlage in Form einer Printpublikation, sondern es wurde von Beginn an als digitales Projekt konzipiert. Mittlerweile umfasst die Datenbank circa 50.000 Gelehrte und 300.000 Universitätsbesucher (erschlossen nach Regionen), die in Form von Biogrammen erfasst sind. Die Angaben beinhalten Lebens- und Studiendaten sowie Angaben zu Familienverhältnissen, Herkunft, Tätigkeiten, wichtigen Werken und Monumenten; soweit vorhanden, wird auch die GND erfasst. Fortschrittlich in diesem Projekt ist vor allem die Nutzung von geospatialen Informationen zur Darstellung auf Landkarten. Damit können komplexe Abfragen wie z.B. Herkunftsorte der Studenten verschiedener Universitäten anschaulich visualisiert werden. Dies bietet eine hervorragende Unterstützung für die Erforschung von Mobilität und von verschiedenen Standorten. Zudem erfolgt der Abgleich von möglicherweise identischen Personeneinträgen über ein abgestuftes Variantensystem.
Wie diese Datenbanken als Forschungsgrundlage genutzt werden können, zeigten die jeweils nachfolgenden Fallbeispiele in beeindruckender Weise. Die von Michael Matheus vorgestellten Personenrecherchen zum Studienort Rom am Beispiel der Promotion des Ludolf von Enschringen belegten, wie sich durch die Zusammenschau von Informationen aus RAG und GS ein schärferes Bild eines Werdeganges ergeben kann – und dies vor allem wegen der höheren Transparenz biographischer Brüche. Ferner wurde deutlich, dass die kombinierte Datenbank-Recherche einen soliden Ansatzpunkt für die weitere Erforschung des Studienortes Rom bieten kann (welche bislang eher generalisiert oder ausgeklammert wurde). ANDREAS REHBERG (Rom) untersuchte Schnittstellen von Mobilität und Bildungswegen von Religiösen am Beispiel verschiedener Lebenswege. So ermöglichte es die Kombination von Datenbeständen aus RGO und RAG, reguläre Zusammenhänge zwischen Studienabschlüssen und kirchlichen Ämtern aufzuzeigen. An diese Fragestellung anschließend, beschäftigte sich der Beitrag von WOLFRAM KÄNDLER (Gießen) eingehend mit Studien und Karrieren von gelehrten Stiftsherren im Nordwesten des Reiches und nutzte dazu eine Schnittmenge von Informationen aus allen drei Datenbanken. Eine Gegenüberstellung von Stifts- und Studienorten offenbarte nicht nur eine zunehmende Akademisierung des Stiftswesens, sondern z.B. auch die vergleichsweise große Reichweite des Standortes Köln und die vorrangige Bedeutung von Wasserwegen bei der Mobilität. Die Untersuchung von FRANK WAGNER (Gießen) bestätigte dies anschaulich anhand einer Reihe von Fallbeispielen, in denen Herkunft und Tätigkeiten von Kanonikern in Xanten, Köln, Dietkirchen und Bonn verglichen wurden.
Die nachfolgende Sitzung war dem allgemeinen Thema „Chancen und Visionen von Datenbanken im Verbund“ gewidmet. Suse Andresen, CHRISTIAN POPP (Göttingen) und Jörg Hörnschemeyer stellten darin ihre Zukunftspläne für die drei Personendatenbanken (GS, RAG, RGO) und für mögliche Kooperationen vor. Das RAG werde zukünftig mit einer Open-Source-Datenbank arbeiten und die Identifizierungsfrage (Zuordnung von Namen zu Personen) eingehender behandeln. Hier solle mit einem System operiert werden, welches zwischen sicheren und fraglichen Annahmen unterscheiden könne. Die GS werde sich dieser Frage ebenfalls widmen und der Heterogenität der Daten möglicherweise zunächst mit einer Varianten- oder Unschärfesuche begegnen; Normdaten böten hier evtl. weitere Abgleichsmöglichkeiten. In dieser Hinsicht verfolge das RRO die Strategie, ein vorschlagsorientiertes System anzubieten, welches das endgültige Urteil dem Benutzer überlasse; selbst die Generierung der Vorschläge könne so gestaltet werden, dass der Benutzer sie nach eigenen Maßgaben beeinflussen könne. Eine gemeinsame Aufgabenstellung sei außerdem der Abgleich von deutschen und lateinischen Namensformen, bei welcher auch der sonst sehr effiziente Levenshtein-Algorithmus an seine Grenzen gerate; hier seien bestehende Konkordanzdaten z.B. aus dem RAG nutzbar, aber evtl. auch phonetisch oder orthographisch orientierte Variantensuchen, durch welche sich möglicherweise auch feinere regionale Unterschiede abdecken ließen. Jörg Hörnschemeyer präsentierte außerdem ein (noch in Arbeit befindliches) Suchinterface, mit welchem sich eine parallele Recherche in allen drei Datenbanken starten lasse.
In der dritten, abschließenden Sitzung zu geschichtswissenschaftlichen Datenbanken in der universitären Lehre, in dessen Zentrum das digitale Personenregister der Germania Sacra stand, präsentierten Bärbel Kröger und Christian Popp die Erfahrungen aus einer universitären Lehrveranstaltung. Erklärtes Ziel der Veranstaltung war die nachhaltige Kompetenz im Umgang mit digitalen Ressourcen. Deren Relevanz werde im Allgemeinen zwar längst nicht mehr bezweifelt, aber dennoch stelle sich die Frage nach dem angemessenen, wissenschaftlichen Umgang mit der inzwischen enormen Menge des Angebots. Da der Forschernachwuchs aus Unerfahrenheit mit dem Material häufig auch unseriöse Angebote nutze, habe sich das Experiment eines zweisemestrigen Projektmoduls angeboten. In diesem sollten zunächst die Kenntnis des Materials und die Fähigkeit zur Qualitätsbeurteilung und anschließend der effiziente Umgang mit digitalen Angeboten – bis hin zur Entwicklung eines eigenen Datenmodells – entwickelt werden. Dieses Lehrangebot darf im Rahmen geschichtswissenschaftlicher Studiengänge als Pionierarbeit angesehen werden.
In den jeweils anschließenden Diskussionsrunden traten einige Punkte zutage, die unterschiedliche Wahrnehmungen zwischen Geschichtswissenschaft und geisteswissenschaftlicher Informatik aufzeigten. Beispielsweise sei dem Bedürfnis nach Normierung und eindeutiger Namenszuweisung – insbesondere bei der fragmentarischen Datensituation in mediävistischen Quellen – informationstechnisch kaum beizukommen, ohne dass ein verzerrter Eindruck entstehe. Die jeweils gültige Namensansetzung einer Person richte sich jedoch meist nach der Perspektive des Forschers und sollte nicht von einer Datenbank vorgegeben werden. Diese könne lediglich für eine größere Transparenz der Varianten sorgen, aber kann (und will meistens auch) dem Forscher das wissenschaftliche Urteil nicht abnehmen. Insofern sollte m. E. verstärkt darauf hingearbeitet werden, die Qualität von Datenbanken in der Speicherung der Informationen, in der Geschwindigkeit von deren Bereitstellung und in der Vielfalt von deren Wiedergabe zu sehen, und nicht nur in ihrer rudimentären Funktion eines Nachschlagewerkes. Dies ist zu übertragen auf die möglichen Fragestellungen und Interpretationen der Informationen, welche von einer Datenbank jedoch in der Regel nur sehr allgemein wiedergegeben werden können, in ihrer Vielgestalt jedoch – so auch der Konsens der Diskussion – nur von Nutzern generiert werden können (sofern diese sich nicht mit schierem Faktenwissen zufriedengeben möchten).
Zudem wurde die Frage nach der „Fertigstellung“ von Datensammlungen aufgeworfen, welche m. E. nicht nur vor dem Hintergrund, dass viele herkömmliche Editionsprojekte jahrzehntelang und einige seit mehr als einem Jahrhundert arbeiten, illusorisch scheint. Schon die Verfügbarmachung des Materials und die damit verbundenen Konvertierungsmaßnahmen – bei denen eine intensive Auseinandersetzung mit dem Material absolut notwendig ist – nimmt m. E. in den meisten Fällen deutlich mehr Zeit in Anspruch, als es der rasante Entwicklungsrhythmus des Internets vorspiegelt. Insbesondere die Einbettung von Datenbankprojekten in neue Technologien – beispielsweise die Verwendung von GND oder die Implementierung einer RDF-Schnittstelle – erzeugen einen regelmäßigen Aufwand, welcher mit den leider üblichen Möglichkeiten (Eigenleistung, Hilfskräfte oder Werkverträge) kaum befriedigend abgedeckt werden kann. Auch die Etablierung übergeordneter oder unabhängiger digitaler Infrastrukturen (siehe z.B. DARIAH 10) ist m. E. noch nicht so weit vorangeschritten, dass sich ein Projekt ohne weiteres in eine bestehende Struktur einklinken könnte, und selbst dies wäre weiterhin mit personellem Aufwand verbunden. Insofern bleibt angesichts der sichtbaren Erfolge nur zu hoffen, dass der Anteil an geisteswissenschaftlicher Informationstechnik in historischen Forschungsprojekten zukünftig ansteigen wird.
Insgesamt vermittelte die Sektion einen lebendigen Einblick in das aktuelle Geschehen im Bereich der Personendatenbanken für die Mediävistik- und Renaissanceforschung. Die Zusammenarbeit der drei vorgestellten Projekte ist vorbildlich und es ist zu hoffen, dass ähnliche Kooperationen an anderer Stelle entstehen. Vor allem der offene Ideenaustausch unter den drei Projekten einerseits und die Entwicklung individueller Lösungsansätze andererseits (z.B. für das Identifizierungsproblem) ist begrüßenswert, denn trotz der jeweiligen Unabhängigkeit und Eigenständigkeit ist es gelungen, verbindende Strukturen zu schaffen, von denen nicht nur das einzelne Projekt, sondern auch die Forschung profitieren kann. Die vorgestellten Studien belegen, dass Datenbanken durchaus eine Grundlage für seriöse und überzeugende Forschungsarbeit bilden können, und dies vor allem dann, wenn inhaltlich unterschiedlich ausgerichtete Datenbanken im Verbund genutzt werden (vgl. z.B. auch die Ergebnisse der Tagung „Professorenkataloge“ in Kiel) 11. Spätestens damit wird auch die Relevanz von Datenbank-Kompetenzen in der Lehre plausibel. Die positiven Reaktionen aus dem Auditorium offenbarten außerdem ein hohes Interesse an elektronischen Ressourcen in den Geschichtswissenschaften und man darf hoffen, dass die Sektion einen Impuls für weitere Aktivitäten in diesem Gebiet geben konnte.
Sektionsübersicht:
Sektionsleitung: Michael Matheus (Universität Mainz) / Hedwig Röckelein (Akademie der Wissenschaften zu Göttingen) / Rainer Christoph Schwinges (Universität Bern)
Michael Matheus (Universität Mainz): Einleitung [zu „Vorstellung der Datenbanken“]
Michael Matheus (Universität Mainz) / Jörg Hörnschemeyer (DHI Rom): Romana Repertoria / Roman Repertories
Hedwig Röckelein / Bärbel Kröger (Akademie der Wissenschaften zu Göttingen): Germania Sacra
Rainer C. Schwinges, Suse Andresen (Universität Bern): Repertorium Academicum Germanicum
Hedwig Röckelein (Akademie der Wissenschaften zu Göttingen): Einleitung [zu „Karrieren von Klerikern und Gelehrten: Schnittstellen in den Datenbanken“]
Michael Matheus (Universität Mainz): Personenrecherchen zum Studienort Rom. Die Promotion des Ludolf von Enschringen
Andreas Rehberg (DHI Rom): Schnittstellen zu Mobilität und Bildungswesen von Religiosen
Wolfram Kändler / Frank Wagner (Universität Gießen): Gelehrte Stiftsherren im Nordwesten des Reiches. Überlegungen zu Studium und Karriere
Suse Andresen (Universität Bern), Christian Popp (Akademie der Wissenschaften zu Göttingen), Jörg Hörnschemeyer (DHI Rom): Datenbanken im Verbund. Chancen und Visionen
Bärbel Kröger / Christian Popp (Akademie der Wissenschaften zu Göttingen): Datenbank statt Essay oder Hausarbeit. Bericht über eine Lehrveranstaltung an der Universität Göttingen
Anmerkungen:
1http://www.historikertag.de/Mainz2012/de/programm/wissenschaftliches-programm/sektionen/einzelansicht/article/datenbanken-fuer-die-mediaevistik-und-die-renaissance-in-forschung-und-lehre.html (28.11.2012)
2http://personendatenbank.germania-sacra.de/ (30.10.2012)
3http://www.rag-online.org/ (30.10.2012)
4http://194.242.233.132/denqRG/index.htm (28.11.2012)
5http://www.romana-repertoria.net/ (30.10.2012)
6http://open-access.net/ (30.10.2012), siehe dazu auch: http://www.dfg.de/dfg_magazin/forschungspolitik_standpunkte_perspektiven/open_access/index.html (30.10.2012)
7 Mithilfe des Levenshtein-Algorithmus, siehe z.B. http://de.wikipedia.org/wiki/Levenshtein-Distanz (30.10.2012)
8http://www.dnb.de/DE/Standardisierung/Normdaten/GND/gnd_node.html (30.10.2012)
9http://de.wikipedia.org/wiki/Wikipedia:BEACON (30.10.2012)
10http://de.dariah.eu/ (12.11.2012)
11 Tagungsbericht Die Universität Kiel und ihre Professorinnen und Professoren oder: Wozu den Kieler Professorenkatalog? 20.04.2012-21.04.2012, Kiel, in: H-Soz-u-Kult, 25.05.2012, <http://hsozkult.geschichte.hu-berlin.de/tagungsberichte/id=4240>.