.hist2006: Querschnittsbericht "Historische Quellenbestände: Digitalisierung und Suchstrategien"

Von
Stefan Gorißen, Fakultät für Geschichtswissenschaft, Philosophie und Theologie, Universität Bielefeld

[Liebe Leserinnen und Leser,

vom 22.-24. Februar 2006 veranstaltete der Kooperationsverbund Clio-online in Berlin die Tagung ".hist2006: Geschichte im Netz - Praxis Chancen und Visionen". In den nächsten Tagen veröffentlichen wir eine Reihe von thematischen Querschnittsberichten zu verschiedenen Schwerpunkten der Tagung. Wir beginnen mit einem Bericht von Stefan Gorißen über zwei Sektionen, die sich u.a. mit Digitalisierung von Quellen und deren Erschließung beschäftigten.

Viel Spaß bei der Lektüre wünscht
Karsten Borgmann]

Besprochene Sektionen:
"Digitalisierung und langfristige Verfügbarkeit historischer Quellen – Strategien und kooperative Lösungsansätze"
"Viele Wege führen nach Rom – Suchstrategien nach historischen Quellenbeständen im Internet"

„.hist2006“, nach einer ersten Tagung im Jahr 2003 [1] der zweite große Kongress, der sich mit „Geschichte im Netz“, Fragen zu Möglichkeiten und Grenzen der Nutzung von Kommunikationsnetzwerken durch die Geschichtswissenschaft beschäftigte, brachte eine große, für den einzelnen Besucher kaum mehr zu überschauende Zahl von Anbietern und Benutzern von online-Diensten für Historiker und Historikerinnen zusammen. In 12 Sektionen und Workshops bot die Konferenz am 23. und 24. Februar insgesamt 80 Vorträge und Präsentationen zu aktuellen Projekten und zwang den Besucher damit schon beim Blick auf das Programm, sich auf einige wenige Angebote zu konzentrieren und eine Vielzahl nicht weniger interessanter Angebote an sich vorbei ziehen zu lassen. Auch der vorliegende Bericht kann nur Eindrücke über einen kleinen Ausschnitt bieten. Bleibt zu hoffen, dass der Tagungsbände mit allen Beiträgen bald verfügbar sein werden.

Der unbestreitbar größte Nutzen des Internets – gemeint sind hier Angebote im „world wide web“ – besteht für Historiker und Historikerinnen darin, dass es den Zugang zu konventionellen Materialien, insbesondere zu Quellen und Literatur, erheblich vereinfacht und erweitert hat und dies nicht nur durch die Bereitstellung von Bibliothekskatalogen und Findmitteln der Archive auf online zugänglichen Oberflächen, sondern zunehmend auch durch die Digitalisierung von Quellenbeständen (neudeutsch als „Digitalisate“ bezeichnet), die in wachsendem Umfang als Bilddateien direkt von Webservern abgerufen oder in einer multimedialen Umgebung bearbeitet werden können. Die „stoffliche Seite der Geschichte“, von der Alf Lüdtke beim Blick auf den Löschsand in alten Akten einst hoffte, sie könne zum „nützlichen 'Sand im Getriebe' ... (der) professionellen historischen Forschung“ werden[2], geht hierbei freilich verloren, ein Verlust, den die meisten angesichts eingesparter Zeit und Reisekosten aber gerne in Kauf nehmen werden.

Organisatorische und technische Probleme bei der Digitalisierung historischer Quellen standen im Mittelpunkt von zwei Sektionen, auf die der vorliegende Bericht sich konzentriert. Eine erste thematische Sektion widmete sich vor allem dem Problem der Verfügbarkeit und dauerhaften Sicherung bereits vorliegender oder in der Bearbeitung befindlicher Digitalisate sowie den in den letzten Jahren unternommenen Anstrengungen, Kooperation zwischen Einzelprojekten herzustellen und übergreifende Standards und Verfahren zu etablieren.

Eines der größten, international ausgerichteten Projekte in diesem Feld, das Monika Hagedorn-Saupe vom Berliner Institut für Museumskunde der Staatlichen Museen vorstellte, bezeichnet das Akronym MICHAEL (Multilingual Inventory of Cultural Heritage in Europe). MICHAEL hat sich zum Ziel gesetzt, die vielfältigen Initiativen zur Digitalisierung in mehreren europäischen Staaten zu vernetzen und kulturwissenschaftliche digitale Sammlungen von Museen, Bibliotheken und Archiven über ein zentrales Portal in einem übergreifenden Inventar zugänglich zu machen. Das von der EU geförderte, auf Open-Source-Technologie basierende Projekt wird derzeit von den Kulturministerien Italiens und Frankreichs sowie durch das britische Museums-, Bibliotheks- und Archivkonsortium betrieben, ein Erweiterungsantrag um Kultureinrichtungen neun weiterer europäischer Staaten wird zur Zeit bei der Europäischen Kommission beraten. Im kommenden Jahr soll das Portal online gehen, man darf gespannt sein, wie sich der konkrete Nutzen des Projekts in der Praxis darstellen wird.

Ein weithin ungelöstes, gleichwohl drängendes Problem des Umgangs mit digitalem Material in Archiven wird mit dem Begriff „Langzeitarchivierung“ umschrieben. Für das Problem einer dauerhaften Sicherung digital gespeicherter Überlieferung sind verlässliche, allgemein anerkannte Konzepte bis heute nicht in Sicht. Auf welch schwankendem Boden sich die Archiv- und Bibliothekswissenschaften auf diesem Feld noch bewegen, belegte Max Vögler mit seinem Bericht über die Förderpraxis der DFG in den letzten Jahren: Hier ist man offensichtlich der Ansicht, dass die parallele Förderung konkurrierender Projekte und Konzepte auf mittlere Sicht dazu führt, dass sich das beste Konzept durchsetzt. Die mit dem Schlagwort „Langzeitarchivierung“ verbundenen Probleme sind vielfältig, sie betreffen neben technischen (geeignete Datenträger, Datenformate, etc.) auch rechtliche Probleme etwa der Softwarelizensierung oder Fragen der Zuständigkeit und Kompetenz der zahlreichen beteiligten Institutionen.

Eines dieser Projekte zur „Langzeitarchivierung“ wird mit dem Akronym „KOPAL“ durch die Deutsche Bibliothek betrieben. Fluchtpunkt ist das nicht gerade bescheidene Ziel, das deutschsprachige Web zu archivieren. So wünschenswert ein solches Projekt auf den ersten Blick auch erscheinen mag, bleiben doch eine Vielzahl von technischen und konzeptionellen Hürden, für die noch keine befriedigende Lösung gefunden wurde. Thomas Wollschläger stellte in seinem Referat die Grundzüge des Systems vor, das auf einem offenen XML-basierten Datenformat basiert und in der in den vergangenen Wochen fertig gestellten Version sich vor allem auf die Archivierung von online-Dissertationen, von CD-ROMs, Digitalisaten und digitalen Musikdaten des Deutschen Musikarchivs in Berlin beschränkt. Vor allem die Sicherstellung einer ausreichenden Performance, die auch ein Web Harvesting ermöglicht, zählt zu den im gegenwärtigen Stadium des Projekts noch ungelösten Problemen.

Solange man sich auf die Archivierung digitalisierten schriftlicher Quellen konzentriert, bleiben die Probleme überschaubar und scheinen auch – zumindest auf mittlere zeitliche Sicht – gut lösbar zu sein. Die im Umfeld der „Text Encoding Initiative“ bereits seit den 1980er Jahren entwickelten Verfahren geben hierfür einen praktikablen Rahmen ab, wie Stefan Cramme am Beispiel kleinerer Projekte, wie sie von der Bibliothek für Bildungsgeschichtliche Forschung in Berlin betrieben werden (Digitale Ausgabe der Werke Adolf Reichweins, digitale Briefedition Friedrich Fröbels), anschaulich vorführte.

Die Vielzahl von Initiativen und Projekten zur Langzeitarchivierung zu bündeln und nach gemeinsamen, übergreifenden Lösungen zu suchen, diese Aufgabe verfolgt das am Bundesarchiv in Koblenz angesiedelte Projekt„NESTOR“ (Network of Expertise in long-term STorage Of digital Ressources), das Andrea Hänger und Karsten Huth vorstellten. NESTOR erarbeitet Richtlinien, veröffentlicht Empfehlungen und Kriterienkataloge und bietet Fortbildungsveranstaltungen an, um auf diese Weise Grundlagen für projektübergreifende Standards zu legen.

Unsere französischen Nachbarn scheinen diese mühsame Arbeit des Vernetzens und des technisch-konzeptionellen Austauschs nicht zu kennen. Das französische Projekt PERSEE (www.persee.fr) gibt allen Universitätsbibliotheken klare Vorgaben für Digitalisierungsprojekte. Entsprechend rasch wächst das Portal, das frei zugänglich ist und bereits nach drei Jahren Laufzeit einen bequemen transparenten Zugriff auf die Volltexte der Artikel in allen wichtigen kulturwissenschaftlichen Zeitschriften bietet. Copyright-Fragen, an denen die Realisierung entsprechender Projekte in Deutschland regelmäßig scheitert, lassen sich mit einem mächtigen Ministerium im Rücken offensichtlich leicht lösen: PERSEE konnte bislang noch jeden Autor, wie Frédéric Blin vom französischen Bildungsministerium einem staunenden deutschen Publikum versicherte, dazu überreden, auf seine diesbezüglichen Ansprüche zu verzichten.

Die wichtigste Aufgabe von Portalen zu digitalen und digitalisierten Quellen ist, den Nutzern einen einfachen und schnellen Zugriff auf die entsprechenden Bestände zu ermöglichen. Mit Such- und Recherchestrategien beschäftigte sich eine weitere thematische Sektion der „.hist2006“. Die Grenze zwischen Portalen, die Metakataloge und -verzeichnisse aufbauen, und Angeboten an spezialisierten Suchmaschinen sind dabei oftmals fließend. Die Erstellung von online-Beständeübersichten im Bundesarchiv bedient sich, wie Anke Löbnitz berichtete, des 2003 auf XML-Technologie portierten Findbucheditors MIDOSA (Mikrocomputergestütztes Informations- und DOkumentationsSystem für Archive). Zielperspektive des großen Projekts „Netzwerk SED-Archivgut“, an dem außer dem Bundesarchiv auch die Landesarchive der neuen Bundesländer beteiligt sind, ist die Weiterentwicklung der MIDOSA-Software zu einer integrierten Suchmaschine über Beständeübersichten und Findbücher hinweg nach dem EAD-Standard („Encoded Archival Description“, 1998 in den USA standardisiert).

Bis eine solche Suchmaschine durch die Forschung mit Gewinn zu nutzen ist, sind wohl noch einige Arbeitsjahre in die Erschließung und Retrodigitalisierung von Findmitteln zu investieren. Nicht zuletzt aus diesem Grund beteiligt sich das Bundesarchiv auch am Aufbau eines Findmittelkatalogs auf Clio-online, den Sebastian Barteleit zusammen mit Robert Zepf von der Staatsbibliothek Berlin, Stiftung Preußischer Kulturbesitz, vorstellte. Das Angebot will den großen Bestand an Findmitteln der Staatsbibliothek online in einer Datenbank nutzbar und nach sachlichen Kriterien abfragbar machen. Gleichzeitig soll eine Schnittstelle bereitgestellt werden, über die Archive neue Findmittel direkt in die Datenbank einpflegen können.

Das Projekt versteht sich dabei nicht als Konkurrenzprodukt, sondern als Ergänzung zum bereits seit mehreren Jahren existierenden BAM-Portal („Gemeinsames Portal für Bibliotheken, Archive und Museen“), das bereits auf der .hist2003 vorgestellt wurde.[3] Das BAM-Projekt greift hierbei auf bereits vorhandene digitale Bestandsverzeichnisse von Bibliotheken, Archiven und Museen zu und führt Metainformationen über die dort gespeicherten Daten in einer zentralen Datenbank zusammen, in der dann eine Internetrecherche ermöglicht wird. Frank von Hagel vom Institut für Museumskunde in Berlin stellte aktuelle Bemühungen des BAM-Projekts vor, Objektdatenbanken der Museen zusammenzuführen und zugleich ein Erschließungsformat zu entwickeln, das kleineren Museen, die über kein eigenes Angebot verfügen, den Aufbau einer Objektdatenbank ermöglicht.

Das Institut für Museumskunde der Staatlichen Museen zu Berlin bemüht sich darüber hinaus, durch jährliche Befragungen einen Überblick über die in den deutschen Museen vorhandenen Objektdatenbanken zu gewinnen. Über Probleme bei der Erstellung einer Systematik kulturhistorischer Sachgüter und die unterschiedlichen Lösungsangebote im internationalen Maßstab berichtete Axel Ermert.

Einen engeren thematischen Zugriff bezogen auf die Geschichte des Bergbaus verfolgt das Montanhistorische Dokumentationszentrum (montan.dok) beim Deutschen Bergbau-Museum. Primär- und Sekundärquellen schriftlicher, audio-visueller und sachlicher Natur werden hier in einer auf XML-Technologie basierenden Datenbank zusammengeführt.

Vergleicht man die Präsentationen auf der „.hist2006“ zur Erschließung digitaler Quellen mit denen der „.hist2003“ zeigt sich deutlich, dass die Diskussion sich weg von der (Retro-)Digitalisierung hin zur Vernetzung der inzwischen in großer Zahl realisierten Projekte und zum Aufbau übergeordneter Portale und Suchmaschinen verschoben hat. Hierfür gibt es kein Masterkonzept, sondern eine Vielzahl von Projekten auf unterschiedlichem Abstraktionsniveau. Viele der vorgestellten Projekte erfreuen sich einer oftmals leider nur sehr kurzfristigen Förderung durch die DFG, die damit auf Produktivitätsgewinn durch ein pluralisiertes Angebot zu hoffen scheint. Dieses durchaus sinnvolle Förderkonzept bedarf jedoch zwingend eines längeren Atems bei der Finanzierung, will man sicherstellen, dass die Projekte ihren Nutzen für die Geschichtswissenschaft und für die kulturelle Selbstvergewisserung der Gesellschaft entfalten können und nicht zu Datenfriedhöfen verkommen.

Anmerkungen:
[1] Die Tagungsbeiträge finden sich publiziert in: Daniel Burckhardt, Rüdiger Hohls, Vera Ziegeldorf (Hgg.), Geschichte und Neue Medien in Forschung, Archiven, Bibliotheken und Museen. Tagungsband .hist2003 (Historisches Forum 7, 2. Bde.), Berlin 2005: http://edoc.hu-berlin.de/e_histfor/ (24.04.06).
[2] Alf Lüdtke, Stofflichkeit, Macht-Lust und Reiz der Oberflächen. Zu den Perspektiven von Alltagsgeschichte, in: Wilfried Schulze (Hg.), Sozialgeschichte, Alltagsgeschichte, Mikro-Historie. Eine Diskussion, Göttingen 1994, S. 65-80, Zitat S. 66.
[3] Gerald Maier, Gemeinsames Internetportal für Bibliotheken, Archive und Museen. Das BAM-Portal, in: Burckhardt/Hohls/Ziegeldorf (Hgg.), Geschichte und Neue Medien, S. 107-126: http://edoc.hu-berlin.de/e_histfor/7_II#006013/ (24.04.06).

Zitation
.hist2006: Querschnittsbericht "Historische Quellenbestände: Digitalisierung und Suchstrategien", in: H-Soz-Kult, 19.05.2006, <www.hsozkult.de/debate/id/diskussionen-726>.
Redaktion
Veröffentlicht am
19.05.2006
Klassifikation
Weitere Informationen
Sprache Beitrag