Warum ein Lehrbuch für Digital Humanities? So fragen die Herausgeber im Editorial des Bandes, der die Digitalisierung in Computerphilologie, Kunstgeschichte, Bibliothekswissenschaften, Germanistik und schließlich auch Geschichtswissenschaften in einer „Transformationswissenschaft“ Digital Humanities (S. XI) zusammenführen möchte. Seit mehr als einer Dekade hält nun eine Debatte um die Verfachlichung der Digitalisierung der Geisteswissenschaften und der theoretischen Fundierung sowie praktischen Anwendung digitaler Werkzeuge an – die aber ganz neu nicht ist, schaut man beispielsweise zurück auf den Boom computergestützter, quantitativer und qualitativer Methoden in der Sozial- und Wirtschaftsgeschichte der 1970er- und 1980er-Jahre in Deutschland, Frankreich oder den USA.
Im ersten Kapitel „Digital Humanites als Wissenschaft“ zeigt Manfred Thaller, seinerseits einer der „Pioniere“ digitaler Geschichtswissenschaften, dass es die Digital Humanities als Fach so nicht gibt. Die Digital Humanities sind, so Thaller, eher als Erweiterung der einzelnen Geisteswissenschaften zu sehen. Denn es unterscheiden sich immer noch die jeweiligen methodischen Herangehensweisen der Fächer. Die Geisteswissenschaften eint allerdings die notwendige Auseinandersetzung mit theoretischen und technologischen Grundlagen der Informatik; angefangen von der Formalisierung und Modellierung von Quellen und Forschungsfragen bis zur konkreten hardware- und softwareseitigen Umsetzung von Datenstrukturen und Algorithmen. Die grundsätzliche Aufbereitung von Texten und Zahlen für die maschinelle Auswertung und basale philologische Praxis basieren in den geisteswissenschaftlichen Disziplinen schließlich auf den gleichen Prinzipien. Hier finden die Geisteswissenschaften im Digitalen zusammen und setzen sich aufgrund ihrer textspezifischen Forschungsmethoden von digitalen Praktiken beispielsweise in den Naturwissenschaften ab. Ob es, wie Thaller ausführt, letztlich tatsächlich unerheblich ist, ob Philologen oder Historiker ein Werkzeug benutzen bzw. wie neutral sich der Einsatz in ihrem jeweiligen Forschungskontext verhält, wird zukünftig sicherlich noch zu zeigen sein.
Die wissenschaftstheoretische Diskussion aus dem Eingangskapitel wird im weiteren Band nur in einigen Seitensträngen fortgeführt. Lediglich gestreift werden beispielsweise Forschungen, die sich vor dem Hintergrund von Digitalisierung und Vernetzung mit Narrativen im Hypertext beschäftigen. Die weiteren Beiträge behandeln nun primär technische Aspekte wie den Aufbau eines Computers und die Grundlagen binärer Codierung, Netzwerkprotokolle im Internet, die Beschreibungssprache XML oder die theoretischen und praktischen Grundlagen von Datenbanken. Im Abschnitt zu „Digitalen Objekten“ finden sich Beiträge zu Problemen der Digitalisierung aus der Archiv- und Bibliothekswelt gemeinsam mit Digitalen Editionen und Datensammlungen. Alle Beiträge verstehen sich als Teil eines einführenden Handbuchs für Studierende, werden in der Praxis aber zwingend durch vertiefende Lektüre zu ergänzen sein. Hinweise zu weiterführender Literatur finden sich dann auch in unterschiedlicher Quantität am Ende eines jeden Kapitels.
Eine grundlegende Arbeitstechnik in den Digital Humanities – das Programmieren – wird in einem eigenen Kapitel behandelt, mit Referenz auf die Programmiersprache python, die sich stetig wachsender Popularität erfreut.1 In den Digitalen Geisteswissenschaften spielt sie vor allem im Bereich des Textmining und der Programmierung quantitativer Algorithmen in „R“ eine wichtige Rolle. Mit den ersten Programmierkenntnissen in python lassen sich später weitere Sprachen erlernen. Die Verwendung einzelner Programmiersprachen hängt letztlich von den Anforderungen an Algorithmen, dem Verbreitungsgrad der Sprache, der Verfügbarkeit wiederverwendbarer Code-Bibliotheken ab, schließlich auch von den zu verwendenden fachlichen Methoden und personellen Rahmenbedingungen. Tiefergehende Grundlagen der technischen und praktischen Informatik zum Programmieren finden an dieser Stelle, wie auch in anderen Kapiteln, weniger Beachtung. So bleiben unter anderem Details über die Umwandlung höherer Programmiersprachen in Maschinencode und dessen Ausführung in Speicher und Prozessor ausgespart. Diese Beschränkung erleichtert in einem Einführungswerk die Abstraktion. In der Praxis jedoch ist das Wissen beispielsweise über die Umwandlung höherer Programmiersprachen in Maschinencode durch Compiler hilfreich, um zu einem besseren Verständnis von Programmierlogik und strukturierter Fehlersuche im Programmcode (Debugging) zu gelangen oder Beschränkungen des Programmierens zu erkennen. Die Beschäftigung damit hat im Übrigen auch eine forschungspraktische sowie erkenntnistheoretische Dimension.
Zwei weitere Kapitel widmen sich Datensammlungen und der Datenmodellierung. Im ersten werden wichtige Grundbegriffe für das derzeit diskutierte Thema Forschungsdaten erläutert. Zu Forschungsdaten zählen hier sämtliche anfallenden digitalen Daten, eine Referenzliste weist Bibliotheksverbundkataloge, Archiv-Findmittel-Datenbanken oder auch Quelleneditionen als „Datensammlungen“ aus. Die Terminologie um „Daten“ im gesamten Band wirkt – es liegt in der Natur der Sache – etwas unscharf, es werden dafür wichtige Grundbegriffe wie Metadaten oder Normdaten und das strukturierte Erfassen und Erschließen von Daten vorgestellt. Das Kapitel zur Datenmodellierung spricht besondere Probleme der Geisteswissenschaften an, die aus der Modellierung bzw. Beschreibung zeitlich unscharfer Daten wie Zeitspannen oder der Verarbeitung von Quellen älterer Epochen resultieren. Neben der Theorie wird auf die praktische Umsetzung in Datenbanken in verschiedenen Kapiteln eingegangen. Das Hauptaugenmerk liegt hier auf den weit verbreiteten relationalen Datenbanken, in denen Daten tabellarisch erfasst, mit Relationen verknüpft sowie mittels Abfragen zusammengefasst und ausgewertet werden können. Angesichts des Fokus der Digital Humanities auf Textdaten verwundert hier die randständige Erwähnung reiner Textdatenbanken bzw. sogenannter Nosql-Datenbanken. Auch Konzepte wie Data-Lakes zur Zusammenführung heterogener Datenbestände, unter anderem über Cloud-Datenspeicher, bleiben leider ausgespart; dabei zählen diese heute zum Fundament von „Big Data“.
Mit der Graphentheorie wird eine wichtige theoretische Grundlage für Forschungsmethoden. beispielsweise für die Netzwerkanalyse, vorgestellt. Ein Exkurs auf quantitative Methoden findet sich im Kapitel zum Textmining, welches anhand von Konzepten wie Distant Reading und Topic Modeling vorgestellt wird, mit einem Exkurs auf Maschinelles Lernen. Einzelne Kapitel zu Visualisierungsverfahren, wie Geoinformationssysteme oder Grundlagen von Information Retrieval bzw. Informationssuche in Texten ergänzen das Spektrum der Beiträge.
Summa summarum bietet der Sammelband eine breite Einführung in die technischen Aspekte von Digitalisierung, Computernutzung, Algorithmen und deren Standardisierung in den Geisteswissenschaften. Das Buch führt kompakt in wichtige Grundlagen von Abstraktion und Formalisierung von Daten und Methoden sowie deren technischer Umsetzung ein, unterstützt von Übungsaufgaben und Anwendungsbeispielen zum Download. Die meisten Beiträge widmen sich letztlich gängigen Verfahren der Informatik, Geografie, Mathematik und Sozialwissenschaften. Es regt damit an, tiefer in die Debatten der Digital Humanities einzutauchen, letztlich aber eher auf einer technischen als wissenschaftstheoretischen Ebene. Studierenden und Wissenschaftler/innen mit Interesse am Thema ist es daher – wie der Titel es vorgibt – als einführendes Lehrbuch nahezulegen.
Anmerkung:
1 Vgl. Maika Möbus, Die Top 10 der Programmiersprachen. Aktuelle Rankings im Vergleich, 2019, https://entwickler.de/online/development/top-10-programmiersprachen-redmonk-tiobe-pypl-579886370.html (01.12.2019).