„Computer Vision“ bezeichnet die Technik, mit computergestützten Systemen visuelle Informationen auf ähnliche Weise wahrzunehmen und zu erkennen, wie Lebewesen dies können. Erste Versuche, Computer und damit auch Roboter „sehen“ zu lassen, reichen bis in die 1960er-Jahre zurück, als man optimistisch annahm, dass das physikalische „Sehen“ im Gegensatz zum interpretierenden Sehen und Verstehen den Computern einfach „beizubringen“ sei. Doch auch zu Beginn des 21. Jahrhunderts hatten Computersysteme weiterhin Mühe bei Sehleistungen, die Zweijährige problemlos bewältigen, zum Beispiel alle Tiere in einem Bild zu zeigen. Andererseits sind in den letzten Jahren in den bekanntesten Bereichen der Computer Vision, der Gesichts- und der Texterkennung, aber auch in der Bewegungsverfolgung dank „Machine Learning“ erstaunliche Fortschritte erzielt worden.1
Nun legen Kevin Kee und Timothy Compeau ein Buch vor, das verschiedene geschichtswissenschaftliche Einsatzmöglichkeiten der Computer Vision behandelt, zu der die Herausgeber auch die Augmented Reality zählen.2 Die beiden kanadischen Digital Historians, die im Bereich der Verwendung von Games und Augmented Reality für Zwecke der Darstellung historischer Sachverhalte tätig waren und sind, liefern einen Reigen von Aufsätzen zu geschichtswissenschaftlichen Forschungs- und Entwicklungsprojekten, die neuartige computergestützte Methoden erproben. Dabei ist anzumerken, dass der Aspekt der Neuartigkeit für die Projekte mit Augmented Reality, mit der doch schon seit geraumer Zeit Anwendungen zur Geschichte entwickelt und erprobt worden sind3 und mit der gerade jüngst in Deutschland anspruchsvolle Lösungen zu historischen Themen der Öffentlichkeit vorgestellt wurden („MauAR“4 und „WDR AR 1933–1945“5), weniger Geltung beanspruchen kann als für jene Versuche, mit Anwendungen der Computer Vision geschichtswissenschaftliche Fragen zu beantworten.
Der Sammelband setzt auf Erfahrungsberichte. Vertiefte und umfassende Erörterungen über theoretische Grundlagen der Computer Vision und der Augmented Reality in der Geschichtswissenschaft streben die Herausgeber und Autor/innen ebensowenig an wie breit abgestützte empirische Untersuchungen mit den jeweiligen Methoden und den daran gebundenen methodologischen Evaluationen der computergestützten Vorgehensweise. Und auch wenn die Autor/innen in ihren Projekten neuartige Methoden anwenden und mit den Herausgebern der Meinung sind, dass die Geschichtswissenschaft sich diesen Möglichkeiten nicht verschließen dürfe, so plädieren sie keineswegs für einen kompletten digitalen Paradigmenwechsel: „The creation of the new does not require the destruction of the old“ (Einleitung, S. 4).
Konventionelle und erprobte Verfahren werden neben neuen, computergestützten Methoden wohl in der Tat bestehen bleiben und ihre Berechtigung behalten. Die Herausgeber propagieren vor allem die Notwendigkeit, neue Wege zu erproben und Erfahrungen zu sammeln, um abschätzen zu können, welche konkreten Anwendungen computergestützter Untersuchungsmethoden zu guten und tragfähigen Ergebnissen führen mögen. Die berichteten Experimente seien von beschränkter Reichweite, „and the results sometimes make clearer our methodological shortcomings as much as our advances“ (S. 5). Doch die Auseinandersetzung mit computergestützten Methoden des „Sehens mit Computern“ (Computer Vision) solle zeigen, dass ein anderes Sehen auch ein anderes Denken nach sich ziehe. Die Methode verändere den Blick auf den jeweiligen Untersuchungsgegenstand. Denn die computergestützte Sichtung von Dokumenten lässt nicht nur eine Analyse von bisher kaum bearbeiteten Quellen zu, sondern eröffnet auch neuartige Analyse-Methoden großer Datenbestände („Big Data“), für die der Literaturwissenschaftler Franco Moretti, bezogen allerdings auf Texte, den Begriff des „Distant Reading“ eingeführt hat6 – als Gegenstück zum „Close Reading“. Im hier vorliegenden Falle wäre indes eher von „Distant Seeing“ zu sprechen. Was dies konkret bedeuten kann, zeigen mehrere Beiträge des Sammelbandes.
Der erste Aufsatz demonstriert zunächst einmal, dass Computer Vision in der Lage ist, bereits errungene Erkenntnisse auf eine andere und eindrückliche Art zu bestätigen. Tim Sherratt und Kate Bagnall berichten in „The People Inside“ von ihrem Versuch, die Fotografien von Immigrant/innen, die die australischen Behörden zu den Einwanderungsgesuchen abgelegt hatten, mit Gesichtserkennungssoftware zu bearbeiten. Die Ergebnisse belegten das schon bekannte, rassistisch motivierte Ansinnen, die Immigration zu kontrollieren und unerwünschte Personen, vor allem aus China, nicht ins Land zu lassen. Das Projekt „The Real Face of White Australia“ zeigte Fotografien der Menschen, die von den Behörden an der Einwanderung gehindert wurden, auf einer großen Wand. Damit wurde die Diskriminierung sichtbar – sowohl in Bezug auf ihre umgreifende, massenhafte Wirkung wie auch mit Blick auf die Individuen.
Bewusst spekulativ geht der nächste Beitrag vor: „Bringing Trouvé to Light“ von Jentery Sayers. Der Autor befasst sich darin mit Objekten vom Ende des 19. Jahrhunderts, die der Juwelier Gustave Trouvé entwickelt hatte: kleine Schmuckstücke, die mit Hilfe von Batterien sich bewegten oder leuchteten. Nur wenige dieser Schmuckstücke sind bis heute erhalten geblieben, und funktionsfähig sind keine mehr. Auch viele Unterlagen der Konstruktionen sind verlorengegangen. Es ist daher gar nicht möglich zu erklären, ob und wie diese Schmuckstücke funktioniert haben. Sayers und seine Kolleg/innen haben nun einzelne dieser Objekte anhand der überlieferten Unterlagen und Artefakte virtuell im Computer nachzubilden versucht und dabei verschiedene Varianten im Computermodell erprobt. Die Ergebnisse konnten keine exakten Auskünfte über die Mechanismen geben, ließen aber grundsätzliche Erkenntnisse über die Herausforderungen und Herangehensweisen bei ihrer Produktion zu.
Eine weitere Möglichkeit, Computer Vision zur Analyse von umfassenden Quellen-Korpora zu verwenden, zeigen Edward Jones-Imhotep und William J. Turkel in ihrem Beitrag „The Analog Archive: Image-Mining the History of Electronics“. Sie sammeln, ordnen und untersuchen Schemata und andere Zeichnungen elektronischer Schaltkreise aus den 1950er- bis 1960er-Jahren, um Prozesse der Vereinheitlichung bei der technischen Dokumentation dieser neuen Technologie analysieren zu können. Dabei weisen sie auf Phasen der Unsicherheit und auf Verständigungsschwierigkeiten in der Entwicklergemeinschaft hin: Anfangs hatte sich noch keine einheitliche Zeichensprache durchgesetzt, was zu technischen Fehlern und Verzögerungen führte.
Weitere Beiträge schildern Ansätze, mit Studierenden Augmented-Reality-Entwicklungs-Werkzeuge zu nutzen, um spielerische Darstellungen von Forschungsprojekten aufzubauen (Geoffrey Rockwell / Sean Gouglas, Experiments in Alternative- and Augmented-Reality Game Design: Platforms and Collaborations), oder in Kombination mit einem Spiel-Szenario die Schulung historischer Methodik an einem konkreten Fall zu ermöglichen (Timothy Compeau / Robert MacDougall, Tecumseh Returns: A History Game in Alternate Reality, Augmented Reality, and Reality). Ein anderes Experiment ist die Sammlung und Auswertung von Datensätzen mit Hunderttausenden von Bildern, die aus den Anfängen des Internets stammen. Sie werden geordnet nach Communities der damaligen Zeit (wie etwa GeoCities) in Bezug auf Farbgebungen und Helligkeiten analysiert. Dabei kann der Autor zeigen, dass die Communities eigene „Bildwerte“ aufweisen, also spezifische Ausprägungen in Helligkeit und Farbe, aber auch in der Häufigkeit von gemeinsamen Bildern. Mit diesen Ausprägungen lassen sich die Bild-Datensammlungen voneinander unterscheiden. Noch sind die Erkenntnisse mager – das vorgetragene Projekt hat eher den Charakter einer Machbarkeitsstudie. Interessanter werden die Möglichkeiten der Big-Data-Auswertungen von Bild-Datensätzen wohl dann, wenn Objekt- und Gesichtserkennung bessere Analysen ermöglichen (Ian Milligan, Learning to See the Past at Scale: Exploring Web Archives through Hundreds of Thousands of Images).
Eine große Stärke des Bandes liegt darin, dass es den Herausgebern gelingt, ein überraschendes und faszinierendes Panoptikum unterschiedlichster Versuche zusammenzubringen, was computergestützte Methoden zum „Betrachten“ von Quellen beitragen können und welche Erkenntnisse dabei zu gewinnen sind. Umgekehrt fehlt es dem Band an Kohärenz, trotz des Versuchs von Kevin Kee und Timothy Compeau, die Beiträge sinnvoll zu gruppieren. Die Texte sind auch nicht gerade leicht zu lesen, da oft technische Probleme und Lösungsansätze referiert werden, die entsprechende Informatik-Anwender-Kenntnisse voraussetzen und den Erzählfluss deutlich einschränken. Dennoch darf der Sammelband als eine sinnvolle Einführung in die Möglichkeiten und Chancen von Computer Vision im Bereich der Geschichtswissenschaft bezeichnet werden.
Anmerkungen:
1 Als weiterhin nützliche Einführung siehe Richard Szeliski, Computer Vision. Algorithms and Applications, London 2011.
2 Das Buch ist parallel zur Druckausgabe im Open Access verfügbar: https://doi.org/10.3998/mpub.9964786 (16.10.2019).
3 Als Beispiel genannt sei der Einsatz von Augmented Reality in einer Museums-Umgebung: Danae Stanton u.a., Situating historical events through mixed reality, in: Barbara Wasson / Sten Ludvigsen / Ulrich Hoppe (Hrsg.), Designing for Change in Networked Learning Environments, Dordrecht 2003, S. 293–302.
4 „MauAR“, eine AR-App zur Berliner Mauer, wurde im Sommer 2019 veröffentlicht: https://mauar.berlin (16.10.2019).
5 „WDR AR 1933–1945“, eine AR-App zum Nationalsozialismus und zum Zweiten Weltkrieg, wurde im Frühling 2019 veröffentlicht: https://www1.wdr.de/fernsehen/unterwegs-im-westen/ar-app/ar-app-info-100.html (16.10.2019).
6 Franco Moretti, Distant Reading, London 2013; dt.: Distant Reading. Aus dem Englischen übersetzt von Christine Pries, Konstanz 2016.