SoNAR – Historische Netzwerkanalyse und passende Quellen aus Archiven und Bibliotheken per Mausklick?

Ort
digital (Düsseldorf)
Veranstalter
Heiner Fangerau / Thorsten Halling, Institut für Geschichte, Theorie und Ethik der Medizin, Heinrich-Heine-Universität Düsseldorf
Datum
09.02.2021 - 09.02.2021
Von
Eva Maria Holly, Historisches Seminar / Thorsten Halling, Institut für Geschichte, Theorie und Ethik der Medizin, Heinrich-Heine-Universität Düsseldorf

Die Auswahl und Aufbereitung geeigneter Quellen gehört zu den Grundproblemen der historischen Netzwerkanalyse. Die Erhebung von Daten, die die Untersuchung größerer Gruppen und ihrer sozialen Beziehungen ermöglichen, ist zeitaufwendig und beeinflusst das Forschungsdesign im Sinne der Praktikabilität. Diesem Problem steht eine immer größer werdende Menge an digitalisierten historischen Daten gegenüber, die von Archiven und auch Bibliotheken zur Verfügung gestellt werden. Eine automatisierte Verarbeitung von disparaten Datenbeständen, die zu transparenten und reproduzierbaren Netzwerkdarstellungen führt, ist daher ein erstrebenswertes Ziel.
Der Workshop diskutierte Ansätze, die Archive und Bibliotheken für das Auffinden und Nutzbarmachen historischer Datensätze entwickelt haben. Darüber hinaus wurden erste Ergebnisse aus dem SoNAR-(IDH)-Projekt vorgestellt. SoNAR erarbeitet systematisch anwendungsorientierte Best-Practice-Ansätze für die Erprobung einer Forschungstechnologie für die Historische Netzwerkanalyse (HNA). Ziel des Workshops war es, den konzeptionellen Ansatz von SoNAR, die Anwendungsszenarien der Use-Cases und die Anknüpfungspunkte für die Nutzung der Daten aufzuzeigen und mit der Forschungscommunity zu diskutieren.

Der Workshop fand aufgrund des Pandemiegeschehens virtuell mit 70 Teilnehmer:innen statt. Er stieß auf eine breite Resonanz aus vielen verschiedenen Wissenschaftsbereichen, u.a. Geschichts-, Sozial-, Literatur-, Religions-, Rechts-, Bibliothekswissenschaft sowie Bildungsforschung und Informatik.

In seinem einleitenden Vortrag stellte HEINER FANGERAU (Düsseldorf) das SoNAR-Projekt vor.[1] Zunächst erläuterte er auf der Basis allgemeiner Ausgangsbedingungen der Historischen Netzwerkanalyse das Konzept der experimentellen SoNAR-Forschungstechnologie und insbesondere die hier in den Blick genommenen Forschungsfelder und themenübergreifenden Anwendungsszenarien. Letztgenannte bildeten die konzeptionelle Grundlage für die laufenden Forschungstests in SoNAR. Fangerau unterschied dabei zwischen der Erkundung von Beziehungen als explorativ und hypothesenbildend, der Gewichtung von Beziehungen als quantifizierend und hypothesentestend, der Quantität und Qualität von Beziehungen als zeitlich-räumlich dimensionierend und dem Erkennen von Mustern. Die in SoNAR zur Verfügung gestellten Datenreihen sind, so Fangerau, in besonderer Weise für die skizzierten Anwendungsszenarien der HNA geeignet. Er charakterisierte die zentralen Eigenschaften der SoNAR-Daten als 1. empirische Daten über soziale Ereignisse, 2. regelbasierte und eindeutig erfasste Daten und 3. persistent adressierte Daten mit eindeutigen, systemunabhängigen Identnummern und URIs (Uniform Resource Identifier). Abschließend diskutierte Fangerau die mit SoNAR verbundenen Herausforderungen, die Qualität und Aktualität aufbereiteter Daten, die Transparenz der Verarbeitung und Reproduzierbarkeit der Ergebnisse, die Möglichkeit zum Ausbau der Technologie, die Visualisierung von und die Interaktion mit Daten, die Datenerhebung und -korrektur sowie die Implementierung und den Betrieb.

Im Hauptvortrag des Workshops knüpfte CHARLES VAN DEN HEUVEL (Amsterdam) an Fangeraus Ausführungen an und stellte heraus, dass Netzwerkanalysen von Big Data die Erforschung umfassender Forschungsfragen (Linked Open Data) erlauben. Er diskutierte die Bedingungen für erfolgreiche Kooperationen zwischen Forscher:innen und Institutionen, die große Datenmengen zur Verfügung stellen (wollen). Im Mittelpunkt stehen dabei Transparenz und Nachhaltigkeit (Networks of Documentary Evidence / Networks of Trust). Am Beispiel mehrerer laufender Forschungsprojekte demonstrierte van den Heuvel eindrucksvoll die Verwendung von Netzwerken bei der Modellierung (Ereignisse als Netzwerke) sowie bei der Disambiguierung von Daten (Identitätsverknüpfungsnetzwerke / assoziative Netzwerke). Im Projekt „Golden Agents”, das eine Infrastruktur zum Verständnis der Dynamiken in den kreativen Industrien des niederländischen Goldenen Zeitalters entwickelt, werden u.a. Semantic-Web- und die Multi-Agenten-Technologien zur Analyse und Interaktion mit heterogenen sowie bestehenden und neuen Datensätzen in Linked Open Data verwendet. Dabei wird u.a. eine Kombination aus Handschriften- und Texterkennung und Crowdsourcing zur Verarbeitung von zwei Millionen Scans von Notariatsakten eingesetzt.

Für die Überlegungen innerhalb des SoNAR-Projekts waren die in diesem Kontext von Van den Heuvel vorgestellten Ansätze zu Wahrscheinlichkeiten und Unsicherheiten besonders relevant: „Durch die Überlagerung mehrerer Netzwerke kann die Unsicherheit auf nicht-reduktive Weise minimiert werden, und die Visualisierungen können die verbleibende Unsicherheit ausdrücken.“

In der abschließenden Demonstration wurden Zwischenergebnisse aus dem SoNAR-Projekt gezeigt. Zunächst erläuterte MARK-JAN BLUDAU (Potsdam) den kooperativen Arbeitsprozess der Projektpartner:innen. Er skizzierte den ersten Co-Design-Workshop mit HNA- und SNA-Experten, gab einen kurzen Einblick in Visualisierungsexperimente mit Fokus auf unterschiedliche konzeptionelle und technische Herausforderungen und stellte fortgeschrittene Konzept-Demonstrationen und Prototypen vor. Dabei legte er bewusst den Fokus auf innovative Visualisierungskonzepte und nicht auf eine Neu-Implementierung bestehender Such- und Filter-Interfaces oder Netzwerk-Tools. Bludau verwies außerdem auf die beeindruckende Größe des Datensatzes (aktuell ca. 47 Mio. Knoten und ca. 191 Mio. Kanten) und die damit verbundenen Herausforderungen für Visualisierungskonzepte.

Daran anschließend erläuterte THORSTEN HALLING (Düsseldorf) aus der Perspektive der Wissenschaftsgeschichte den ersten der zwei Forschungstests, mit denen die Eignung von SoNAR für die von Fangerau genannten Anwendungsszenarien überprüft wird. Entlang des aktuellen Forschungsstands wurden Hypothesen zur Wirkung von sozialen Beziehungen auf beobachtete Phänomene am Beispiel des Forscherkollektivs der Physiologen im 19. und frühen 20. Jahrhundert gebildet. Diese wurden mit Ergebnissen aus Abfragen mit SoNAR verglichen.

EVA MARIA HOLLY (Düsseldorf) präsentierte anschließend Ergebnisse des zweiten Forschungstests, der einen Schwerpunkt auf die Netzwerke deutscher und österreichischer Nationalökonomen des 19. und 20. Jahrhunderts legt. Am Beispiel des Nationalökonomen und Soziologen Max Weber zeigte sie Chancen und Herausforderungen bei der Erforschung egozentrierter Netzwerke mit SoNAR auf. Die zentralen Problemstellungen der HNA unter der Verwendung der vorgestellten Forschungstechnologie wie z.B. Datenmenge, fehlende Daten und die Qualität der Ausgangsdaten demonstrierten Halling und Holly anschaulich anhand von komplexen Visualisierungen.

Die Einzelbeiträge, aber auch das Projekt als Ganzes stießen auf eine sehr positive Resonanz. Das große Interesse, sofort mit SoNAR zu arbeiten, musste mit Verweis auf das experimentelle Projektstadium vorläufig enttäuscht werden.

In der Diskussion wurden vor allem drei Aspekte angesprochen: die Ausgangsdaten, die Datentransparenz und die Visualisierung der Daten. Gefragt wurde nach der Verfügbarkeit der Daten und Formen der Bereitstellung (Query-Interface, API, CSS) von Rohdaten für die plattformunabhängige Weiterverarbeitung. Gerhard Müller (Berlin) verwies darauf, dass die Normdaten und ein Teil der Metadaten schon jetzt unter Open-Source-Lizenz zur Verfügung stünden. Elena Leitner (Berlin) erläuterte, dass im SoNAR-Projekt derzeit an Konzepten zum Thema Datenexport gearbeitet wird. Daran anknüpfend wurde die Frage der Datentransparenz diskutiert, aber auch die Zitierfähigkeit der Ergebnisse. Im Kontext der Fragen zur Visualisierung wurden kombinierte Filtermöglichkeiten und die Organisation der Informationen in Knoten und Kanten erörtert. Charles van den Heuvel regte wechselnde Perspektiven auf die Netzwerke an: „you also should be able to manipulate the nodes and the links.“

Der Workshop veranschaulichte durch die Anwendungsszenarien der Use-Cases die konzeptionellen Herausforderungen bei der Entwicklung der Forschungstechnologie SoNAR und konzentrierte sich auf jene herausfordernden Themen, die aktuell im Rahmen der HNA diskutiert werden. Die Workshopinhalte wurden anschließend in den Diskussionsbeiträgen aufgegriffen und mit Fragen und Anregungen zur Angabe von Wahrscheinlichkeiten, zum Datenexport und zu alternativen Perspektiven auf historische Netzwerke verknüpft.

Konferenzübersicht:

Heiner Fangerau (Düsseldorf): SoNAR (IDH). Konzept, Daten, Herausforderungen

Charles van den Heuvel (Amsterdam): Interactions between Big Data and Historical Network Research

Eva Maria Holly (Düsseldorf) / Mark-Jan Bludau (Potsdam) / Thorsten Halling (Düsseldorf): SoNAR. Visualisierungskonzepte und Anwendungsszenarien

Diskussion

Anmerkung:
[1]https://sonar.fh-potsdam.de.

Zitation
Tagungsbericht: SoNAR – Historische Netzwerkanalyse und passende Quellen aus Archiven und Bibliotheken per Mausklick?, 09.02.2021 – 09.02.2021 digital (Düsseldorf), in: H-Soz-Kult, 07.07.2021, <www.hsozkult.de/conferencereport/id/tagungsberichte-8990>.