Zwischen Link-Graphen und Paragraphen – Archivierung und Nutzung von Netz-Quellen

Zwischen Link-Graphen und Paragraphen – Archivierung und Nutzung von Netz-Quellen

Organisatoren
Annabel Walz / Andreas Marquet, Archiv der sozialen Demokratie, Friedrich-Ebert-Stiftung, Bonn
Ort
Bonn
Land
Deutschland
Fand statt
In Präsenz
Vom - Bis
25.10.2022 - 25.10.2022
Von
Paulina Eckert, Technische Hochschule Köln

Mit der wachsenden Bedeutung von Social-Media-Plattformen sehen sich Gedächtniseinrichtungen wie Bibliotheken und Archive dazu verpflichtet, auch deren digitale Inhalte zu bewahren und Forscher:innen und der interessierten Öffentlichkeit einen Zugang zu relevanten Netzquellen zu bieten. Inwieweit unsere Gesetzeslage eine Web- und Social-Media-Archivierung verhindert und mit welchen technischen und ethischen Herausforderungen Gedächtnisinstitutionen einerseits und Nutzende von Webarchivalien anderseits konfrontiert werden, sollte der Workshop beleuchten. Andreas Marquet und Annabel Walz (beide Bonn) luden ein, im Haus der Friedrich-Ebert-Stiftung über das aktuelle und dringliche Thema „Web- und Social-Media-Archivierung“ zu diskutieren.

Die Rechtsanwälte der Anwaltskanzlei iRights.Law, PAUL KLIMPEL und FABIAN RACK (beide Berlin), präsentierten ein im Auftrag des Archivs der sozialen Demokratie erstelltes Gutachten, eine Analyse der rechtlichen Grundlagen zur Social-Media-Archivierung. Sie gingen auf das Urheber- und Datenschutzrecht bei der Übernahme, der Terminal- und der Online-Nutzung des archivierten Materials ein, die eine Web- und Social-Media-Archivierung begünstigen oder erschweren könnten. Dabei wurde schnell deutlich, dass die Archivierung nicht von Gesetzgeber:innen bedacht und eine Social-Media-Archivierung nicht explizit verboten, aber auch nicht erlaubt wurde. Das berechtigte Interesse von Gedächtniseinrichtungen, beispielsweise des Archivs der sozialen Demokratie, den öffentlichen politischen Diskurs auf Social Media zu bewahren und somit zum Informationsinteresse der Öffentlichkeit und der Wissenschaftsfreiheit bei historischen Forschungen beizutragen, könnte eine Social-Media-Archivierung legitimieren. Die speziellen Sammlungsprofile von Gedächtniseinrichtungen könnten dabei helfen, dieses Interesse weiter zu konkretisieren und zu dokumentieren. Den Sorgen der Teilnehmenden über ein gerichtliches Vorgehen der Social-Media-Plattformbetreiber beim Archivieren entgegneten die Rechtsanwälte, dass Gedächtnisinstitutionen nicht im kommerziellen Interesse handeln und eine Klage unwahrscheinlich sei. Vor dem Hintergrund des vorgestellten Rechtsgutachtens und den mit Hinterlegern abgeschlossenen Verträgen betreibt das Archiv der sozialen Demokratie seit 2021 die Archivierung ausgewählter Twitter-Kanäle.

Im ersten Panel wurden weitere praktische Beispiele, Ansätze und Herausforderungen der Web- und Social-Media-Archivierung aus ausgewählten Archiven und Bibliotheken vorgestellt. LARS JENDRAL (Koblenz) berichtete über die Webarchivierung des Landesbibliothekszentrums Rheinland-Pfalz, basierend auf dem Landesbibliotheksgesetz, das seit 2004 auf die Pflichtabgabe von „Medienwerken in unkörperlicher Form“ und somit auf die landeskundlichen Websites und elektronischen Veröffentlichungen erweitert wurde. Trotz dieser rechtlichen Absicherung kam es zu Abmahnversuchen und einer konkreten Abmahnung aufgrund von betroffenen Bildrechten. Laut Jendral ist das Einverständnis der Website-Betreiber zur Archivierung wenig relevant, wenn sie nicht über die Rechte aller verwendeten Medien verfügen. Er kritisierte daher das aktuelle Urheberrecht, das vom Bund und von der Europäischen Union geregelt wird und somit im Konflikt mit der Kulturhoheit der Länder steht.

JOHANNES RENZ (Stuttgart) sprach von der Archivierung aufbereiteter Social-Media-Daten der Pressestelle des Landtages von Baden-Württemberg. Das Landesarchiv Baden-Württemberg archiviert 380 Websites und 20 Blogs. Außerdem werden die Social-Media-Accounts des Landesdatenschutzbeauftragten und des Landtags von Baden-Württemberg in Form von Self-Archiving gesichert. Gut geeignet als Pilot für die Social-Media-Archivierung ist der Account des im Umgang mit Social Media erfahrenen Landtags von Baden-Württemberg, von dem noch viel Material erwartet wird. Vom Landtag genutzt wird die Social-Media-Management-Software „Facelift“, die geeignete Dateiformate wie PDFs generiert und somit eine Langzeitarchivierung ermöglicht.

TOBIAS BEINERT (München) blickte zurück auf zehn Jahre Erfahrung in der Webarchivierung innerhalb der Bayerischen Staatsbibliothek, die selektives Harvesting bei den Websites bayerischer Ministerien und Behörden sowie den Websites von Fachinformationsdiensten und des Internetportals „bavarikon“ betreibt. Als Rechtsgrundlage dient die Erlaubnis zur Archivierung der Websitebetreiber. Dabei entstehen Herausforderungen wie sich ändernde oder fehlende Genehmigungen Dritter sowie beim Harvesting potenziell übernommene Cookies oder gar Viren. Außerdem werden die archivierten Webinhalte weniger als erhofft genutzt, weshalb sich Beinert die Frage stellte, wie sich die Nutzung der archivierten Materialien erhöhen ließe. Eine potenzielle Lösung, um Historiker:innen die bereits archivierten Web- und Social-Media-Inhalte näherzubringen, wäre die Verankerung in der Ausbildung durch ein Studienfach, das sich mit E-Akten befasst, so ein Vorschlag der Teilnehmenden. Vermutlich wird das Interesse in der Forschung an diesem Material zukünftig und somit erst zeitversetzt an Bedeutung gewinnen. Die drei Einrichtungen werden sich allerdings weiterhin auf das Archivieren von aktuellen Webinhalten fokussieren und auch ein „kleines schwarzes Loch“ in der Vergangenheit, aus den frühen Anfängen des Internets, in Kauf nehmen, bevor weitere größere Lücken in der Gegenwart entstehen können.

Im zweiten Panel präsentierten Forschende aktuelle und potenzielle Forschungsvorhaben rund um archivierte Web- und Social-Media-Inhalte. MIA BERG (Bochum) stellte das bis 2024 laufende Verbundprojekt „SocialMediaHistory – Geschichte auf Instagram und TikTok“ vor, das auf einem Interesse an Geschichte auf populären Social-Media-Formaten basiert. Aus der Public-History-Perspektive erkannte sie Social-Media-Datenmaterial als eine wichtige Forschungsgrundlage und Social-Media-Nutzende als eine neue einflussreiche Zielgruppe an. Da Instagram jedoch die automatische Auswertung, Erhebung und Archivierung der Inhalte in den Nutzungsbedingungen verbietet und eine Klage durch den Social-Media-Betreiber drohen kann, musste im Projekt auf das Archivieren von Instagram-Beiträgen verzichtet werden. Einige somit nur als Links gespeicherte Instagram-Posts gelten mittlerweile als verloren.

HARALD LÜNGEN (Mannheim) sieht im Aufbau und in der Nutzung von Sprachkorpora eine wichtige Grundlage, mit der Sprachwissenschaftler:innen beispielsweise den Sprachgebrauch von Jugendwörtern oder Anglizismen untersuchen könnten. Im Auftrag des Leibniz-Instituts für Deutsche Sprache und mit der Erlaubnis von 120 Lizenzgebern wurde DeReKo erstellt, eine elektronische Sammlung authentischer Gegenwartssprache, darunter internetbasierte Kommunikation auf sozialen Medien. Auf der Korpus-Rechercheplattform können Forschende Anfragen formulieren und erhalten als Ergebnis die dazugehörigen Fundstellen. Das nach Plattformen sortierte Korpus weist derzeit am meisten Wikipedia-Artikel und deren Diskussionsbereich auf, da hier Creative-Common-Lizenzen gelten, während die Daten zu Twitter zwar gesammelt werden, der Öffentlichkeit aber nicht zur Verfügung stehen.

MALTE THIESSEN (Münster) stellte drei Beispiele aus der Forschung vor, in denen archivierte Internetinhalte als Forschungsgrundlage dienen könnten. Einmal ging es um die Repräsentation von Städten in Form von kommunalen Websites, wie beispielsweise der Stadt Bonn, deren Wandel über die Zeit Aufschluss über die Entwicklung des Stadtimages geben könnte. In einem zweiten Beispiel bieten Social Media als sozialer Raum auch potenzielle Quellen für die Erinnerungskultur, die vorher nicht sichtbar waren. Zu einem Tweet über den bildlichen Vergleich zwischen den Zerstörungen des Ukraine-Krieges mit denen von Dresden 1945 machen die dazugehörigen Reaktionen wie Kommentare und Retweets Netzwerkbildungen deutlich. Auch im Zusammenhang mit der Corona-Pandemie sind Protestbewegungen und die Gegenöffentlichkeiten in den Fokus der Berichterstattung gerückt, die zuvor in den klassischen medialen Überlieferungen wenig Beachtung fanden. Anhand der mittlerweile gelöschten Website „Querdenken“ zeigte Thießen auf, wie das Nicht-Archivieren dieser Webinhalte zu einer digitalen Demenz führen könnte. Für die Teilnehmenden besteht hier eine „Hol- und Bringschuld“, sowohl bei den Gedächtniseinrichtungen, dieses für die Forschung potenziell relevante Material zu bewahren und bereitzustellen, als auch bei den Forschenden, diese archivierten Webinhalte aktiver zu nutzen.

Im dritten Panel hatten die Teilnehmenden die Möglichkeit, in dem vom World-Café inspirierten Hands-On mindestens zwei von vier Präsentationen zu besuchen und Näheres über eingesetzte Tools zur Übernahme und Auswertung von Websites und Social-Media-Inhalten zu erfahren. Während MARIUS SÄLTZER (Köln) die Twitter Archivierung mit R präsentierte, stellte MARC MALWITZ (Münster) die Twitter-Archivierung mit der Crawler-Engine TWINT vor. Das dazugehörige Script ist im Internet frei verfügbar, kann nachgenutzt werden und wurde zur Archivierung des Twitter-Accounts des Archivs und des Oberbürgermeisters der Stadt Münster gebraucht. ANNABEL WALZ (Bonn) zeigte den Nutzen von „SolrWayback“ zur Recherche und Analyse von Webseiten auf, während IRMGARD BARTEL und SEBASTIAN VESPER (beide Bonn) über die Speicherung von elektronischen Pressemitteilungen von Parteien und Gewerkschaften informierten. Sobald ein RSS-Feed vorliegt, werden hier weltweit Pressemitteilungen aller im Parlament vertretener Parteien sowie aller großen Gewerkschaften und nationalen Dachverbände gesammelt.

Basierend auf den Rückmeldungen der Teilnehmenden, beispielsweise auf dem Live-Feedback-System Tweedback, wurde deutlich, dass ein allgemeines Interesse an Folgeveranstaltungen wie Webseminaren besteht. Zum Schluss konnten interessierte Besucher:innen in einer Archivführung auch die analogen Archivalien im gastgebenden Archiv der sozialen Demokratie der Friedrich-Ebert-Stiftung betrachten.

Konferenzübersicht:

Annabel Walz und Andreas Marquet (Bonn): Begrüßung und Einführung

Paul Klimpel und Fabian Rack (Berlin): Vorstellung des Gutachtens

Panel 1: Archivierung von Webinhalten in der Praxis

Lars Jendral (Koblenz): Edoweb – Zugriff auf archivierte Websites

Johannes Renz (Stuttgart): „... with a little help from the parliament“ – Archivierung aufbereiteter Social Media-Daten der Pressestelle des Landtags von Baden-Württemberg

Tobias Beinert (München): Ansatz und Nutzungsszenarien der Webarchivierung an der Bayerischen Staatsbibliothek

Panel 2: Forschung mit Webseiten und Social Media-Inhalten

Mia Berg (Bochum): Soziale Medien in der historischen Forschung

Harald Lüngen (Mannheim): Aufbau und Nutzung von Sprachkorpora aus sozialen Medien – Beispiele und Herausforderungen

Malte Thießen (Münster): Gegen digitale Demenz, für eine Geschichte der Gegenwart – Forschung mit Webseiten und Social Media

Hands-On: Tools zur Übernahme und Auswertung von Webseiten und Social Media-Inhalten

Marc Malwitz (Münster): Twitter-Archivierung mit TWINT – Ein Projekt des Stadtarchivs Münster mit der LWL.IT

Marius Sältzer (Köln): Twitter-Analyse mit R

Irmgard Bartel und Sebastian Vesper (Bonn): Elektronische Pressemitteilungen von Parteien und Gewerkschaften

Annabel Walz (Bonn): SolrWayback – einfache Konfiguration und Nutzung

Abschlussdiskussion

Redaktion
Veröffentlicht am
Beiträger
Klassifikation
Weitere Informationen
Land Veranstaltung
Sprache(n) der Konferenz
Deutsch
Sprache des Berichts