Es war ein fast schon ungewöhnliches Unterfangen Anfang Oktober in Bad Homburg bei der Werner Reimers Stiftung: ein Workshop, der nicht virtuell, sondern als Präsenzveranstaltung mit hybriden Elementen abgehalten wurde. Bei echtem Filterkaffee und unter Einhaltung der geltenden Hygienebestimmungen konnten die Teilnehmenden in den großzügigen Räumlichkeiten auch die wertvollen Gespräche am Rande einer Tagung führen.
Eingeladen hatten das DFG-Projekt „Sozialdaten als Quellen der Zeitgeschichte” und der Arbeitskreis „Sozialdaten und Zeitgeschichte“, der ein regelmäßiges und interdisziplinäres Diskussionsforum für Forschende aus den Feldern der Zeit-, Wirtschafts-, Sozial- und Bildungsgeschichte sowie den Sozialwissenschaften bietet und seit vier Jahren von der Werner Reimers Stiftung unterstützt wird. Im Zentrum des diesjährigen Workshops stand die Frage nach den rechtlichen und ethischen Grundlagen der zeithistorischen Forschung mit Sozialdaten. LUTZ RAPHAEL (Trier) verwies in seinen einleitenden Bemerkungen auf grundlegende Aspekte wie die Bedeutung des Datenschutzes und der Anonymisierung von Sozialdaten für deren zeithistorische Nutzung, auf das Problem der Eigentumsfrage – wem gehören die archivierten Forschungsdaten? – und schließlich auf Fragen des forschungsethischen Umgangs mit personenbezogenen Informationen. Ziel sowohl des AK Sozialdaten als auch des daraus hervorgegangenen DFG-Projektes sei es, die Zweitauswertung von sozialwissenschaftlichen Forschungsdaten als Zugang in der Zeitgeschichte zu etablieren. Im Kontext des Workshops werde es darum gehen, die in diesem Zusammenhang aufkommenden datenschutzrechtlichen und ethischen Herausforderungen auszuleuchten und zu diskutieren.
Als erster Referent präsentierte WOLFGANG DUNKEL (München) die virtuelle Plattform eLabour1 des gleichnamigen Forschungsdatenzentrums (FDZ). eLabour stellt seit 2019 überwiegend Transkripte von Interviews aus arbeits- und organisationssoziologischen Forschungsprojekten für eine wissenschaftliche Zweitauswertung zur Verfügung. Dunkel erläuterte, wie die Forschungsdaten datenschutzrechtlich konform aufbereitet, klassifiziert und für Forschende zugänglich gemacht werden. Um sensible und personenbezogene Informationen zu schützen, werden die Forschungsdaten zunächst einer individuellen Risikoanalyse unterzogen, anschließend pseudonymisiert und dadurch unter Umständen auch inhaltlich leicht verändert. Als Gratwanderung erweist sich immer wieder die Balance zwischen dem Erhalt der Qualität der Daten für die Sekundäranalyse, der Gewährleistung des Datenschutzes und den dafür notwendigen Ressourcen auf Seiten des FDZ. Am Ende eines internen Freigabeprozesses werden die jeweiligen Studien einer von fünf Freigabeklassen zugeordnet, mit denen ein unterschiedlicher Umfang von Zugangsbeschränkungen verbunden ist. Diese reichen von einer notwendigen Registrierung, um die Daten nutzen zu können, bis zum Abschluss eines Nutzungsvertrages, dem Erarbeiten eines Datensicherheitskonzepts durch die Nutzenden und einer abschließenden Kontrolle von Publikationen vor der Veröffentlichung.
Im Mittelpunkt der anschließenden Diskussion stand die Frage, nach welchen Kriterien beziehungsweise auf Basis welcher rechtlichen Grundlage die Risikoanalyse und die Einstufung in die jeweilige Freigabeklasse erfolgen. Als maßgebliche Richtlinie für die datenschutzrechtliche Bewertung der Forschungsdaten gilt den Verantwortlichen von eLabour, wie üblicherweise in den FDZ, die europäische Datenschutz-Grundverordnung (DSGVO) und nicht das Bundesarchivgesetz oder das niedersächsische Archivgesetz (eLabour ist in Göttingen angesiedelt). Dieser Umstand ergebe sich zum einen aus dem rechtlichen Status des als Verein organisierten FDZ und zum anderen aus dem gegenwartsnahen Erhebungszeitpunkt der Interviews. Teilnehmende mit Expertise auf dem Feld des Archivrechts regten in der Diskussion an, dass die FDZ sich selbst als Archive verstehen sollten. Auf diese Weise sei es möglich, die weitreichenderen wissenschaftlichen und datenschutzrechtlichen Freiheiten der Archivgesetze in Anspruch zu nehmen und die in den jeweiligen Gesetzen geregelten Schutzfristen zu beachten und gleichzeitig die Pseudonymisierung für Nutzende transparent zu gestalten.
Mit Qualiservice2 stellte JAN-OCKO HEUER (Bremen) ein weiteres FDZ vor, in dem qualitative sozialwissenschaftliche Forschungsdaten archiviert und für eine Nachnutzung aufbereitet werden. Wie bei eLabour umfassen die Bestände von Qualiservice zurzeit hauptsächlich Interviewtranskripte, wobei Heuer hervorhob, dass zukünftig auch Fotografien sowie Audio- und Videodateien aufgenommen werden sollen, um den Methoden und Anforderungen der qualitativen sozial- und kulturwissenschaftlichen Forschung gerecht zu werden. Als rechtliche Grundlage für die Bereitstellung der Forschungsdaten dient dem FDZ eine der DSGVO entsprechende Einwilligungserklärung der Forschungsteilnehmenden. Das von Qualiservice angewandte Anonymisierungskonzept sieht vor, dass sensible personenbezogene Daten nicht geschwärzt, sondern durch abstrahierte, aber inhaltlich äquivalente Informationen ersetzt werden. Gleichzeitig betonte Heuer, dass die vorgenommenen Veränderungen nachträglich zurückgenommen und so die Ausgangsdaten wiederhergestellt werden können. Während die Metadaten und die Studienreporte frei verfügbar sind, wird der Zugang zu den Forschungsdaten über individuelle Nutzungsvereinbarungen geregelt, die Pflichten und Sanktionen enthalten. Zuletzt stand die Frage des Erhalts und der Bereitstellung von Kontextwissens im Mittelpunkt: Qualiservice ermöglicht den Datenerzeugern die Archivierung aller als relevant erachteten Kontextinformationen wie Fragebögen, Anträge oder interne Berichte.
In der folgenden Diskussion stellte sich heraus, dass die Datenbestände von Qualiservice bisher ausschließlich von Sozialwissenschaftlerinnen und Sozialwissenschaftlern genutzt werden. Deshalb liegen noch keine Erfahrungen dazu vor, wie die Anonymisierung der Daten oder der Umfang der dokumentierten Kontextinformationen Zweitauswertungen mit zeithistorischen Fragestellungen beeinflussen. Einige der Diskutierenden plädierten dafür, die rechtliche Grundlage zur Anonymisierung der Daten dynamisch – im Sinne einer moving wall– anzupassen. Das heißt, dass die Forschungsdaten nach einer ausreichend langen Frist aus dem Geltungsbereich der DSGVO in den Geltungsbereich von Archivgesetzen übergehen und deren Vorgaben z.B. zum Schutz von personenbezogenen Daten angewendet werden. Auf diese Weise könnten, so die Meinung, Zugangsbeschränkungen über die Zeit sukzessive gelockert und die Datenqualität für Historikerinnen und Historiker erhöht werden. Darüber hinaus diskutierten die Teilnehmenden die Interoperabilität der Anonymisierungsverfahren von unterschiedlichen Forschungsdatenbeständen und die Möglichkeit eines überinstitutionellen Anonymisierungsschlüssels.
LINDE APEL (Hamburg), Leiterin des Archivs der Erinnerung an der Forschungsstelle für Zeitgeschichte, legte den Schwerpunkt auf drei Aspekte, die es bei der Verwendung von Oral-History-Interviews als nachnutzbare Forschungsdaten zu berücksichtigen gelte. Erstens sei es notwendig, ein Interview, seine Rahmenbedingungen und die Kontexte zu reflektieren sowie die Spezifika solcher Interviews zu berücksichtigen. Das Best-case-Szenario, also ein methodisch akkurat durchgeführtes und für die Nachnutzung aufbereitetes Interview, sei in der Praxis eher die Ausnahme als die Regel. Dies sei nicht zuletzt darauf zurückzuführen, dass selbstgeführte Interviews häufig als Privateigentum betrachtet und weniger als Quellen behandelt würden, die für andere Forschende auch von Interesse sein können. Zweitens warf die Referentin die Frage der Archivierung auf, die im besten Falle ein Transkript, eine Audiodatei, eine Einverständniserklärung und eine Kontextbeschreibung umfassen sollte. Eine Dokumentation dessen, was vor, während und nach dem Interview geschehen ist, sei für die spätere Kontextanalyse hilfreich. Gleichzeitig und damit drittens entstünden gerade durch die Archivierung und Nachnutzung spezifische forschungsethische Fragen. Insbesondere der Einwilligungserklärung, die sowohl von Befragten als auch von den Interviewenden unterschrieben werden sollte, komme dabei eine zentrale Bedeutung zu. Da im Rahmen einer Zweitanalyse auch die Interviewenden zu Forschungsobjekten werden können, sollte dies in der Einwilligungserklärung berücksichtigt werden. Das sei schon deshalb notwendig, um die Interviewten auf diese Möglichkeit hinzuweisen und auch die Interviewenden ausdrücklich daran zu erinnern. Denn auch wenn Zweitinterpretationen nicht zu kontrollieren sind, seien die entstehenden Problemlagen aus ethischen Gründen zu erwähnen. Apel plädierte deswegen für eine sorgfältigere methodische Konzeption von Interviewprojekten, die Einplanung von Zeit und finanziellen Ressourcen, um die Daten nach Abschluss eines Projektes archivierbar zu machen, und eine größere Offenheit seitens der regulären Archive, Interviews trotz Aufwand und Kosten zu archivieren.
In der anschließenden Diskussion wurde unter anderem das Verhältnis von Anonymisierung und damit einhergehender Dekontextualisierung diskutiert. Hier sei es Abwägungssache, wie weit die Anonymisierung im Einzelfall umgesetzt werden sollte. Vorgeschlagen wurde, Einwilligungserklärungen so abzufassen, dass zukünftige maschinelle Auswertungsmöglichkeiten, z.B. des distant reading, nicht ausgeschlossen seien.
CLEMENS REHM (Stuttgart), Abteilungsleiter im Landesarchiv Baden-Württemberg, systematisierte seine Überlegungen zur zeithistorischen Forschung mit Archivgut im Zeitalter der Datenschutzgrundverordnung. Zunächst legte er dar, welche Aspekte der DSGVO bereits in den Archivgesetzen enthalten und welche neu hinzugekommen sind. Die Auswirkungen der DSGVO als neuer rechtlicher Rahmen auf die Arbeit der Archive zeige sich in einem veränderten Bewusstsein und einer Verschiebung von der Frage „kann das weg?“ zu der Frage „muss das weg?“ Vor allem bei der Übernahme, der Erschließung und beim Zugang zu Sozialdaten seien bei den Archiven neue Verfahren und eine höhere Sensibilität vor dem Hintergrund der DSGVO die Folge. Es wurde deutlich, dass verschiedene Interessen und Rechte – in unterschiedlichen Gesetzen geregelt – ausgeglichen und jeweils abgewogen werden müssen. Dazu gehören Betroffenenrechte, Informationsrechte, das Recht auf Mitbestimmung bei der Verarbeitung und das Recht der Archive auf Schaffung eines Gedächtnisses, schließlich das Recht der Forschung, Daten zu nutzen. Die unterschiedlichen Denkweisen, die sich im Datenschutz und in den Archivgesetzen hinsichtlich personenbezogener Daten zeigen, spiegeln sich auch, wie Rehm hervorhob, im unterschiedlichen Umgang mit Daten und ihrer Zugänglichkeit. Während Datenschützer den Schutz der einzelnen Person anhand von Einzelinformationen im Blick hätten, gelte aus Archivsicht die Akte als maßgebliche Einheit, an der das rechtliche Handeln und die Frage der Zugänglichkeit entschieden würden. Außerdem besteht der wesentliche Unterschied zwischen DSGVO und Archivgesetz in der Regelung der Zugangsmöglichkeiten: Für Archive gelten die archivischen Schutz- und Sperrfristen in Bezug auf personenbezogene Daten. Diese enden in der Regel 10 Jahre nach dem Tod, während die DSGVO sich auf die Verarbeitung von Daten lebender Personen bezieht. Insgesamt sei die Rolle der Archive als Gestalter des Erinnerns und Vergessens durch die DSGVO gestärkt worden, ihnen sei ein privilegierter Status eingeräumt worden, hätten sie doch die rechtlichen Möglichkeiten, zu „sicheren Datenhäfen“ mit verlässlichen Quellen zu werden, wenn die Datenbestände alt genug sind, um die gestaffelten Schutzfristen einzuhalten. Fraglich sei hingegen die Rolle von Institutionen, die Daten halten, aber nicht dem Archivrecht unterliegen: Welche Regelungen sollten hier zur Anwendung kommen? Hier knüpfte der Vortrag auch an die am Vortag geführte Diskussion über die Selbstdefinition von FDZ wie eLabour und Qualiservice an. Außerdem stelle sich die Frage, wie in Zukunft mit dem erweiterten Schutzbedürfnis, das sich durch die leichtere Verknüpfbarkeit großer Datenmengen ergibt, umgegangen wird.
In der anschließenden Diskussion wurde deutlich, dass der Anspruch an Sozialdaten von Seiten der Geschichtswissenschaft ein anderer ist als derjenige der Sozialwissenschaften. Dies sei vor allem in Bezug auf Pseudonymisierung und unterschiedliche Interpretationen der Anwendung rechtlicher Ausgangslagen bedeutsam. Auch wurde darauf verwiesen, dass Institutionen, die Daten halten und archivieren, aber nicht dem Archivgesetz unterliegen, eine andere Stellung und damit andere Möglichkeiten des Auftretens gegenüber Datengebern und -nehmern hätten.
Im letzten Vortrag präsentierte FLORIAN SCHMALTZ (Berlin) die digitale Infrastruktur des Forschungsprogramms zur Geschichte der Max-Planck-Gesellschaft (GMPG) von 1948 bis 2005. Er berichtete, dass mit Beginn des Forschungsprogramms im Jahre 2014 für die projektrelevanten Akten in der Alt-Registratur der Generalverwaltung der MPG in München mehrere Aktenpläne existierten, die allerdings keinen Gesamtüberblick boten. Die entsprechenden Verwaltungsakten im Archiv der MPG in Berlin wurden 2014 ohne archivfachliche Verzeichnung vorgehalten. Um für die Forschung einen vorläufigen Gesamtüberblick der Aktenüberlieferung der Generalverwaltung der MPG zu generieren, habe das Forschungsprogramm die Akten in einer eigenen Datenbank erfasst. Seit 2014 wurden gemäß verabschiedetem Archivstatut fortwährend Unterlagen durch das Archiv in Berlin übernommen.3 Sowohl die Erschließung als auch die technische Bearbeitung sei dort prioritär betrieben worden. Im Resultat konnten die durch das Programm archivfachlich erschlossenen Archivbestände digitalisiert werden.
Im zweiten Teil stellte Schmaltz die „Aktenzugangsregelung“ und das Datenschutzkonzept für die digitalisierten Bestände vor. Das Forschungsprogramm habe von der MPG eine außerordentliche Aktenzugangsregelung erhalten, die auf dem Archivstatut aufsetze. Den Aktenzugang regelt im Archiv der MPG ein durch die Leitung der MPG erlassenes Archivstatut, das sich inhaltlich an den Archivgesetzen des Bundes und der Länder orientiert. Wie Schmaltz darlegte, fielen aufgrund des bis 2005 reichenden Untersuchungszeitraum zahlreiche Akten, unter die im Archivrecht verankerte, dreißigjährige Schutzfrist. Rechtliche Grundlage der von der MPG für das Forschungsprogramm getroffenen Aktenzugangsregelung bilden daher, sowohl archivrechtliche Regelungen als auch das Datenschutzrecht. Die Aktenzugangsregelung ermögliche es Angehörigen des Forschungsprogramms, auch Akten, deren Laufzeit bis zum Jahr 2005 reicht, auszuwerten, ohne in jedem Einzelfall eine Schutzfristverkürzung beantragen zu müssen. Das durch die Leitung der MPG entwickelte interne Genehmigungsverfahren gewährleiste, so Schmaltz, Wissenschaftsfreiheit, Datenschutzrecht und Persönlichkeitsrechte miteinander in Einklang zu bringen. Das Datenschutzkonzept unterscheide drei Schutzstufen: Öffentlich zugängliches Material (Stufe I), für das GMPG-Projekt zugängliche Archivunterlagen und Sachakten (Stufe II) sowie datenschutzsensible personenbezogene Unterlagen (Stufe III). Für Akten der Stufe III müsse der Zugang bei der Leitung des Forschungsprogramms beantragt und zweckgebunden begründet werden. Die Entscheidung über die Rechtsgüterabwägung dokumentiere die Projektleitung. Schmaltz betonte, dass die verschiedenen Novellen im Archivrecht, das Bundesdatenschutzgesetz und die DSGVO ein hohes Maß an „Autonomie und Selbstverantwortung der wissenschaftlichen Forschung im Umgang mit Forschungsdaten“ ermöglichen und die Aktenzugangsregelung größtmögliche Unabhängigkeit in der Forschung garantiert. Eine Nutzung durch externe Dritte sei bis zum Ende des Forschungsprogramms nicht vorgesehen. Entsprechend der vom Senat der MPG 2003 verabschiedeten „Regeln guter wissenschaftlicher Praxis“ ist für Forschungsdaten, zu der die digitale Infrastruktur des Forschungsprogramms GMPG gehören, eine „zuverlässige Sicherung und Aufbewahrung der Primärdaten für 10 Jahre“ und eine „eindeutige und nachvollziehbare Dokumentation der angewandten Verfahren“ sicherzustellen.4 Um die wissenschaftliche Überprüfbarkeit von Forschungsergebnissen anhand der Primärdaten zu gewährleisten, würden entsprechenden Zugangsregelungen vor Projektende von der MPG festgelegt.
In der Diskussion empfahlen Herr Rehm und Herr Schmaltz auch in sozialwissenschaftlichen Institutionen für die langfristige Nachnutzung ihrer Daten für Sekundäranalysen oder die historische Forschung Zugangsmöglichkeiten zu schaffen, die sich am Archivrecht orientieren. In der Diskussion bestand zwischen Archivaren und Historikerinnen und Historikern Konsens, dass die auf dem Workshop vorgestellte Praxis einiger FDZ, arbeitsintensive Anonymisierungen und teilweise Löschungen von Daten und personenbezogenen Informationen vorzunehmen, durch die Anwendung des Archivrechts obsolet würde. Löschungen und Anonymisierungen wurden als forschungshinderlich kritisiert. Orientierung böte das von Archiven praktizierte Verfahren der Schutzfristenverkürzung, das u.a. die Verantwortlichkeit der Wahrung von Persönlichkeits- und Datenschutzrechten auf die Nutzenden überträgt. Zum Abschluss regte Herr Schmaltz die Einrichtung interdisziplinärer Ethikkommissionen an, um angesichts der zunehmenden Verschmelzung von Archiven und Rechenzentren neu auftretende rechtliche und forschungsethische Fragen den Austausch zwischen Datenschutzbeauftragten, Vertreterinnen und Vertretern aus Archiven, Rechenzentren und der historischen Forschung zur Entwicklung von „best practice“-Verfahren zu fördern.
Die abschließende Debatte leitete Lutz Raphael ein, indem er drei übergreifende Punkte identifizierte. Erstens würden Sozialdaten häufig von Institutionen archiviert, die auf der Grundlage des Vereinsrechts organisiert seien und beim Datenschutz die Regeln der DSGVO anwenden müssen und nicht das Bundes- oder die jeweiligen Landesarchivgesetze. Zweitens nähmen Forschende aus der Zeitgeschichte, Expertinnen und Experten im Feld des Archivrechts sowie die Akteure aus den FDZ die rechtlichen und ethischen Regeln der Archivierung und Bereitstellung von Sozialdaten unterschiedlich wahr, und es herrsche deswegen eine allgemeine Rechtsunsicherheit. Für die Zeitgeschichte sei es notwendig, die eigenen Bedürfnisse offensiver zu formulieren und an die FDZ heranzutragen. Drittens befürchtete Raphael, dass durch die zehnjährige Aufbewahrungspflicht, die sich aus den Regeln einer guten wissenschaftlichen Praxis ergebe, und den längeren archivischen Schutzfristen Datenverluste entstehen könnten. In dieser Lücke werden Sozialdaten ggf. zwar noch verwahrt, stehen den Forschenden womöglich aber erst nach 30 Jahren zur Verfügung. Es wurde angeregt, archivähnliche Institutionen wie die FDZ nach österreichischem Vorbild zu akkreditieren, um auch wissenschaftlichen Datenrepositorien die Privilegien einzuräumen, die die DSGVO den Archiven einräumt, das öffentliche Interesse an den gesammelten Forschungsdaten zu bestätigen und eine Qualitätssicherung bei Fragen der Ethik und des Datenschutzes zu gewährleisten. Ein Teilnehmer sprach sich für die Einführung von standardisierten Zertifizierungsprozessen für die FDZ aus, um einheitliche und nachvollziehbare Rechtsgrundlagen zu gewährleisten. Die Frage, ob es für die FDZ sinnvoll ist, sich selbst als Archiv zu verstehen, konnte im Laufe der Diskussion nicht abschließend geklärt werden. Vor allem die Vertreter der FDZ griffen die Anregung von Lutz Raphael auf und bekräftigten, dass es im Moment an Erfahrungen im praktischen Austausch mit Forschenden aus der Zeitgeschichte mangele und deswegen auch nur wenig darüber bekannt sei, wie sich die Anonymisierung der Forschungsdaten auf die Erkenntnisse auswirke und welche Kontextinformationen die Zeitgeschichte benötige.
Als eine Leerstelle des Workshops erwies sich das Thema Forschungsethik und Sozialdaten. Lutz Raphael und Pascal Siegers (Köln) betonten übereinstimmend, dass die Verantwortung für Ethik und Datenschutz sowohl von den Archiven bzw. FDZ und den Forschenden gemeinsam getragen werden sollte. Was rechtlich möglich und dabei gleichzeitig forschungsethisch vertretbar ist, bleibt eine der weiterhin offenen Fragen, denen sich mit Sozialdaten arbeitende Zeithistorikerinnen und Zeithistoriker zukünftig noch intensiver widmen müssen und für die möglicherweise auch neue Foren und institutionelle Orte geschaffen werden müssen.
Der Bericht wurde am 01.02.2021 bearbeitet und liegt jetzt hier in einer geänderten Version den Redebeitrag von Florian Schmaltz betreffend vor.
Konferenzübersicht:
Albrecht von Kalnein (Bad Homburg), Lutz Raphael (Trier): Einführung
Wolfgang Dunkel (München): Stand der Diskussionen und Lösungswege für die sekundäranalytische und zeitgeschichtliche Nutzung der industrie- und arbeitssoziologischen Archive und Institute im Verbund e-labour
Jan-Ocko Heuer (Bremen): Stand der Diskussionen und Lösungswege für die Archivierung und Nachnutzung von qualitativen sozialwissenschaftlichen Forschungsmaterialien beim Forschungsdatenzentrum Qualiservice
Linde Apel (Hamburg): Interviews als Forschungsdaten. Hinweise zu Sekundäranalyse und Forschungsethik
Clemens Rehm (Stuttgart): Das „Recht auf Vergessenwerden“ und die Archive. Zur zeitgeschichtlichen Forschung mit Archivgut im Zeitalter der Datenschutzgrundverordnung
Florian Schmaltz (Berlin): Die Ausgestaltung der Forschungsinfrastruktur zur Geschichte der Max-Planck-Gesellschaft nach den rechtlichen Grundlagen der Datenschutzverordnung
Anmerkungen:
1 www.elabour.de.
2https://www.qualiservice.org.
3https://www.archiv-berlin.mpg.de/41349/rechtsgrundlagen
4https://www.mpg.de/ueber_uns/verfahren