Zeitschrift für digitale Geisteswissenschaften (ZfdG) 2 (2017)

Titel der Ausgabe 
Zeitschrift für digitale Geisteswissenschaften (ZfdG) 2 (2017)
Weiterer Titel 

Erschienen
Wolfenbüttel 2017: Selbstverlag
Erscheint 
jährlich
Preis
Open Access

 

Kontakt

Institution
Zeitschrift für digitale Geisteswissenschaften (ZfdG)
Land
Deutschland
c/o
Lisa Klaffki / Torsten Kahlert -Redaktionsverantwortliche- Herzog August Bibliothek Lessingplatz 1 D-38304 Wolfenbüttel Tel.: +49 (0) 5331 808 214 zfdg@mww-forschung.de
Von
Kahlert, Torsten

Inhaltsverzeichnis

Turing Test für das Topic Modeling. Von Menschen und Maschinen erstellte inhaltliche Analysen der Korrespondenz von Leo von Thun-Hohenstein im Vergleich
Peter Andorfer
https://doi.org/10.17175/2017_002

»Delta« in der stilometrischen Autorschaftsattribution
Andreas Büttner, Friedrich Michael Dimpel, Stefan Evert, Fotis Jannidis, Steffen Pielström, Thomas Proisl, Isabella Reger, Christof Schöch und Thorsten Vitt
https://doi.org/10.17175/2017_006

Einsatz von Topic Modeling in den Geschichtswissenschaften: Wissensbestände des 19. Jahrhunderts
Martin Fechner und Andreas Weiß
https://doi.org/10.17175/2017_005

Die Vernetzung des Textes: Im Möglichkeitsraum digitaler Literaturanalyse
Christine Ivanovic
https://doi.org/10.17175/2016_010

Etwas für alle – Ausgewählte Texte von und mit Abraham a Sancta Clara digital
Claudia Resch
https://doi.org/10.17175/2016_005

Digitale Gattungsgeschichten. Minnesang zwischen generischer Konstanz und Wende
Gabriel Viehhauser
https://doi.org/10.17175/2017_003

Abstracts (de/en)

Peter Andorfer: Turing Test für das Topic Modeling. Von Menschen und Maschinen erstellte inhaltliche Analysen der Korrespondenz von Leo von Thun-Hohenstein im Vergleich.
Wer ist schlauer? Mensch oder Maschine? Die Antwort auf diese Frage wird seit 1950 mit Alan Turing und dem von ihm konzipierten Turing Test verknüpft. Daran anknüpfend vergleicht vorliegender Aufsatz inhaltliche Analysen eines historischen Briefwechsels, die einmal ›vom Menschen‹ mittels ›close reading‹ und anschließender Vergabe von Schlagworten und einmal ›von der Maschine‹ mittels Topic Modeling erzeugt wurden. Neben der konkreten Evaluierung des Topic Modeling Verfahrens wirft dieser Aufsatz auch die Frage auf, ob und wieweit es möglich und vertretbar ist, Methoden einzusetzen, die ohne tiefere Kenntnisse von Wahrscheinlichkeitsberechnungen und Statistik kaum noch gänzlich verstanden werden können.

Who is cleverer, man or machine? Since the 1950s, the answer to this question has been linked to Alan Turing and the Turing test he devised. This paper builds upon this foundation with its comparison of two analyses of a historical collection of correspondence: one created by humans using ›close reading‹ and the application of subject terms, and one generated by machines with the help of topic modeling. In addition to concrete evaluation of the topic modeling process, this paper investigates whether, and, if so, to what extent, it is feasible and justifiable to use methods that can hardly be understood without in-depth knowledge of probability calculations and statistics.

Andreas Büttner, Friedrich Michael Dimpel, Stefan Evert, Fotis Jannidis, Steffen Pielström, Thomas Proisl, Isabella Reger, Christof Schöch und Thorsten Vitt: »Delta« in der stilometrischen Autorschaftsattribution.
Der Artikel stellt aktuelle stilometrische Studien im Delta-Kontext vor. (1) Diskutiert wird, warum die Verwendung des Kosinus-Abstands zu einer Verbesserung der Erfolgsquote führt; durch Experimente zur Vektornormalisierung gelingt es, die Funktionsweise von Delta besser zu verstehen. (2) Anhand von mittelhochdeutschen Texten wird gezeigt, dass auch metrische Eigenschaften zur Autorschaftsattribution eingesetzt werden können. Zudem wird untersucht, inwieweit die mittelalterliche, nicht-normierte Schreibung die Erfolgsquote von Delta beeinflusst. (3) Am Beispiel von arabisch-lateinischen Übersetzungen wird geprüft, inwieweit eine selektive Merkmalseliminierung dazu beitragen kann, das Übersetzersignal vom Genresignal zu isolieren.

In this article, we present current stylometric studies on Delta. (1) We discuss why the use of cosine similarity improves the rate of success; our experiments on vector normalization lead to a better understanding of how Delta works. (2) Based on a corpus of Middle High German texts, we show that metrical properties can also be used for authorship attribution. The degree to which Delta is influenced by non-normalized medieval spellings is also investigated. (3) Using a corpus of Arabic-Latin translations, we explore how selective feature elimination can be used to separate the translator signal from the genre signal.

Martin Fechner und Andreas Weiß: Einsatz von Topic Modeling in den Geschichtswissenschaften: Wissensbestände des 19. Jahrhunderts.
Das Digitale erlangt in den Geschichtswissenschaften zunehmend eine besondere Stellung. Es wird sowohl als Forschungsthema wahrgenommen, als auch als Möglichkeit, die Geschichtswissenschaften methodisch und technisch zu unterstützen. Trotz dieses breiten Interesses werden Projekte, die sich neuer, digitaler Forschungsmittel und -methoden wie Topic Modeling bedienen, weiterhin besonders kritisch hinterfragt. Der Beitrag will daher konkret an zwei Projektbeispielen zeigen, wie die Ansätze des Topic Modelings genutzt und weiterentwickelt werden können, um die historische Forschung zu unterstützen. Beide Projekte beschäftigen sich mit Wissensbeständen des 19. Jahrhunderts, zum einen im Kontext der wissenschaftlichen Durchsetzung der Spektralanalyse und zum anderen im Kontext des Geschichtsunterrichts im Wilhelminismus. Dabei wird deutlich, wo Topic Modeling noch verbessert werden kann und welche Rolle die klassische Hermeneutik als zentraler Bestandteil der Anwendung eines historischen Topic Modelings spielen muss. Der Beitrag zeigt so Grenzen und Reichweiten der Einsatzmöglichkeiten von Topic Modeling in den Geschichtswissenschaften auf.

Within the discipline of history, digital approaches, tools, and research methods are taking on increasing importance as both a research topic in its own right and as a way to support the field of history as a whole. In spite of this broad interest, projects that make use of new digital tools and methods such as topic modeling continue to be reviewed very critically. Using two projects as examples, this article therefore demonstrates how topic modeling can be used and further developed in order to support historical research. Both projects deal with bodies of knowledge from the 19th century, one in the context of the scholarly implementation of spectral analysis and the other within the context of historical education during the period of the German Emperor Wilhelm II. Through these examples, this article shows where topic modeling can still be improved and what role traditional hermeneutics must have as a central component in the application of topic modeling in the field of history, and thus the boundaries and capabilities of the use of topic modeling in historical research.

Christine Ivanovic: Die Vernetzung des Textes: Im Möglichkeitsraum digitaler Literaturanalyse.
Die Digitalisierung von Texten, die Erarbeitung komplexer digitaler Editionen und die Herstellung maschinell analysierbarer Korpora sind Hauptaufgaben gegenwärtiger digitaler Philologie. Diese baut vielfach auf Methoden und Erkenntnissen auf, wie sie in der Computerlinguistik seit Jahrzehnten erprobt werden. Sie müssen jedoch für die Anforderungen der literaturwissenschaftlichen Analyse beispielsweise in ihrer Granularität angepasst werden. Der Beitrag skizziert mögliche Vorgehensweisen bei der digitalen Verarbeitung großer Textmengen respektive der Entwicklung komplexer Annotationsverfahren. Sie verändern die Ausgangssituation philologischer Forschung noch weiter, wenn die Texte im Internet verfügbar sind. Daher werden in einem zweiten Schritt die daraus sich ergebenden neuen Möglichkeiten der Analyse literarischer Texte diskutiert. Neben der Entwicklung von Verfahren zur systematischen und nachprüfbaren Literaturanalyse großer Textkorpora geht es dabei um die Darstellung der Mehrdimensionalität literarischer Texte durch Datenverknüpfung im Semantic Web. Literarische Texte können dadurch auch anderen Disziplinen zur Evaluierung zugänglich gemacht werden.

The main tasks of contemporary digital philology are the digitization of texts, the development of complex digital editions, and the creation of text corpora that can be analyzed by machines. These activities build on methods and findings that have been explored in computer linguistics for decades. There is, however, a need to adapt those procedures to the requirements of literary analysis, such as in their granularity. This paper outlines possible approaches for the digital processing of large volumes of text and for the development of complex annotation processes. These methods change the very basis of literary analysis, especially if the texts are available on the internet. The next step, therefore, is to discuss the new possibilities for the analysis of literary text that arise from this situation. These possibilities go beyond the mere development of procedures for systematic and verifiable literary analysis of large text corpora. One new step, for example, would be the representation of multi-dimensional qualities of literary texts by data linkage in the Semantic Web, which could make literary texts available for other disciplines as well.

Claudia Resch: Etwas für alle – Ausgewählte Texte von und mit Abraham a Sancta Clara digital.
In einer web-basierten Edition werden am Austrian Centre for Digital Humanities ausgewählte Texte von und mit Abraham a Sancta Clara mit innovativen, digitalen Methoden erschlossen. Die Texte sind Teil des sogenannten Austrian Baroque Corpus (ABaC:us) und stehen anmeldungsfrei unter https://acdh.oeaw.ac.at/abacus/ online zur Verfügung. Welche grundsätzlichen Entscheidungen in der Praxis der Annotation und bei der Visualisierung der Daten getroffen worden sind, damit die Ressource idealiter »Etwas für alle« bieten und sowohl sprachwissenschaftlichen als auch literatur- und kulturwissenschaftlichen Forschungsinteressen dienlich sein kann, ist eine der Fragen, mit der sich vorliegender Beitrag näher beschäftigt.

This paper aims to introduce a new web-based digital edition of printed German texts written by or ascribed to Abraham a Sancta Clara, who was a renowned Augustinian monk and a widely read author at his time. The texts are part of the thematic memento mori research collection, Austrian Baroque Corpus, now freely available through the Austrian Centre for Digital Humanities: https://acdh.oeaw.ac.at/abacus/ One of the main considerations of the paper was how to shape the annotation process in a way that would meet the needs of linguistic, literary and cultural studies. This objective necessitated a user-friendly visualization that would be suitable to the research questions of a broader audience.

Gabriel Viehhauser: Digitale Gattungsgeschichten. Minnesang zwischen generischer Konstanz und Wende.
Digitale Analysen literarischer Gattungen gehen häufig davon aus, dass sich Gattungen anhand konstant bleibender Features identifizieren lassen. Gattungen können jedoch immer auch als geschichtliche Verlaufsformen mit historisch veränderlichen Features rekonstruiert werden. Der Beitrag möchte exemplarisch anhand eines prominenten Beispiels aus der mittelhochdeutschen Literatur, nämlich des Minnesangs, aufzeigen, wie und dass sich gattungsgeschichtliche Entwicklungen mit digitalen Methoden nachzeichnen lassen. Mit Hilfe von Frequenzanalysen und Topic Modeling soll der in der Forschung viel diskutierten Frage nachgegangen werden, ob es im Verlauf des Minnesangs zu einer gattungsgeschichtlichen Wende kam, die die Lyrik der Spätzeit vom ›klassischen‹ Sang unterscheidet.

Digital analyses of literary genres are often based on the assumption that genres can be identified through constant and unvarying features. However, genres always reveal themselves as historically-based constructs with features that change and evolve over time. This paper illustrates how such historical developments in genres can be retraced with digital methods by means of a prominent example from Middle High German literature, Minnesang. With the help of frequency analysis and topic modeling, a research question which has been much debated will be discussed: whether there was an historical shift in genre during the development of Minnesang that differentiates the lyric poetry of the later period from ›classical‹ Sang.

Weitere Hefte ⇓
Redaktion
Veröffentlicht am