Text Mining mit R. Toxizitätserkennung in historischen Drucken der Staatsbibliothek zu Berlin

Veranstalter

Stabi Lab an der Staatsbibliothek zu Berlin (Staatsbibliothek zu Berlin)

Ausrichter

Staatsbibliothek zu Berlin

PLZ

10117

Ort

Berlin

Land

Deutschland

Findet statt

In Präsenz

Vom - Bis

21.09.2023 - 21.09.2023

Deadline

20.09.2023

Website

https://lab.sbb.berlin/events/text-mining-mit-r/

Von

Dr. Jörg Lehmann, Staatsbibliothek zu Berlin

Kulturerbe-Einrichtungen verfügen über umfangreiche Sammlungen, die oft über lange Zeiträume hinweg zusammengetragen wurden. Die Sammlungen spiegeln daher die kulturellen und gesellschaftlichen Normen der jeweiligen Zeit wider. Infolgedessen können sie Begriffe enthalten, die in unserer gegenwärtigen Gesellschaft als unangemessen wahrgenommen werden. Zugleich macht es der Umfang des digitalisierten Materials schwierig, problematische Begriffe zu erforschen und zu kontextualisieren.

Text Mining mit R. Toxizitätserkennung in historischen Drucken der Staatsbibliothek zu Berlin

Dieser Workshop nimmt das Problem einer veralteten Sprache und der Verwendung toxischer Begrifflichkeit in den digitalisierten Sammlungen der Staatsbibliothek zu Berlin in den Blick. Mit Hilfe von Methoden der Digital Humanities führen Teilnehmende maschinelle Auswertungen eines kleinen Textkorpus (20–30 Texte) durch. Basale Text Mining-Verfahren wie wordfrequency und word clouds, tf-id, Bi- und Trigramme (n-Gramme) sowie die Berechnung von Wortassoziationen werden vorgestellt. Die Teilnehmenden lernen grundlegende Text Mining-Verfahren mit Hilfe des statistischen Softwarepakets R kennen und werden dazu befähigt, eine quantifizierende Auswertung von Texten in R vorzunehmen. Als Beispiele dienen Volltexte aus den digitalisierten Sammlungen der Staatsbibliothek zu Berlin, die rassistische, diskriminierende oder homophobe Begriffe enthalten, also abwertende Wörter und Ausdrücke, die nicht mit den Werten und der Ethik einer Kulturerbe-Einrichtung wie der Staatsbibliothek zu Berlin in Einklang stehen.

Kontakt

E-Mail: joerg.lehmann@sbb.spk-berlin.de

https://lab.sbb.berlin/events/text-mining-mit-r/

Zitation

Text Mining mit R. Toxizitätserkennung in historischen Drucken der Staatsbibliothek zu Berlin., In: H-Soz-Kult, 21.07.2023, <www.hsozkult.de/event/id/event-137754>.

Copyright (c) 2024 by H-NET, Clio-online and H-Soz-Kult, and the author, all rights reserved. This work may be copied and redistributed for non-commercial, educational purposes, if permission is granted by the author and usage right holders.. For permissions please contact hsk.redaktion@geschichte.hu-berlin.de.

Nach oben ⇑

< zurück 17 / 190 Termine vorwärts >

Redaktion

Veröffentlicht am

21.07.2023

Autor(en)

Jörg Lehmann

Beiträger

Jörg Lehmann

Zitation ⇓