Der Scholarly Makerspace an der UB der HU Berlin stellt sich vor

Wie tüfteln wir eigentlich?

Till Grallert, Sophie Eckenstaler, Samantha Tirtohusodo

Humboldt-Universität zu Berlin, Universitätsbibliothek, Grimm-Zentrum

DFG-Projekt “Future e-Research Support in the Humanities” (2022–25)

https://makerspace.hypotheses.org/

Wir bauen im Rahmen des DFG-Projekts “Future e-Research Support in the Humanities” an der Universitätsbibliothek der Humboldt-Universität zu Berlin unter Beteiligung der Lehrstühle für Digital History (Inst.f. Geschichtswissenschaften) und Information Processing and Analytics (Inst.f. Bibliotheks- und Informationswissenschaften) einen prototypischen Scholarly Makerspace zur Förderung digitaler und computationaler Werkzeugkompetenz (tool literacy) in den Geistes- und Kulturwissenschaften auf (2022–25).

Sophie Eckenstaler
Till Grallert, PhD
Samantha Tirtohusodo

Wie arbeiten wir?

Die Blackbox

The term black box […] is a device or system that, for convenience, is described solely in terms of its inputs and outputs. One need not understand anything about what goes on inside such black boxes. One simply brackets them as instruments that perform certain valuable functions. (Winner „Upon opening the black box“ 1993, 365)

Minimal computing

Das Haus ist gebaut aus den Steinen, die vorhanden waren (Brecht „Schlechte Zeiten“ 1967).

Im Sinne des minimal computing ist das Spannungsfeld aus “was brauchen wir?” und “was haben wir?” handlungsleitend. (Gil und Ortega „Global Outlooks in Digital Humanities“ 2016)

  • Kontextabhängig
  • Hilfe zur Selbsthilfe
  • Fokus auf methodische Zugänge mit beispielhafter Implementation

Was haben wir um sie zu öffnen?

Was ist in unserem Werkzeugkoffer?

        flowchart LR
            %% nodes
            software{Software}
            hardware[Hardware]
            method((Verfahren))
            theory(Theorien)
            format[Formate]
            language{{Sprachen}}
            concept(Konzepte)

            %% edges: note that the layout does not imply hierarchies
            theory -->|informiert| method
            method -->|wird umgesetzt\ndurch| software
            method & format & language & software -.->|benutzen| concept
            software -->|benötigt| hardware
            software -->|geschrieben in| language
            software -->|benötigt zur\nInteraktion| language
            software -->|liest| format
            software -->|schreibt| format

            %% classes
            classDef software fill:#ECA7F9
            classDef language fill:#F24726
            classDef concept fill:#F9C710
            classDef format fill:#8BCA4B
            classDef method fill:#00dada
            class method method
            class software software
            class concept concept
            class format format
            class language language
        

Inwiefern beherrschen wir ein Werkzeug?

Operationalisierung

Beispiel: Werzeugliste

Wir bauen einen Scholarly Makerspace auf und wollen eine Liste von Werkzeugen kuratieren, die auf der Häufigkeit ihrer Benutzung in der Forschung beruht (Unsere eigene User Story).

Table 1: Absolute und relative Häufigkeiten von “Werkzeugen” in 1036 ADHO Konferenz-Abstracts, 2014–18
term freq freq.rel
R 259 1
TEI 155 0.6
internet 134 0.52
NLP 118 0.46
XML 117 0.45
GitHub 98 0.38
API 88 0.34
OA 77 0.3
ML 76 0.29
GIS 70 0.27
topic modeling 67 0.26
LOD 66 0.25
Python 66 0.25
OCR 64 0.25
network analysis 62 0.24
Figure 1: Wordcloud der relativen Häufigkeiten von “Werkzeugen” in ADHO Konferenz-Abstracts, 2014–18

Beispiel: Werzeugliste

Wir bauen einen Scholarly Makerspace auf und wollen eine Liste von Werkzeugen kuratieren, die auf der Häufigkeit ihrer Benutzung in der Forschung beruht (Unsere eigene User Story).

Table 2: 1036 ADHO Konferenz-Abstracts,
2014–18
term freq freq.rel
R 259 1
TEI 155 0.6
Internet 134 0.52
NLP 118 0.46
XML 117 0.45
GitHub 98 0.38
API 88 0.34
OA 77 0.3
ML 76 0.29
GIS 70 0.27
Topic Modeling 67 0.26
LOD 66 0.25
Python 66 0.25
OCR 64 0.25
network analysis 62 0.24
distant reading 50 0.19
RDF 50 0.19
NER 48 0.19
text mining 38 0.15
LDA 37 0.14
Table 3: 429 Artikel in DHQ,
2007–19
term freq freq.rel
TEI 138 1
XML 105 0.76
R 84 0.61
OA 65 0.47
distant reading 53 0.38
GitHub 50 0.36
API 47 0.34
ML 44 0.32
GIS 43 0.31
NLP 40 0.29
OCR 39 0.28
RDF 36 0.26
text mining 36 0.26
Python 34 0.25
Java 31 0.22
network analysis 30 0.22
Topic Modeling 30 0.22
JS 27 0.2
NER 19 0.14
MySQL 18 0.13
Table 4: 15873 DFG-Abstracts,
1982–2022
term freq freq.rel
OA 115 1
R 83 0.72
GIS 67 0.58
XML 59 0.51
TEI 51 0.44
OCR 28 0.24
LOD 18 0.16
P5 17 0.15
NLP 15 0.13
FAIR 12 0.1
ML 11 0.1
IIIF 9 0.08
Java 9 0.08
METS 9 0.08
WWW 9 0.08
Tableau 8 0.07
FuD 7 0.06
MEI 7 0.06
ANNIS 6 0.05
API 6 0.05

Forschungsprozess

[Diese Prozesse sind alle von rechts nach links zu lesen. Die Forschungsfrage bestimmt Methode und benötigte Datengrundlage]

Wir groß sind die Blackboxes?

Unsere Erwartungen und Wünsche

Wir groß sind die Blackboxes?

Die (bittere) Realität

Datenerfassung: konzeptionell

Eingabe —> Verarbeitung —> Ausgabe

Datenerfassung: Werkzeugliste

Eingabe —> Verarbeitung —> Ausgabe

Datenerfassung: Web scraping

Eingabe —> Verarbeitung —> Ausgabe

Schluß / Danke!

Weitere Informationen

Literatur

Brecht, Bertolt. 1967. „Schlechte Zeiten“. In Gesammelte Gedichte, 3:963. Frankfurt am Main: Suhrkamp.
Gil, Alex, und Élika Ortega. 2016. „Global Outlooks in Digital Humanities: Multilingual Practices and Minimal Computing“. In Doing digital humanities: practice, training, research, herausgegeben von Constance Crompton, Richard J Lane, und Ray Siemens, 22–34. Abingdon: Routledge.
Winner, Langdon. 1993. „Upon opening the black box and finding it empty: Social constructivism and the philosophy of technology“. Science, Technology, & Human Values 18 (3): 362–78. https://doi.org/10.1177/016224399301800306.