Olaf Simons

„Wir brauchen einen neuen Umgang mit der zunehmend kollektiv vorliegenden Datenlage“

20. Juni 2019
4 Minuten lesen

Am Rechenzentrum der Universität Erfurt, nimmt – koordiniert vom Forschungszentrum Gotha – ein Datenbankprojekt Konturen an, das künftig Forschung mit historischer Ausrichtung auf breiter Fläche Digital- Humanities-Dienste zur Verfügung stellen soll. Im März 2019 hatten der Präsident der Universität Erfurt, Prof. Dr. Walter Bauer-Wabnegg, und Dr. Elisabeth Niggemann, die Generaldirektorin der Deutschen Nationalbibliothek in Frankfurt und Leipzig, dazu eine weitreichende Kooperationsvereinbarung unterzeichnet, die diese Plattform – das „FactGrid“ – auf GND-Daten aufsetzen und in ein größeres Gefüge von Datenanbietern führen soll. „WortMelder“ hat den Initiator, Olaf Simons, wissenschaftlicher Mitarbeiter am Forschungszentrum Gotha der Universität Erfurt, dazu einmal näher befragt…

Herr Simons, was genau ist „FactGrid“?
Das ist eine neuartige Datenbank, die wir in Gotha und Erfurt gezielt für die Bespielung mit historischen Daten nutzen und als offene Forschungsinfrastruktur zur Verfügung stellen. Tools zur Datenanlayse und Visualisierung sind dabei ebenso im Paket wie die Sicherheit, dass diese Plattform sowohl in ihrer Technik wie ihrem Datenbestand fortentwickelt wird.

Und diesen Service stellt die Uni Erfurt kostenlos zur Verfügung?
Ja, wir sind hier tatsächlich in einer glücklichen Lage, nicht zuletzt weil uns das Rechenzentrum großzügig unterstützt. Die Software – Wikibase – ist „open source“ und Wikimedia war interessiert daran, dass wir Wikibase im Pilotprojekt zum externen Einsatz bringen. Die Software wird sich rapide weiterentwickeln. Tools werden mit den verschiedenen Communities, die sich derzeit herausbilden, hinzukommen, und frei über die Suchfunktion laufen. Die Kooperation mit der Deutschen Nationalbibliothek wird dem Projekt zudem einen freien Grunddaten-Schatz einbringen: Millionen von Daten, auf die Forschung bei uns aufbauen kann – ein Entwicklungsziel, mit dem wir eine attraktive Alternative zur isolierten Unterbringung von Forschungsprojekten bieten wollen.

Was genau ist das Innovative am „FactGrid“?
Das ist vor allem die Software, Wikibase, mit gewaltigem Erfolg hinter Wikidata läuft und die derzeit von Normdatenanbietern weltweit evaluiert wird – eine Software, die sich als unglaublich flexibel erweist, als robust und transparent, und die dabei bahnbrechend auf Mehrsprachigkeit hin angelegt ist. Mit unserem Projekt bewegen uns in eine Landschaft – so der Plan – „föderierter“ Plattformen hinein, die miteinander Daten austauschen und sich dabei gegenseitig zitieren sollen. Wir wollen hier speziell der Forschung Freiräume anbieten, die Wikidata und die GND nicht wagen können. Dabei haben wir gute Karten: Wir waren schnell öffentlich. Die Deutsche Nationalbibliothek testet ihre Daten soeben auf verschiedenen internen Instanzen – unsere wird einen Schritt weitergehen und die öffentlich editierbare GND im Pilotprojekt anbieten. Die Normdatensätze, die die Forschung ohnehin benutzen soll, werden sich überdies bei uns korrigieren und beliebig erweitern lassen.

Und jetzt suchen Sie Mitstreiter, die das „FactGrid“ mit Daten anreichern. Wer genau kann sich denn beteiligen?
Die Datenbank steht allen offen, die Forschungsdaten mit historischer Dimension verwalten und auswerten möchten. Interessant ist das für Projekte, die derzeit vor der Frage stehen, ob sie eigene Datenbank-Strukturen aufbauen sollen. Sie können das FactGrid unmittelbar als Arbeitswerkzeug nutzen – als Zettelkasten, den beliebig vieler Mitarbeiter gemeinsam mit auswärtigen Projektpartnern bedienen können: Sie können Daten z.B. in amharischer Sprache in Äthiopien erheben und sie global nutzbar machen. Interessant ist das aber auch für Projekte, die weitgehend abgeschlossene Datensätze haben und nun nach Präsentationen suchen – dabei können Daten im Paket eingespielt und von eigenen Benutzeroberflächen aus abrufbar gemacht werden. Ist die Forschung abgeschlossen, bleibt die Datenlage auf der kollektiven Plattform der laufenden Korrektur und Erweiterung zugänglich. Aber spannend ist das natürlich auch für Studierende, die im Rahmen einer Seminararbeit eine beliebig kleine Datenpräsentation etwa auf einer Landkarte oder in einem Netzwerk suchen – bei uns muss keine Software auf den Rechner installiert werden. Sie erhalten eine Benutzerkennung und legen los.

Eigeninitiative ist indes bei der Handhabung gefragt. Wir können die Plattform zur Verfügung stellen. Eine Community, die sich auf der Plattform gegenseitig hilft, muss aber erst wachsen. Bis dahin ist die Wikidata-Community der Ansprechpartner, der das technische Know How hat und auf dessen Websites, Mailing-Lists und Foren man Austausch suchen muss. Wer die Datenbank nutzt, ist prinzipiell frei, beliebig eigene Aussagen zu Datenbankobjekten zu treffen und beliebig Objekte des spezifischen Forschungsinteresses anzulegen. Interessant ist es natürlich, das FactGrid auf die Kooperation hin zu nutzen. Wir sind dabei daran interessiert, dass Mitspieler ihre Arbeit auf dem Blog bewerben und exemplarische Datenauswertungen vorstellen. Im Moment lernen wir alle noch den Umgang mit der Software und ihren Tools. Ich bin da allenfalls erster Ansprechpartner.

Sie sprechen gezielt Projekte an, die soeben erst beginnen und die auf der Plattform von Anfang an transparent arbeiten sollen. Können Projekte das riskieren?
Da bestehen sicherlich Vorbehalte. Andererseits geht es hier nicht darum, die Thesen eines Buches zu früh auszubuchstabieren. Wir bieten die Chance, Daten und Quellen konstruktiv zu nutzen und über die eigenen Daten mehr Klarheit zu gewinnen. Alle „Edits“ sind dabei namentlich versioniert. Wir ermutigen zudem alle „Mitspieler“, eigene Datenbank-Items zur eigenen Forschung zu generieren und diese mit den bearbeiteten Datensätzen. Bei uns können sie aufzeigen, was sie an Daten erhoben haben. Finden sie beispielsweise heute einen verlorenen Zusammenhang im Archiv heraus und stellen sie den Zusammenhang im FactGrid her, haben sie weit vor Projektende belegt, wann sie diese Klarheit erstmals herstellen konnten. Wir brauchen im Moment vor allem Plattformen, die es ermöglichen, Forschung zitierbar anzubieten. Daten streng geheim bis zum Projektende zu handhaben und danach unveränderbar anzubieten, birgt eigene Risiken – allen voran, dass Daten in einer Webpräsentation unzuitierbar werden und ein halbes Jahr nach Projektende unbeachtete Forschungsgeschichte werden. Ich denke, wir brauchen vor allem einen neuen Umgang mit der zunehmend kollektiv vorliegenden Datenlage. Dazu müssen wir die Möglichkeiten und die Gepflogenheiten liefern: Datensätze mit Ausweis der in ihnen steckenden und zitierbaren Forschungsleistung. Wikibase ist gerade hierzu extrem gut in der Lage.

Weitere Informationen:

Der Beitrag „Wir brauchen einen neuen Umgang mit der zunehmend kollektiv vorliegenden Datenlage“ erschien zuerst auf WortMelder.

Quelle: https://aktuell.uni-erfurt.de/2019/06/20/wir-brauchen-einen-neuen-umgang-mit-der-zunehmend-kollektiv-vorliegenden-datenlage/