Tagungsbericht WikiCite 2017

Philipp Zumstein, Universitätsbibliothek Mannheim
Konrad U. Förstner, Core Unit Systemmedizin, Universität Würzburg

Vom 23. bis 25. Mai 2017 fand die Konferenz WikiCite 2017 statt.1 Über 90 internationale Teilnehmende trafen sich in Wien, um über Zitationsdaten insbesondere im Umfeld von Wikipedia und Wikidata zu sprechen. Unter den Teilnehmenden waren Bibliothekar/inn/e/n, Informatiker/innen, Wissenschaftler/innen, Verlagsmitarbeiter/innen, Wikipedianer/innen, Wikidata-Beitragende, Ontologie- und Visualisierungs-Expert/inn/en.

Gruppenfoto bei der WikiCite 2017 in Wien

Nachdem 2016 in Berlin die erste WikiCite-Konferenz als Startschuss für die WikiCite-Community angesehen werden kann, zeigte sich dieses Jahr, wie viel die Gemeinschaft seither bereits bewegt hat. Neben dem Teilen des bereits Erreichten waren die Ziele der WikiCite 2017 die Gestaltung und Planung für die Zukunft sowie die Implementierung von Lösungen.2

Was ist WikiCite?

WikiCite ist ein Projekt, aber es ist auch eine Konferenz, sowie eine Community.3 Diese Mehrdeutigkeit macht es dem Außenstehenden erst einmal schwer zu verstehen, was WikiCite genau ist. Etwas einfacher ist es, mit der Beschreibung auf der WikiCite-Projektseite im Meta-Wiki anzufangen:

“WikiCite is a proposal to build a bibliographic database in Wikidata to serve all Wikimedia projects.”4

Um dies zu verstehen muss etwas ausgeholt werden: Wikipedia ist eine freie Online-Enzyklopädie, welche als Projekt 2001 gestartet wurde. Mittlerweile ist Wikipedia die fünfthäufigst besuchte Website weltweit .5 Betrieben wird Wikipedia von der Non-Profit-Organisation „Wikimedia Foundation“, welche auch Wikimedia Commons, Wikidata und weitere Plattformen betreibt. Bei Wikipedia kann jede/r mitmachen und ihr/sein Wissen einbringen.

Als Enzyklopädie zählt Wikipedia zur Tertiärliteratur und eignet sich wie alle tertiären Quellen gut für den Einstieg in ein neues Thema – meist zu Beginn einer Arbeit. Zum tieferen Verständnis und auch zum Zitieren sollte man aber dann die verlinkten Sekundärquellen lesen und die Originalarbeiten zitieren. Wikipedia bietet hierzu Referenzen an, aber diese sind bisher als Templates in der Wikipedia-Seite direkt eingebunden. Dadurch ist es schwierig, die Daten weiter nachzunutzen oder zu analysieren. Beispielsweise muss man heutzutage die gleichen Referenzen für verschiedene Sprachversionen des gleichen Wikipediaartikels getrennt eintragen.

Seit 2012 gibt es mit Wikidata eine kollaborativ betreute, semantische Datenbank. Sprachunabhängige Fakten, wie zum Beispiel die Einwohnerzahl einer Stadt, können in Wikidata zentral und konsistent gespeichert werden, statt dass diese Information einzeln in jeder Sprachversion von Wikipedia gepflegt werden muss.

Die ganzen Informationen in Wikidata können auch über eine SPARQL-Schnittstelle abgefragt werden und in Wikipedia oder auch unabhängig davon genutzt werden. Google hat beispielsweise sein eigenes Projekt Freebase eingestellt und verwendet nun Wikidata um Suchresultate anzureichern. Täglich beantwortet Wikidata ca. 7 Millionen SPARQL-Abfragen.6

Ein Ziel von WikiCite ist es, die Referenzen aus Wikipedia in Wikidata zu speichern und verwalten. Somit könnten die gleichen Referenzen für verschiedene Sprachversionen der Wikipedia genutzt werden, und Korrekturen bzw. Verbesserungen stehen allen zur Verfügung. Aber auch die Aussagen in Wikidata selbst sollten mit Referenzen versehen werden. Um Aussagen verifizierbar zu machen, brauchen diese eine Quelle. Da immer öfter solche Wissensbasen wie Wikidata als Grundlage für komplexe Suchabfragen bzw. bei der automatischen Beantwortung von Fragen herangezogen werden, wird die Quellenangabe (Provenienzinformation) beim Bewerten dieser zurückgelieferten Information zunehmend wichtiger.

Darüber hinaus sind auch die Literaturdaten insgesamt mit ihren reichhaltigen Beziehungen zu Personen oder anderen Publikationen über Referenzen interessant. Eine effiziente Suchstrategie ist die Schneeballsuche, welche nach zitierten Quellen vorwärts und rückwärts sucht. Offene Zitationsdaten kann man dann auch bei szientometrischen Auswertungen und Visualisierungen benutzen.7

Wie Jonathan Dugan zu Beginn der Tagung schön zusammenfasste, ist die Vision von WikiCite, die Gesamtheit aller Zitationen als offene Linked-Data-Sammlung abzubilden.8 Neben den oben genannten technischen Aspekten adressiert WikiCite dazu auch die Zusammenführung von verschiedenen Gemeinschaften mit ähnlicher Zielsetzung wie zum Beispiel das OpenCitations-Projekt9, das auch auf der Konferenz präsentiert wurde, oder das LOC-DB-Projekt.10 Dabei ist es eine große Herausforderung, eine sehr heterogene Gemeinschaft mit Personen aus verschiedensten Bereichen zusammenzubringen und zusammen arbeiten zu lassen.

Zudem ist es eine wichtige Aufgabe von WikiCite, andere Akteure mit ins Boot zu holen, um den Zugang zu bibliografischen Daten zu erleichtern. Die “Initiative for Open Citations” (abgekürzt I4OC)11 wurde maßgeblich von WikiCite-Community-Mitgliedern mitinitiiert, und die Wikimedia Foundations sowie OpenCitations sind als Stakeholder vertreten. Mit Stand Juli 2017 haben sich 46 Verlage sowie Fachgesellschaften der Initiative angeschlossen, um ihre Zitationsdaten offen bereitzustellen, wie in den Zielen der Initiative beschrieben ist:

“The aim of this initiative is to promote the availability of data on citations that are structured, separable, and open.”12

Konferenzeinblicke

Die Veranstaltung war sehr interaktiv und abwechslungsreich mit Blöcken, die von den Veranstaltern vorgegeben wurden, sowie mit Blöcken, welche von den Teilnehmenden mitbestimmt wurden. Die drei Tage teilten sich auf in:

Zur Dokumentation wurde die ganze Zeit online mit Etherpads, einem webbasierten Editor zur kollaborativen Bearbeitung von Texten, gearbeitet.13 Zudem wurden zahlreiche Vorträge aufgezeichnet und sind online verfügbar.14 Über das Treffen wurde in verschiedenen Blogeinträgen15 und Podcastepisoden16 berichtet.

Einige Vortragende bei der WikiCite

In einem Einführungsvortrag gab Dario Taraborelli einen guten Überblick über die vergangenen Monate sowie einen Ausblick auf die kommenden Herausforderungen. Nachdem die Eigenschaft für Zitierungen in Wikidata letztes Jahr kreiert worden war, konnten erstmalig die Zitationsbeziehungen zwischen Publikationen in Wikidata eingegeben werden. Inzwischen enthält der Zitationsgraph auf Wikidata bereits 3,3 Millionen Verbindungen. Alle Referenzen von der englischsprachigen Wikipedia auf PubMed Central Artikel konnten in Wikidata angelegt werden. Viele weitere Punkte können in den Folien17 nachgelesen werden. Im Folgenden werden einige wichtige Projekte und Entwicklungen, die auf der WikiCite 2017 thematisiert wurden, zusammengefasst.

Neben der Einbindung von bibliografischen Daten in Wikipedia gibt es zahlreiche Anwendungen für WikiCite. Zum Beispiel hat Finn Åarup Nielsen ein experimentelles Webtool namens Scholia18 entwickelt, mit dem sich leicht Informationen über Wissenschaftler/innen, Wissenschaftsorganisationen oder Verlage abfragen und visualisieren lassen.

Koautoren-Graph für Uta Frith in Scholia

Der Zika-Corpus19, der federführend von Daniel Mietchen generiert wurde, stellt ein Beispiel für eine thematische Sammlung von Wikidata-Einträgen dar. Eine solche Sammlung kann helfen, sehr schnell einen Überblick über ein Thema zu gewinnen. Dieser Ansatz könnte sich leicht auf andere Themen mit hoher Brisanz und hohem Zeitdruck anwenden lassen.

Beim Einbringen von noch nicht vorhandenen Artikeldaten bzw. Zitationen in Wikidata sind gute softwaregestützte Workflows unerlässlich. Neue Artikel mit einer DOI, PMID (Identifikator in der bibliographischen Datenbank PubMed) oder PMCID (Identifikator in der Volltextdatenbank PubMed Central) können mit dem Tool Source MD20 importiert bzw. vervollständigt werden. Dabei genügt es, den entsprechenden Identifikator einzugeben. Den Rest erledigt das Tool. Die weitere Bearbeitung und Verbesserung kann dann wiederum manuell und kollaborativ in Wikidata passieren.

Einen allgemeineren Ansatz gibt es bereits für Wikipedia: Citoid21 ist Teil des Visualeditors zum Bearbeiten von Wikipedia und erlaubt das Hinzufügen eines Literaturbelegs durch Angabe der entsprechenden DOI, ISBN oder ganz allgemein einer URL, wobei die restlichen Daten automatisch extrahiert werden. Damit können auch gedruckte Bücher oder Veröffentlichungen ohne DOI erfasst werden. Bei URLs werden im Hintergrund Teile der Open Source Software Zotero nachgenutzt und auch kollaborativ erweitert. Bei ISBNs dürfen aufgrund einer Kooperation mit OCLC die Daten aus dem WorldCat verwendet werden.22 Katie Filbert und James Forrester haben mit ersten Ergebnissen gezeigt, wie man einen ähnlichen Mechanismus für das Hinzufügen von Belegstellen in Wikidata nutzen kann.

Hinzufügen von zwei Referenzen in Wikidata

Diskutierte Themen und nächste Schritte

Im Zuge der Konferenz wurden zahlreiche Themen angegangen und bestehende Probleme diskutiert, wie auch zukünftige Aktivitäten geplant oder angestoßen. Eine Herausforderung dürfte es sein, die vielen guten einzelnen Initiativen aus dem Umfeld von WikiCite zu koordinieren und eine ganzheitliche Perspektive dabei im Auge zu behalten.

Es gibt weiterhin offene Fragen, die von der Community gelöst werden müssen: So zum Beispiel, ob alle existierenden Publikationen in Wikidata gespeichert werden können und sollen, oder ob man sich auf eine Auswahl beschränken sollte. Bei geschätzt mehreren 100 Millionen Artikeldaten könnte die schiere Masse auch Probleme bei der technischen Infrastruktur ergeben. Es besteht zudem die Frage, ob man sich auf Referenzen, die in Wikipedia als Quellenverweise genutzt werden, konzentrieren möchte, oder ob man auch alle Publikationen inklusive ihrer Zitationen untereinander aufnehmen soll. Des Weiteren müssen neue Datenquellen und Abläufe für die Integration von bibliografischen Daten erschlossen bzw. erstellt werden. Aber es gibt auch noch viele andere Aufgaben: Die Sichtbarkeit von WikiCite innerhalb der Wikipedia-Community wie auch in der Gesamtgesellschaft soll weiter steigen und sich somit der Mehrwert wie auch die Zahl der aktiven Mitglieder erhöhen. Flagschiffprojekte wie z. B. Scholia können hierzu sehr hilfreich sein. Kurzum - es gibt noch viel tun bis die Vision Realität geworden ist.

Ein nächstes Treffen, WikiCite 2018, wurde schon angekündigt. Ort und Termin stehen dabei noch nicht fest. Man darf freudig gespannt sein, was die Community im vor uns liegenden Jahr bis zur nächsten Zusammenkunft auf die Beine stellt.

Zitierfähiger Link (DOI): https://doi.org/10.5282/o-bib/2017H3S106-112


1 „WikiCite 2017,“ zuletzt geprüft am 24.08.2017, https://meta.wikimedia.org/wiki/WikiCite_2017.

2 „[T]his particular conference [is about] three days focusing on sharing the results we’ve got, designing and planing out the future, and then implementing solutions“. Jonathan Dugan, „WikiCite Meeting 2017: Kickoff“ (WikiCite 2017, Wien, 23. Mai 2017), zuletzt geprüft am 24.08.2017, https://commons.wikimedia.org/w/index.php?title=File%3AWikiCite_2017_kickoff_final.pptx.pdf. Videomittschnitt der Aussage: https://www.youtube.com/watch?v=1pMHSghEM7A&t=848 (ab 0:14:08).

3 „WikiCite is a conference, but is also a project, and it is also a mailing list.“ Andrew Lih und Rob Fernandez, „Citations, WikiCite and Wikidata in Vienna“, Nr. 123 (o.J.) Wikipedia Weekly, o. J., http://wikipediaweekly.org/podcast/wikipedia-weekly-123-citations-wikicite-and-wikidata-in-vienna/ (ab 0:25:28).

4 „WikiCite – Meta,“ zuletzt geprüft am 24.08.2017, https://meta.wikimedia.org/wiki/WikiCite.

5 Alexa, „The top 500 sites on the web,“ zuletzt geprüft am 26.07.2017, http://www.alexa.com/topsites/global;0.

6 Lydia Pintscher, „Wikidata: Current Trends and Priorities (and Trivia),“ (WikiCite 2017, Wien, 23. Mai 2017), https://docs.google.com/presentation/d/1XX-yzT98fglAfFkHoixOI1XC1uwrS6f0u1xjdZT9TYI/edit?usp=embed_facebook (Folie 14).

7 Annette Klein, „Von der Schneeflocke zur Lawine: Möglichkeiten der Nutzung freier Zitationsdaten in Bibliotheken“ (Vortrag auf dem 106. Deutscher Bibliothekartag, Frankfurt am Main, 1. Juni 2017), Vortragsfolien, http://nbn-resolving.org/urn:nbn:de:0290-opus4-29491.

8 „[T]he sum of all human citations, as linked open data“ Dugan, „Kickoff“ (Folie 14).

9 OpenCitations, http://opencitations.net/.

10 Linked Open Citation Database, https://locdb.bib.uni-mannheim.de/.

11 Initiative for Open Citations, https://i4oc.org/.

12 „Goals of the Initiative for Open Citations,“ https://i4oc.org/#goals.

13 Master-Etherpad von WikiCite 2017 unter https://etherpad.wikimedia.org/p/WikiCite17 mit Links zu den Sub-Etherpads.

14 Day 1 - Full sessions: https://www.youtube.com/watch?v=1pMHSghEM7A.Day 2 - Tutorial: Wikidata, SPARQL, and WQS: https://www.youtube.com/watch?v=XLlzTtozRY4. Day 2 - Session wrapups: https://www.youtube.com/watch?v=JUFuE-AuJhw. Day 3 - Hackathon open mic pitches: https://www.youtube.com/watch?v=Pr78IvtcELA. Day 3 - Hackathon show and tell: https://www.youtube.com/watch?v=0vZa78bHmwI

15 Mahmoud Hashemi und Stephen LaPorte, „Wikicite 2017, and the 7 Features Wikidata Needs Most,“ {{Hatnote}} (Blog), 2. Juni 2017, zuletzt geprüft am 11.09.2017, http://blog.hatnote.com/post/161358369742/wikicite-2017-and-the-7-features-wikidata-needs; Katie Mika, „The Role of Librarians in Wikidata and WikiCite,“ NDSR at BHL (Blog), 6. Juni 2017, zuletzt geprüft am 11.09.2017, https://ndsrbhl.wordpress.com/2017/06/06/the-role-of-librarians-in-wikidata-and-wikicite/; Roderic D. M. Page, „Wikidata, WikiCite, and the ‚Bibliography of Life‘,“ IPhylo (Blog), 31. Mai 2017, zuletzt geprüft am 11.09.2017, http://iphylo.blogspot.com/2017/05/wikidata-wikicite-and-of-life.html; Mauricio Vidal Genta, „¿Qué pasó en Wikicite 2017? – Wikimedia Argentina,“ Wikimedia Argentina (Blog), 24. Juli 2017, zuletzt geprüft am 11.09.2017, http://www.wikimedia.org.ar/2017/07/24/que-paso-en-wikicite-2017/.

16 Episoden zur WikiCite2017, Open Science Radio, o. J., http://www.openscienceradio.de/tag/wikicite2017/; Lih und Fernandez, Citations, WikiCite and Wikidata in Vienna.

17 Dario Taraborelli, „WikiCite: The Journey and the Road Ahead“ (Vortrag auf der WikiCite 2017 am 23. Mai 2017), Vortragsfolien, zuletzt geprüft am 11.09.2017, https://doi.org/10.6084/m9.figshare.5032235.v1.

22 Jake Orlowitz, „You Can Now Add Automatically Generated Citations to Millions of Books on Wikipedia – Wikimedia Blog,“ Wikipedia Library, 11. Mai 2017, zuletzt geprüft am 24.08.2017, https://blog.wikimedia.org/2017/05/11/wikimedia-oclc-partnership/.