Im Team Hochschulschriften und Geschenke (HuG) der Technischen Informationsbibliothek Hannover (TIB) wurde folgende Beobachtung gemacht: Promovierende der Leibniz Universität Hannover (LUH), die Forschungsdaten (FD) zu Ihren Dissertationen veröffentlichen, publizieren diese meist zusammen mit ihrer Dissertation im institutionellen Textrepositorium der LUH, das von der TIB in ihrer Funktion als Universitätsbibliothek betreut wird. Häufig werden die FD in solchen Fällen als Anhang in das PDF der Dissertation integriert oder (seltener) als eigenständiges PDF angehängt.1
Dieses Vorgehen führt jedoch dazu, dass die FD weder indexiert noch eigenständig zitierbar und somit schwer auffindbar sind. Darüber hinaus stehen dadurch keine eigenen Metadaten für die FD bereit und sie liegen als PDF in einem für die Weiterverarbeitung ungünstigen Format vor, entsprechen somit also auch nicht den FAIR-Prinzipien2 für Forschungsdaten.
Zudem ist das Textrepositorium nicht für die Publikation von Forschungsdaten vorgesehen, da an der LUH auch ein eigenständiges Forschungsdatenrepositorium3 für die Forschenden zur Verfügung steht, welches durch die Leibniz Universität IT-Services (LUIS) betrieben wird.
Dank einer Masterarbeit von David Krassnig,4 die durch das Projekt angestoßen im Rahmen eines Bibliotheksreferendariates am IBI5 entstand, bestätigte sich der oben beschriebene Eindruck: In den Jahren 2012–2023 wurden 4.196 Dissertationen im institutionellen Textrepositorium veröffentlicht. Die Untersuchung einer daraus gezogenen geschichteten Stichprobe (n=1.441) ergab, dass es sich bei 1.252 Dissertationen um solche mit Primärdaten handelte. Dabei stellte der Autor fest, dass bei 768 Dissertationen die Forschungsdaten veröffentlicht wurden: Bei 714 Dissertationen wurden sie als „integrierte Forschungsdaten“, z.B. im Text, bei 22 Dissertationen als „begleitende Forschungsdaten“ im Anhang veröffentlicht. Von 93 Dissertationen wurden die Forschungsdaten auf einer externen Plattform publiziert, überwiegend handelte es sich um Code, der (jedoch ohne DOI oder andere Persistente Identifikatoren) in einem Git-Repositorium abgelegt wurde.6
Um diesen Zustand zu verbessern, wurde im August 2022 das FoHop!-Projekt an der TIB gestartet. Dazu wurde von den am Projekt beteiligten Abteilungsleitungen ein Antrag an die Leitungsrunde7 der TIB auf Finanzierung durch den TIB Innovationsfonds gestellt.
Die dort genannten Hauptanliegen waren folgende:
Funktionale, nachhaltige, teilweise abteilungsübergreifende Geschäftsgänge zu entwerfen,
technisch unterstützte Prozesse bei der Dateneingabe und -verteilung zu optimieren,
die Beratungs- und Informationsangebote für LUH-Angehörige auszubauen,
neue Serviceangebote für Forschende aufzubauen.
Konkrete Handlungsziele waren:
Promovierende für das Thema Forschungsdatenpublikation zu sensibilisieren und mit Informationen zu versorgen,
die Publikationszahlen der zu den Hochschulschriften zugehörigen Forschungsdaten zu erhöhen,
die Einhaltung der FAIR-Prinzipien zu unterstützen und zu fördern, dabei aber den Mehraufwand für die Forschenden möglichst gering zu halten,
Workflows für interne Abläufe zu erarbeiten.
In der Konzeptentwicklungsphase des Projektes wurden die im Antrag genannten Projektziele mit Ideen gefüllt (und manche im Laufe des Projektes auch wieder verworfen). Anhand einer Stakeholder-Analyse wurden einzubeziehende Partner*innen, aber auch „Problemstellen“ identifiziert und mit Hilfe eines Projektstrukturplanes die Projektziele in Arbeitspakete (AP) und Teilaufgaben untergliedert. Es folgte eine Zeit- und Ressourcenplanung – welcher Projektpartner*innen ist für welches AP und welche Teilaufgaben verantwortlich? Das Whiteboard-Tool Collaboard war dabei sehr nützlich, da damit einfach und schnell ein Brainstorming, Mind Mapping und die Visualisierung der Ergebnisse (Projektstrukturplan, Workflow) umgesetzt werden konnten.
Die so identifizierten Hauptaufgaben waren folgende:
Entwicklung und Programmierung eines Uploadformulars für das LUH-Textrepositorium,8 mit dem die Promovierenden ihre Forschungsdaten eigenständig hochladen können,
Überarbeitung der TIB-Webseiten zu Hochschulschriften9 und Erweiterung des Informationsangebotes zum Thema Forschungsdatenpublikation,
Erarbeitung von Workflows von der Einreichung einer Dissertation und den zugehörigen Forschungsdaten bis zur endgültigen Veröffentlichung und der anschließenden Katalogisierung der Forschungsdaten.
Das Projekt wurde auf zwei Jahre ausgelegt. Der Projektstart erfolgte im August 2022. Das Team war abteilungsübergreifend beim Team Hochschulschriften und Geschenke sowie den Publikationsdiensten angesiedelt und setzte sich wie folgt zusammen:
Ein Vollzeitäquivalent (VZÄ) (zwei Personen mit einer halben Stelle), darunter eine wissenschaftliche Projektkoordinatorin und eine Diplom-Bibliothekarin, die die Teamleitung des Teams HuG durch eine halbe Stelle bei der Projektarbeit entlasten sollte.
Für Entwicklungsarbeiten (Klärung des technischen Workflows und Entwicklung eines Uploadformulars) gab es hausintern Unterstützung.
Die Projektkoordinatorin nahm zum 01.02.2024 Verpflichtungen in einem anderen Projekt an und war in den letzten sechs Monate der Projektlaufzeit nur in geringerem Umfang beteiligt.
Für die Umsetzung der im Projekt definierten Ziele war die Zusammenarbeit mit den Leibniz Universität IT Services als wichtiger Stakeholder im Projekt notwendig. LUIS betreut das auf der Technologie des Comprehensive Knowledge Archive Network (CKAN)10 basierende FD-Repositorium der LUH11.
Für die Zusammenarbeit mit LUIS wurde folgendes Szenario erarbeitet: Es sollte für die Promovierenden der LUH die Möglichkeit geschaffen werden, ihre Forschungsdaten zusammen mit ihrer Dissertation in einem Verfahren zu veröffentlichen, sodass nicht mehrere Konten angelegt werden müssen.
Die technische Umsetzung des Projektvorhabens nach dem ursprünglichen Szenario sah wie folgt aus:
Das Textrepositorium, basierend auf DSpace12, wurde als führendes System gewählt. Die Forschungsdaten werden, gemeinsam mit der Dissertation, in DSpace hochgeladen und automatisiert von DSpace über die CKAN Anwendungsprogrammierschnittstelle (API) und einen Systemnutzer "DSpace-Import" an das CKAN-FD-Repositorium von LUIS weitergegeben.
Die initiale Metadatenbearbeitung der Forschungsdaten sollte ebenfalls über DSpace geschehen. Nach Abschluss der Bearbeitung sollten die validierten Metadaten über die API des FD-Repositoriums mittels eines noch zu entwickelnden Tools ins Zielrepositorium „verschoben“ werden.
Recht schnell stellte sich heraus, dass für das Metadatenmapping eine Anpassung des Metadatenschemas im CKAN-FD-Repositorium erforderlich wäre, die den initial geschätzten Aufwand bei weitem überstieg. Die dazu erforderlichen Personalressourcen konnte das LUIS kurzfristig nicht einräumen, sodass ein neuer Weg gefunden werden musste.
So wurde als Übergangslösung ein alternatives Szenario für das Projekt entwickelt:
Das auf DSpace basierende Textrepositorium sollte als Veröffentlichungsort der Forschungsdaten dienen. Sobald das FD-Repositorium auf den neuesten Metadatenstandard gebracht wäre, könnten die Forschungsdaten mittels DataCite API durch das LUIS abgeholt und die Datensätze somit auch im FD-Repositorium der LUH nachgewiesen werden.
Der Mehrwert für Promovierende bestand in der Schaffung eines Publikationsortes für Forschungsdaten entsprechend dem aktuellen Metadatenstandard, der Gewährleistung der Langzeitarchivierung (LZA)13 von zehn Jahren durch die TIB, Zitierbarkeit und Verbesserung der Auffindbarkeit14 sowie der Verbreitung der FD durch einen eigenen DOI und Katalognachweis.
Der nun gewählte Weg liefert ein niederschwelliges Angebot, die Forschungsdaten im gleichen Repositorium wie die Dissertation zu veröffentlichen. Promovierende können ihre Forschungsdaten mit geringem Aufwand publizieren.
Seit Anfang August 2024 ist das Uploadformular für FD im LUH-Repositorium verfügbar. Es befindet sich beim Uploadformular für Dissertationen und ist damit leicht auffindbar für Promovierende, die ihre FD nicht an anderer Stelle veröffentlicht haben.
Die Website des Teams Hochschulschriften und Geschenke wurde überarbeitet und enthält nun ein ausführliches FAQ15 sowie Informationen zum Thema Forschungsdaten, was nach der Veröffentlichung dazu geführt hat, dass die Anfragen der Promotionsstudierenden beim Team Hochschulschriften und Geschenke konkreter geworden sind. Dadurch sind die Promovierenden besser auf die Veröffentlichung ihrer Dissertation und der damit verbundenen Forschungsdaten vorbereitet.
Ein Infoflyer mit Kontaktadressen wurde erstellt, der den Informationsmappen der Promotionsbüros beigelegt wird, um die Promovierenden möglichst früh auf das Thema FD aufmerksam zu machen.
Eine Publikationsvereinbarung (PV) für Forschungsdaten16 wurde erstellt. Der Übergang von einer Papierversion zu einer digitalen Version der Vereinbarung wurde ermöglicht, wodurch die durch den Postversand bedingte Zeitverzögerung entfällt. Die digitalisierte PV wird zusammen mit der Dissertation langzeitarchiviert, so dass rechtliche und administrative Anforderungen, wie die gesetzlich vorgeschriebene Aufbewahrung von Dokumenten, erfüllt werden kann.
Der abteilungsübergreifende Austausch zu FD innerhalb der TIB wurde unterstützt. So wurde in einem TIB-internen Workshop für alle interessierten Kolleg*innen über die Projektergebnisse, die Ergebnisse der Masterarbeit und den Stand der maschinellen Sacherschließung von Forschungsdaten mit Annif17 berichtet.
Ein Ziel des Projektes war es, dass Forschungsdaten eigenständig in Repositorien publiziert, katalogisiert und mit der zugehörigen Hochschulschrift verknüpft werden. Für die verschiedenen im Textrepositorium vorkommenden Arten der Forschungsdatenpublikation (s.o.) wurden Workflows auf Grundlage einer Handreichung des Verbundkatalogs K10plus für die Katalogisierung von FD entwickelt.
Um den Service zu evaluieren und beständig fortzuentwickeln, ist eine Nutzungsumfrage zur Relevanz der neuen Informationen auf der Webseite und zur Benutzungsfreundlichkeit des Uploadformulars geplant. Folgendes kann jedoch bereits festgestellt werden:
Es ergaben sich durch das Projekt erfreuliche Begleiteffekte: Das Team Hochschulschriften und Geschenke wurde für das Thema Forschungsdatenpublikation und die bereits im Repositorium vorhandenen FD sensibilisiert, sodass nun auch dort, neben dem Serviceteam Forschungsdaten der LUH, im Kontakt mit den Promovierenden auf die Vorteile der FD-Publikation hingewiesen und dazu beraten werden kann. Zudem wurde das Arbeitsfeld in den Workflow und die Ausbildung der FaMIs und der im Team HuG hospitierenden Hochschulpraktikant*innen integriert. Generell wurde das Verständnis für die Arbeitsfelder der Kolleg*innen innerhalb der TIB gefördert.
Eine Herausforderung war es, die wichtigen Stellen an der Universität für das Thema Forschungsdatenpublikation zu sensibilisieren. Sowohl die wissenschaftlichen Betreuer*innen als wichtiger Kontaktpunkt zu den Promovierenden als auch die Doktorand*innen selbst waren zum Großteil nur schwer für das Thema zu erreichen, da erfahrungsgemäß der Publikation von Forschungsdaten in den Fachbereichen bisher keine große Priorität eingeräumt wird und an der LUH bis dato nicht verpflichtend ist. Durch die Abstimmungsprozesse im Senat der LUH und die regelmäßigen Berichte im Nutzerbeirat18 konnte das Thema breiter in die Universität gestreut werden.
Abschließend soll noch hervorgehoben werden, dass durch die intensive Beschäftigung mit der Katalogisierung von FD im Projekt eine Diskussion auf Verbundebene im GBV angestoßen wurde. Die Ergebnisse und Katalogisierungsworkflows wurden bei einer Sitzung der AG K10plus Katalogisierung im Herbst 2024 vorgestellt, die das Thema Forschungsdatenkatalogisierung auf ihre Agenda gesetzt hat.
Im Vorfeld der Sitzung haben die teilnehmenden Bibliotheken eine Umfrage zum Umgang mit Forschungsdaten in ihren Häusern ausgefüllt. Für die Speicherung und den Nachweis von FD ergibt sich ein gemischtes Bild. Zum Teil sind bereits eigene Forschungsdatenrepositorien vorhanden, z.T. in Planung oder perspektivisch vorstellbar. Überwiegend besteht Interesse an einem Nachweis im Verbundkatalog K10plus. Bisher ist ein Nachweis nur in wenigen Fällen – zumeist im Zusammenhang mit Projekten – realisiert. Die Formalerschließung erfolgt teilweise manuell, automatisierte Workflows werden angestrebt. Einige Bibliotheken sehen keinen Mehrwert durch einen Nachweis im K10plus, da die Forschungsdaten durch einschlägige Verzeichnisse auffindbar sind.
Somit ist die TIB durch das Projekt auf den zukünftigen Anstieg der Zahl der FD-Publikationen von Hochschulschriften, aber auch der Publikation von Forschungsdaten insgesamt, der mit den wachsenden Anforderungen der Drittmittelgeber an die Forschenden bezüglich der Veröffentlichung von Forschungsdaten einhergehen wird, sehr gut vorbereitet.