Anforderungen an Open-Access-Publikationen von Forschungsdaten – Empfehlungen für einen offenen Umgang mit Forschungsdaten

Elke Brehm, Janna Neumann, TIB Hannover

Zusammenfassung

Die Publikation von Forschungsdaten wird vor allem im Rahmen der Forschungsförderung verstärkt eingefordert, um Forschungsergebnisse nachvollziehbar, reproduzierbar und nachnutzbar zu machen. Im Rahmen der Publikation der Daten ist zu berücksichtigen, dass nicht alle Daten gleichermaßen für die Nachnutzung wissenschaftlich relevant und interessant sind. Darüber hinaus werden im Verlauf des Forschungsprozesses eine Reihe von rechtlich relevanten Regelungen und Vereinbarungen mit unterschiedlichen Akteuren getroffen. In der Regel werden diese unabhängig voneinander vereinbart, wenig aufeinander abgestimmt und auch im Rahmen von Datenmanagementplänen so getroffen, dass Datenpublikationen mitunter verhindert bzw. erschwert werden können. Die Publikation von Forschungsdaten wird, wenn überhaupt, erst am Ende des Forschungsprozesses in Betracht gezogen. Dann ist die Prüfung der Rechtslage an den Daten, die Auswahl und die Aufbereitung der Daten zwecks Publikation jedoch mit erheblichem Aufwand verbunden und zum Teil gar nicht mehr möglich. Im Rahmen dieses Artikels stellen wir vor, im Hinblick auf welche Aspekte die Daten für eine Publikation auszuwählen sind und wann die Rechtslage an den Daten geprüft werden muss, um eine offene Datenpublikation zu ermöglichen. Dabei werden sowohl die Rollen aller beteiligten Akteure wie Kooperationspartner, Forschungsförderer und Repositoriumsbetreiber als auch der jeweilige rechtliche Rahmen der Forschungsdaten betrachtet. Zur Erleichterung der Analyse der Rechtslage an den Daten wird ein Ansatz für die Bildung von Fallgruppen vorgestellt, der im Rahmen von aktuellen Projekten und Entwicklungen im Forschungsdatenmanagement verfeinert werden muss. Das fallgruppenorientierte Vorgehen ist eine praktikable Hilfestellung für die Beratung von Forschenden zum Forschungsdatenmanagement in der Praxis. Datenmanagementpläne und andere im Forschungsprozess geschlossene Vereinbarungen können im Hinblick auf die Nachnutzung von Forschungsdaten gestaltet werden. Bereits im Rahmen von Schulungen und Beratungsgesprächen können geeignete Lizenzempfehlungen für die Open-Access-Publikation von Forschungsdaten gegeben werden. Ziel ist, möglichst viele publikationsrelevante Daten im Sinne der FAIR Principles1 Open Access publizieren zu können und unnötige Beschränkungen zu vermeiden.

Summary

There is an increasing demand for the publication of research data, especially in the context of research funding, in order to make research results comprehensible, reproducible and reusable. With a view to publishing the data, it should be taken into account that not all data is equally relevant and interesting for subsequent scientific re-use. Also, in the course of the research process, a number of legally relevant regulations and agreements with different actors are concluded. As a rule, these are agreed upon independently of each other, they are not sufficiently aligned, and are sometimes – even within the framework of data management plans – designed in a manner which prevents data publication or at least makes it more difficult. The publication of research data is only considered, if at all, at the end of the research process. At that point in time, however, the examination of the legal situation with regard to the data, the selection and preparation of the data for publication requires a considerable effort and may even be no longer possible. In this article, we present the aspects which must be considered for the selection of the data for publication, and discuss when it is necessary to examine the legal situation of the data in order to enable an open data publication. This includes considering the roles of all involved actors such as cooperation partners, research funders and repository operators as well as the respective legal framework of the research data. In order to facilitate analysing the legal situation of the data, an approach for the formation of case groups is shown. However, this approach must be refined within projects and current developments in research data management. The case-group-oriented approach serves as an aid for advising researchers on research data management in practice. Data management plans and other agreements concluded in the course of the research process can be designed with regard to the re-use of research data. Suitable licensing recommendations for the open access publication of research data can be given during training courses and consultations. The aim is to publish as much of the data which is relevant for publication as possible in open access and in accordance with the FAIR principles1 and to avoid unnecessary restrictions.

Zitierfähiger Link (DOI): https://doi.org/10.5282/o-bib/2018H3S1-16
Autorenidentifikation:
Brehm, Elke: ORCID: http://orcid.org/0000-0001-8224-7047; Neumann, Janna: GND 139772863, ORCID: http://orcid.org/0000-0002-0161-1888
Schlagwörter:
Bibliothekswesen; Forschungsdaten; Forschungsdatenmanagement; Open Access; Open Data

1. Einleitung2

Die Themen Forschungsdaten und ihr Management sowie Anforderungen zur Publikation von Forschungsdaten werden auf Grund von nationalen wissenschaftspolitischen Aktivitäten3 derzeit diskutiert. Die Anforderungen an den Forschenden werden durch die Rahmenbedingungen der Förderer (beispielsweise vom EU Rahmenprogramm Horizon 2020,4 aber auch durch die Leitlinie zum Umgang mit Forschungsdaten der Deutschen Forschungsgemeinschaft5) verändert und ein adäquates Forschungsdatenmanagement wird zunehmend unabdingbar, um in der Wissenschaft effiziente und reproduzierbare Forschungsergebnisse zu erlangen. Allerdings empfinden die Forschenden den Umgang mit Forschungsdaten noch immer als eine zusätzliche, mitunter lästige und zeitaufwendige Aufgabe,6 die sie vom eigentlichen Forschungsprozess abhält. Häufig wird über eine mögliche Datenpublikation auch erst am Ende eines Forschungsprojektes nachgedacht. Eine adäquate Aufbereitung der Forschungsdaten für eine Publikation ist in der Regel dann noch nicht geschehen, was wiederum zusätzliche Arbeit für den Forschenden bedeuten würde. Daher ist die Motivation der Forschenden zur Datenpublikation gering und in vielen wissenschaftlichen Disziplinen kein gleichwertiger Forschungsoutput im Vergleich zur traditionellen wissenschaftlichen Textpublikation in Form von Artikeln oder auch Büchern.7 Oft ist Forschungskonkurrenz eine Hürde für eine offene Datenpublikation. Forschende wollen ungern Daten öffentlich zugänglich machen aus Angst, dass andere Forschungsgruppen schneller publizieren. Zusätzlich existieren Vorbehalte gegenüber falscher Interpretation von Ergebnissen oder auch kommerziellem (Miss-)Brauch.8

Die Rechtslage in Bezug auf Urheber- und Nachnutzungsrechte von Forschungsdaten ist für Forschende oft undurchsichtig und durch sie selbst nur mit hohem Zeitaufwand zu klären. Notwendig und auch gewünscht ist hierfür ein Unterstützungsangebot für die Wissenschaftler durch Verwaltungs- und Infrastruktureinrichtungen.

In diesem Artikel sollen daher sowohl der rechtliche Rahmen als auch die Kriterien für die Datenauswahl bei der Datenpublikation betrachtet werden und dabei Orientierungspunkte liefern für den möglichst offenen Umgang mit Forschungsdaten. Aufgrund der Komplexität und vielfacher Unsicherheiten seitens der Forschenden in Bezug auf die rechtliche Situation beim Umgang mit Forschungsdaten liegt der Fokus des Artikels vor allem auf der Beschreibung der rechtlichen Aspekte.

Ein Ansatz für ein Unterstützungsangebot für die Beratungsdienste zum Forschungsdatenmanagement an Infrastruktureinrichtungen ist die Betrachtung und Einteilung rechtlicher Fallgruppen. Das vorgestellte Schema muss im Rahmen von aktuellen Projekten und Entwicklungen im Forschungsdatenmanagement verfeinert werden.

2. Inhaltliche Kriterien für die Datenauswahl

Die Entscheidung, welche Daten für die Zukunft relevant sein können, kann nicht pauschal getroffen werden, sondern ist abhängig von der jeweiligen Disziplin. Grundsätzlich muss nicht immer alles, was im Forschungsprozess produziert wurde, tatsächlich langfristig aufgehoben und publiziert werden. Oftmals wird nur ein kleiner Teil der tatsächlich produzierten Daten langfristig archiviert und zugänglich gemacht: In Großbritannien werden nur etwa 4–5 % der staatlichen Datensätze permanent archiviert.9 Bei wissenschaftlichen Daten mag dieser Anteil noch etwas höher liegen, nichtsdestotrotz muss man sich auch hier die Frage stellen, inwieweit die Archivierung und Publikation von Daten im Hinblick auf den Aufwand tatsächlich von Nutzen ist. Betrachtet werden sollen hier übergeordnete, allgemeine Kriterien, die für eine erste Auswahl angewendet werden können und nicht forschungs- und fachspezifische Kriterien.

Reproduzierbarkeit

Bei der Datenauswahl sollte zunächst die Möglichkeit der Reproduzierbarkeit der Daten betrachtet werden. Hierbei spielen unterschiedliche Faktoren eine Rolle: Übersteigen die Kosten für die Reproduktion von Daten oder auch die Kosten für die technische Ausstattung die der Archivierung (bspw. Speicherkosten in einem Repositorium) kann das für eine Publikation sprechen. Dazu ist eine umfangreiche Dokumentation der Daten, die es anderen Forschenden ermöglicht den Kontext der Datenerhebung und -auswertung zu verstehen, unabdingbar. Dadurch kann eine größtmögliche Nachnutzbarkeit gewährleistet werden.

Wissenschaftliche Relevanz

Ein weiterer Aspekt für die Datenauswahl ist die wissenschaftliche Relevanz für die zukünftige Forschung. Dieser Punkt ist sicher nicht ganz einfach zu beurteilen, da wissenschaftliche Forschung nur bedingt vorhersehbar ist. Allerdings spielen hierbei Faktoren wie die Einzigartigkeit der Daten (beispielsweise Wetterdaten) oder die Art der technischen Geräte, mit denen Daten generiert wurden, eine Rolle. Ist anzunehmen, dass in naher Zukunft die gleichen Daten mit einer besseren technischen Ausrüstung (bspw. besserer Auflösung bei Bilddaten oder höhere Sensibilität bei Messdaten) produziert werden können, ist es möglicherweise vertretbar, diese Daten nicht langfristig, sondern nur für den nach guter wissenschaftlicher Praxis10 vorgegebenen Zeitraum von zehn Jahren aufzuheben.

Kosten

Für die Entscheidung über die Datenarchivierung und -publikation sollten auch immer Erwägungen zur Wirtschaftlichkeit, wie die Kosten für die Datenerhebung als auch für die langfristige Datenerhaltung, betrachtet werden (siehe auch Reproduzierbarkeit). So kann es bspw. kostengünstiger sein, die Daten von sehr kostspieligen Datenerhebungen für die Nachnutzung aufzubereiten, zu archivieren und zu publizieren, so dass die Kosten für doppelte Datenerhebungen eingespart werden können.

Anforderungen der Förderer

Nicht zuletzt sind auch die Anforderungen von Förderern ausschlaggebend für die Datenauswahl. Daher sind bei drittmittelgeförderter Forschung die Bestimmungen zur Datenpublikation aus den Förderanträgen zu beachten und möglicherweise auch gegenüber den anderen hier genannten Kriterien zu priorisieren.

Letztendlich ist und bleibt die Datenauswahl ein individueller Prozess. Die genannten Kriterien für Aufhebung und Publikation liefern lediglich Anhaltspunkte für die Entscheidung. Maßgeblich ist die (fach-)spezifische Abwägung von Nutzen (der Daten für andere), Aufwand (zur Aufbereitung aber auch Reproduktion der Daten) und Kosten (der Erhaltung und Produktion der Daten). Unabhängig davon sollten Daten, die speziell als Grundlage wissenschaftlicher Ergebnisse dienen (z. B. als Untermauerung einer Theorie) immer mit bzw. zusätzlich zu einer wissenschaftlichen Textpublikation veröffentlicht werden.

3. Phasen des Forschungsprozesses

Vor der Betrachtung der verschiedenen rechtlichen Aspekte des Forschungsdatenmanagements, den an diesem Prozess Beteiligten und der Einteilung in unterschiedliche Fallgruppen soll zunächst noch ein Blick auf die verschiedenen Phasen des Forschungsprozesses geworfen werden.

Im Kontext von Forschungsdatenmanagement-Aktivitäten wird der Forschungsprozess in der Regel am Modell des Data Lifecycles dargestellt. In der von Jones et al.11 präsentierten Möglichkeit (Abbildung 1) wird der Zyklus in sechs unterschiedliche Bereiche eingeteilt. Darin enthalten sind die Erhebung, Dokumentation, Analyse, Speicherung, Publikation/Nachnutzung und die Archivierung von Daten. Diese Form der Darstellung ist eine stark zusammengefasste Version des tatsächlichen Forschungsprozesses und in der Regel die Sichtweise von Bibliotheken/Infrastruktureinrichtungen auf das Thema Forschungsdatenmanagement.

Abb-1-Data-Lifecyle-nach-Jones-et-al.png

Der tatsächliche wissenschaftliche Forschungsprozess ist grundsätzlich komplexer und detailreicher und beginnt bereits mit dem Planungsprozess der Forschungstätigkeit. Der von Cameron Neylon12 dargestellte Forschungsprozess (Abbildung 2) fasst diesen Prozess aus Sicht der Forschenden zusammen.

Abb-2-Data-Lifecyle-nach-Neylon.png

Das Forschungsdatenmanagement beginnt bevor Daten erhoben werden. Der Schwerpunkt im Lebenszyklus aus Sicht der Forschung liegt auf dem Planungs- und Verarbeitungsprozess der Daten. Eine wichtige Rolle spielen hierbei vor allem die temporäre lokale Speicherung und der Austausch von Daten mit Projektpartnern. Im Unterschied dazu liegt der Schwerpunkt in Abbildung 1 auf dem Speicherungs-, Archivierungs- und Publikationsprozess. Die Komplexität von Forschungs- und Datenmanagementprozessen erschweren eine einheitliche schematische Darstellung. Die zyklische Darstellungsform spiegelt auch nicht grundsätzlich den möglicherweise iterativen wissenschaftlichen Forschungsprozess wider. Im Allgemeinen werden sich die Darstellungen immer unterscheiden, je nach Perspektive, Zeitpunkt im Forschungsprozess und „Stakeholder“. Wichtig scheint nur, dass die jeweils Beteiligten wissen, welche Rolle eingenommen und welche Verantwortung getragen werden soll.

4. Im Forschungsprozess beteiligte Personen

Forschungsdatenmanagement findet im gesamten Forschungsprozess statt. Der Forschende ist dabei nicht an jedem Punkt alleine für das Management von Daten verantwortlich. Je nachdem an welcher Stelle des Forschungsprozesses sich der Forschende befindet, müssen verschiedene Personen oder Einrichtungen beteiligt werden. Nur so kann gewährleistet werden, dass Forschungsdatenmanagement von der Planung bzw. von der Forschungsidee bis zur Publikation und Nachnutzung gelingt. Zum Zeitpunkt der Beteiligung müssen außerdem bestimmte rechtliche Rahmenbedingungen eingehalten oder vereinbart werden. In der nachfolgenden Tabelle sind die unterschiedlichen Personen und Einrichtungen sowie die Art und der Zeitpunkt der Beteiligung aufgelistet. Dabei kann eine Person unterschiedliche Rollen zu verschiedenen Zeitpunkten einnehmen.

Tab-1-Stakeholder-Phasen-Forschungsprozess.png

Bereits zu Beginn des Forschungsprozesses müssen Regelungen und Vereinbarungen in Bezug auf die rechtlichen Rahmenbedingungen geprüft und getroffen werden. Darunter fallen z. B. rechtliche Vereinbarungen mit den Auftrag- oder auch Arbeitgeber/innen. Im Laufe des Forschungsprozesses müssen je nach Inhalt der Daten Einwilligungserklärungen von Probanden eingeholt oder auch Datenschutzkontrollen bei besonders schutzwürdigen Personendaten durchgeführt werden.

Am Ende des Forschungsprozesses müssen im Hinblick auf die Datenpublikation Datennachnutzungsvereinbarungen und Publikationsvereinbarungen mit Repositorien oder Archiven angefertigt werden, wobei auch Vorgaben von Förderern, Arbeitgebern und Kooperationspartnern berücksichtigt werden müssen. Allerdings ist es sinnvoll, sich nicht erst am Ende des Projektes hierüber zu verständigen. Bereits zu Beginn sollten mögliche Regelungen zum Beispiel in einem Datenmanagementplan festgehalten und damit eine offene Datenpublikation soweit möglich gewährleistet werden. Daher empfiehlt sich bereits bei Projektplanung zu prüfen, in welchem Umfang Schutzrechte im konkreten Einzelfall kraft Gesetzes bestehen und die Rechtesituation bei Abschluss aller im Verlauf des Projekts zu schließenden Verträge im Blick zu behalten.

5. Rechtliche Aspekte bei der Datenpublikation

Kriterien für die Auswahl der Daten für eine Publikation können sich auch aus Rechten von Forschenden oder anderen an den Daten aus dem Urheberrecht13, Datenschutz, Persönlichkeitsrechten von Forschungssubjekten oder aus Vorgaben des Förderers und sonstigen vertraglichen Bindungen ergeben. Während Urheberrechte, Datenschutz und Persönlichkeitsrechte kraft Gesetzes entstehen und gesetzlich zwingende und meist vertraglich nicht abdingbare Vorgaben enthalten, entstehen vertragliche Bindungen erst mit dem Vertragsschluss. Der Schutz der Daten hat Konsequenzen für die Pflicht zur Aufbereitung, die Publikationsmöglichkeiten und die Nachnutzbarkeit der Daten.

Voraussetzungen und Schutzziele von Urheber-, Datenschutz- und Persönlichkeitsrechten unterscheiden sich: Urheberrecht schützt den kreativ Schaffenden in seiner Beziehung zum Schutzobjekt und ordnet dem Urheber die aus der Nutzung des Schutzobjekts erwachsenden wirtschaftlichen Vorteile zu. Datenschutz und Persönlichkeitsrechte schützen die Person, über die Daten verarbeitet werden: Die Person soll selbst darüber entscheiden können, wer was über sie weiß (Datenschutz). Persönlichkeitsrechte schützen die Privat-, Intim- und Sozialsphäre der Person vor ungewünschtem Eindringen. Welche Rechte an den Daten bestehen ergibt eine Analyse der Daten unter verschiedenen Aspekten.

6. Urheberrecht und Forschungsdaten

Im Hinblick auf das Urheberrecht im Kontext Forschungsdaten muss geklärt werden, ob es sich überhaupt um urheberrechtlich schutzfähige Daten handelt und wer „die Rechte“ an den Daten hat, um sie publizieren zu können.

6.1. Urheberrechtlicher Schutz

Entscheidend ist, was für Objekte in der Datensammlung enthalten sind: Wissenschaftliche Texte wie Abstracts, Journal-Artikel, Videos, Fotografien, wissenschaftliche Grafiken, etc. erfüllen in aller Regel die Schutzvoraussetzungen des sogenannten urheberrechtlichen Werkbegriffs (Werkschutz).14 Wurden die Daten von einer Maschine nach vorgegebenen Regeln erzeugt, ohne dass der Intellekt und die Individualität einer Person für Inhalt und Form der vorliegenden Daten ausschlaggebend waren, sind die Voraussetzungen für den urheberrechtlichen Schutz nicht erfüllt. Beispiele hierfür sind unbearbeitete Messdaten einer Versuchsanlage. Dabei handelt es sich um Fakten.15 Die Daten müssen in einer zumindest vorübergehend wahrnehmbaren Form vorliegen (Schrift, Bild, Ton, elektronisch gespeichert, etc.). Die bloße Idee an sich ist nicht geschützt.16 Desgleichen sind auch wissenschaftliche Erkenntnisse, Lehren und Theorien nicht urheberrechtlich geschützt, da sie nicht von Forschenden geschaffen sondern „grundsätzlich vorhanden sind“ und „nur ans Tageslicht“ geholt werden müssen.17 Geschützt ist jedoch die konkrete Darstellung dieser Erkenntnisse in Form eines wissenschaftlichen Artikels, Abstracts, Videos oder einer wissenschaftlichen Grafik.

Der Schutzstatus von Daten kann sich im Verlauf des Forschungsprozesses verändern, z. B. durch Bearbeitung der Daten: So können einer Sammlung, in der ursprünglich nur maschinell erzeugte Messdaten enthalten waren, Elemente hinzugefügt werden, die urheberrechtlich geschützt sind (Grafiken, wissenschaftliche Texte etc.). Für maschinell erzeugte Messdaten, die mit einem größeren Aufwand bearbeitet werden – z. B. durch intellektuelle Auswahl von Datenelementen und innovativer Visualisierung, kann ein urheberrechtlicher Schutz entstehen.

Für Forschungsdaten ist neben dem eigentlichen Werkschutz noch die Entstehung von verwandten Schutzrechten denkbar, die jeweils anderen Schutzvoraussetzungen und einer kürzeren Schutzfrist unterliegen. Hierzu zählen z. B. der Lichtbildschutz, die wissenschaftliche Ausgabe und das Datenbankrecht.18

Das Datenbankrecht schützt Sammlungen von Daten, wenn wesentliche Investitionen in die Beschaffung, Sammlung, Überprüfung, Aufbereitung und Darbietung des gesamten oder eines wesentlichen Teils einer Datenbank geflossen sind, unabhängig vom urheberrechtlichen Schutz einzelner Elemente. So können auch maschinell erzeugte Rohdaten durch das Datenbankrecht einem urheberrechtlichen Schutz unterliegen. Dabei ist lediglich der Aufwand für die Erzeugung der Datenbank geschützt und damit kein Hindernis für eine Open-Access-Veröffentlichung: Da es keine urheberpersönlichkeitsrechtliche Komponente hat,19 ist bei Einigkeit mit den anderen Rechtsinhabern ein gänzlicher Verzicht auf Rechte aus dem Datenbankrecht möglich.

Sind in einer Datensammlung sowohl urheberrechtlich geschützte als auch nicht geschützte Elemente enthalten, müssen für die urheberrechtlich geschützten Elemente die Vorgaben des Urheberrechts beachtet werden.

6.2. Wer hat „die Rechte“ an den Daten?

Grundsätzlich stehen Forschenden alle Rechte an den Ergebnissen zu, sofern ein Urheberrechtsschutz besteht.20 Haben mehrere Forschende schutzfähige Projektergebnisse gemeinsam erzielt, muss genauer geprüft werden: Je nachdem, ob die Anteile der einzelnen Forschenden an den Ergebnissen eindeutig voneinander getrennt werden können oder nicht, entstehen eigenständige und voneinander unabhängige Rechte an dem jeweiligen Teilergebnis oder ein gemeinsames und unteilbares Urheberrecht, über das die Forschenden nur gemeinsam verfügen können.21 Hier empfiehlt es sich die jeweiligen Rollen der Forschenden im Forschungsprozess von Beginn an zu dokumentieren, z. B. in einem Datenmanagementplan. Dennoch können Forschende meist nicht ganz frei über die Publikation der Forschungsergebnisse entscheiden: In der Regel werden weitere Personen oder Institutionen (siehe Tabelle 1) in das Forschungsprojekt einbezogen, die auch ihren Beitrag oder Anforderungen mit in den Forschungsprozess einbringen. So werden oft im Vorfeld der Publikation Verpflichtungen eingegangen, die dann bei der Entscheidung über die Publikation der Forschungsergebnisse berücksichtigt werden müssen.

7. Datenschutz und Forschungsdaten

Personenbezogene Daten sind alle Informationen, die sich auf eine „identifizierte oder identifizierbare natürliche Person“ beziehen. Das liegt vor, wenn die Daten „direkt oder indirekt z. B. mittels Zuordnung zu einer Kennung wie einem Namen, einer Kennnummer, zu Standortdaten, zu einer Online-Kennung“ oder besonderen individuellen Merkmalen einer natürlichen Person zugeordnet werden können.22 Schutzfähige personenbezogene Daten liegen nicht vor, wenn die Daten anonymisiert sind, es sich um Daten von Institutionen oder Verstorbenen handelt.23, 24

Ist in einer Datensammlung ein einzelnes personenbezogenes Datum enthalten, müssen die Vorgaben des Datenschutzrechts eingehalten werden.

Hier gilt der Grundsatz „weniger ist mehr“: Je weniger personenbezogene Daten in Forschungsdaten enthalten sind, desto kleiner ist der Aufwand für die technisch-organisatorischen Schutzmaßnahmen während des Forschungsprozesses und größer die Publikationsmöglichkeiten.

Besonders hohe Anforderungen stellt das Datenschutzrecht bei Verarbeitung von besonders sensiblen Personendaten wie z. B. Gesundheitsdaten, Angaben über politische Meinungen, rassische und ethnische Herkunft sowie sexuelle Orientierung.25

Handelt es sich um besonders sensible Personendaten oder birgt die Verarbeitung z. B. wegen Verwendung neuer Technologien, aufgrund der Art, des Umfangs, den Umständen oder dem Zweck der Verarbeitung ein besonders hohes Risiko für die Rechte und Freiheiten natürlicher Personen, muss eine Datenschutz-Folgenabschätzung durchgeführt werden.26 Dabei handelt es sich um eine dokumentierte Risikoprüfung unter Festlegung geeigneter technisch-organisatorischer Maßnahmen zum Schutz der personenbezogenen Daten.

Für die Forschung gelten in gewissem Rahmen Ausnahmen von datenschutzrechtlichen Grundsätzen, z. B. beim Grundsatz der Zweckbindung und für den Umfang der Einwilligung.27 Dennoch gelten die wesentlichen datenschutzrechtlichen Grundsätze wie z. B. der Grundsatz der Datenminimierung auch dort.28 Eine Anonymisierung zum frühestmöglichen Zeitpunkt ist zu empfehlen. Die Verarbeitung von personenbezogenen Daten in Forschungsprojekten muss im Verfahrensverzeichnis der Institution verzeichnet werden. Auch deshalb empfiehlt sich die Einbeziehung eines Datenschutzbeauftragten.

In Forschungsdaten enthaltene personenbezogene Daten dürfen nur publiziert werden, wenn eine Einwilligung der Probanden zur Publikation vorliegt oder es sich um Personen der Zeitgeschichte handelt.29, 30, 31 Auch hier kann mit einer datenschutzrechtlichen Bewertung der Daten und wenigen Weichenstellungen bei der Aufbereitung der Daten vor Beginn der Datenauswertung eine Publikation erleichtert werden.

8. Fallgruppen

Die Prüfung des Schutzstatus der Daten kann durch die Bildung von Fallgruppen wesentlich erleichtert werden. Je nachdem, ob es sich um unbearbeitete maschinelle Rohdaten oder bearbeitete Forschungsdaten handelt, ergeben sich die in Abbildung 3 und 4 dargelegten Schemata. Damit kann der Aufwand für die Einzelfallbetrachtung erheblich reduziert werden und dem Forschenden bleibt die intensive Einarbeitung in die Rechtesituation erspart. Hier wird ein erster Ansatz dargestellt, der im Rahmen von aktuellen Projekten und Entwicklungen im Forschungsdatenmanagement verfeinert werden muss.

Abb-3-Fallgruppenbildung-Pruefschritte-unbearbeitete-maschinelle-Rohdaten.PNG

Abb-4-Fallgruppenbildung-Pruefschritte-bearbeitete-Forschungsdaten.PNG

9. Weitere rechtliche Vorgaben und Verpflichtungen

Neben die sich kraft Gesetzes ergebenden Vorgaben treten gegebenenfalls weitere Vorgaben und Verpflichtungen aus Verträgen wie z. B. Kooperationsvereinbarungen, Förderverträgen, Geheimhaltungsvereinbarungen, Datennutzungsvereinbarungen und Datenmanagementplänen. Diese Vereinbarungen müssen geprüft werden, wenn es am Ende um die Frage geht ob und wie Daten publiziert werden können. Dadurch werden zu Beginn des Forschungsprojekts wesentliche Weichen für die Datenpublikation gestellt.

Forschungsförderer definieren im Rahmen der Projektantragstellung Anforderungen, die für das gesamte Projekt eingehalten werden müssen und von denen in der Regel nicht abgewichen werden kann.

Bei Vereinbarungen mit Kooperationspartnern und anderen „Stakeholdern“ haben die Beteiligten grundsätzlich alle Gestaltungsmöglichkeiten, sofern Einigkeit erzielt werden kann. Die Verhandlungen bei diesen Verträgen finden auf Augenhöhe statt. Gerade in Kooperationsvereinbarungen mit Partnern aus der Industrie sind Geheimhaltungsvereinbarungen enthalten, da die Offenlegung von Betriebsgeheimnissen und innovativen Technologien befürchtet wird. Mitunter werden sie aber auch isoliert vereinbart, damit die Daten überhaupt für das Projekt zur Verfügung gestellt werden.

Um eine offene Datenpublikation zu gewährleisten, ist es ratsam, die wesentlichen Grundgedanken für die Nachnutzung der Daten (sowohl durch die Projektpartner als auch durch Dritte) und das Ziel der offenen Datenpublikation zu Beginn des Projekts in Datenmanagementplänen zu vereinbaren und dies in allen weiteren Vereinbarungen zu berücksichtigen.

Wenn dies, wie in der derzeitigen Praxis meist üblich, nach Projektende geregelt wird, können Fragen zum Schutzstatus und sonstigen Rechten anderer „Stakeholder“ und Kooperationspartner aus Zeitmangel oder aufgrund des erheblichen Aufwands für die Aufbereitung der Daten zwecks Veröffentlichung nicht mehr geklärt werden. Eine Einigung zwischen den Forschenden ist dann auch wegen divergierender Interessen erschwert.

10. Aufbereitung der Daten im Forschungsprozess

Eine wesentliche Voraussetzung für die Publikation der Daten ist, dass sie gut mit Metadaten erschlossen sind: Die für die Daten geltende Lizenz und die Provenienz der Daten sollten erfasst werden. Sind Daten selbst erzeugt worden, sollte grob der Inhalt oder direkt der rechtliche Schutzstatus mit erfasst werden, wenn sie mit Daten aus anderen Quellen kombiniert werden sollen. So können später gezielt die publikationsfähigen Daten selektiert werden.

Bei Kombination von Datensammlungen mit unterschiedlichem Schutzstatus ist dies besonders wichtig.

11. Lizenzierung von Forschungsdaten

Die Kennzeichnung der Daten mit einer Lizenz ist wichtig, um anderen Forschenden Umfang und Grenzen der Nachnutzbarkeit aufzuzeigen und ihnen die Prüfung des Schutzstatus zu ersparen.

Bei Forschungsdaten empfiehlt sich die Vergabe der Public Domain Mark32, sofern man davon ausgeht, dass kein Urheberrechtsschutz – auch nicht für einzelne Elemente – besteht. Ist man sich nicht sicher, sollte man die Lizenz CC0 1.0 Universal33 nehmen. Damit verzichtet man soweit möglich auf alle aus dem Urheberrecht möglicherweise resultierenden Rechte bzw. stellt klar, dass man sie nicht geltend machen wird.

12. Fazit

Open-Access-Publikation und Nachnutzbarkeit von Forschungsdaten können also nicht zuletzt auch durch eine frühzeitige Planung gewährleistet und vereinfacht werden:

Ein erster wichtiger Schritt für Forschende ist die Prüfung des Schutzstatus der Daten im Hinblick auf Urheber-, Persönlichkeits- und Datenschutzrechte bei der Projektplanung. Der Schutzstatus hat Konsequenzen für die Pflicht zur Aufbereitung, für die Publikationsmöglichkeiten sowie für die Nachnutzbarkeit der Daten.

Dies muss im Verlauf des Forschungsprozesses im Blick behalten werden, falls sich der Schutzstatus ändert. Weitere Vorgaben und Verpflichtungen werden durch Förderer gestellt oder ergeben sich aus im Verlauf des Forschungsprozesses geschlossenen Verträgen.

Publikationsvereinbarungen mit Repositorien sollten sich am Schutzstatus der Daten orientieren. Dabei sollte die von der Europäischen Kommission im Open Research Data Pilot des Förderprogramms Horizon 2020 ausgegebene Devise „as open as possible, as closed as necessary“34 berücksichtigt werden. Zusätzlich sollten vor einer Datenpublikation die Kriterien für die Datenauswahl berücksichtigt werden. Dabei gilt, dass nicht immer alle Daten publiziert werden müssen, aber eben auch nicht immer publiziert werden können. Bei der Auswahl geeigneter Lizenzen für die Datenpublikation kann der Repositorienbetreiber unterstützen. Hierbei geht es vor allem darum, die Möglichkeiten der Anwendung von offenen Lizenzen auf Forschungsdaten zu erläutern und den Forschenden entsprechende Lizenzen zu empfehlen.

Literaturverzeichnis

- DFG: Leitlinien zum Umgang mit Forschungsdaten, 2015, <www.dfg.de/download/pdf/foerderung/antragstellung/forschungsdaten/richtlinien_forschungsdaten.pdf>, Stand: 10.08.2018.

- DFG: Sicherung guter wissenschaftlicher Praxis. Empfehlungen der Kommission „Selbstkontrolle in der Wissenschaft“, Weinheim 2013. Online: <http://doi.org/10.1002/9783527679188.oth1>, Stand: 10.08.2018.

- Dreier, Thomas; Schulze, Gernot; Specht, Louisa: Urheberrechtsgesetz. Kommentar, München 2015.

- European Commission: H2020 Programme. Guidelines on FAIR Data Management in Horizon 2020, Version 3.0., 26.07.2016, <https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf>, Stand: 17.02.2018.

- Fecher, Benedikt; Puschmann, Cornelius: Über die Grenzen der Offenheit in der Wissenschaft – Anspruch und Wirklichkeit bei der Bereitstellung und Nachnutzung von Forschungsdaten, in: Information - Wissenschaft & Praxis 66 (2-3), 2015, S. 146-150. Online: <https://doi.org/10.1515/iwp-2015-0026>, Stand: 13.08.2018.

- Gola, Peter: Datenschutz-Grundverordnung. VO (EU) 2016/679: Kommentar, München 2017.

- Herb, Ulrich: Open Science in der Soziologie. Eine interdisziplinäre Bestandsaufnahme zur offenen Wissenschaft und eine Untersuchung ihrer Verbreitung in der Soziologie, Glückstadt 2015. Online: <https://doi.org/10.5281/zenodo.31234>, Stand: 13.08.2018.

- Jones, Sarah; Guy Marieke; Pickton, Miggie: Research Data Management for librarians, 2013. Online: <http://www.dcc.ac.uk/training/rdm-librarians>, Stand: 17.02.2018.

- Masum, Hassan; Rao, Aarthi; Good, Benjamin M. u.a.: Ten Simple Rules for Cultivating Open Science and Collaborative R&D, in: PLoS Computatonal Biology 9 (9), 2013: e1003244. Online: <https://doi.org/10.1371/journal.pcbi.1003244>, Stand: 13.08.2018.

- Neylon, Cameron: NESTA – Science in Society, NESTA Crucible Workshop, 28.06.2009, <https://www.slideshare.net/CameronNeylon/nesta-science-in-society>, Stand: 17.02.2018.

- Whyte, Angus; Wilson, Andrew: How to Appraise and Select Research Data for Curation. Digital Curation Centre How-to Guides, Edinburgh 2010. Online: <http://www.dcc.ac.uk/resources/how-guides/appraise-select-data>, Stand: 17.02.2018.

Gesetze und Verordnungen

- Bundesdatenschutzgesetz in der Fassung vom 30.06.2017 (BGBL I, Nr. 44), S. 2097-2132, Geltung ab 25.05.2018. Online: <https://www.bgbl.de/xaver/bgbl/start.xav#__bgbl__%2F%2F*%5B%40attr_id%3D%27bgbl117s2097.pdf%27%5D__1534145573026>, Stand: 13.08.2018.

- Niedersächsisches Datenschutzgesetz in der Fassung vom 16.05.2018 (Nds. GVBl. Nr. 6, S. 66). Online: <http://www.niedersachsen.de/politik_staat/gesetze_verordnungen/20080.html >, Stand: 04.09.2018.

- Urheberrechtsgesetz vom 9. September 1965 (BGBL I, Nr. 51), S. 1273-1293. Zuletzt geändert durch Art. 1 des Gesetzes vom 1. September 2017 (BGBL I, Nr. 61), S. 3346-3351. Online: <http://www.gesetze-im-internet.de/urhg/>, Stand: 14.02.2018.

- Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (Datenschutz-Grundverordnung) (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72). Online: <http://eur-lex.europa.eu/legal-content/DE/TXT/?uri=CELEX:32016R0679>, Stand: 14.02.2018.

1 FAIR principles, <https://www.force11.org/fairprinciples>, Stand: 13.08.2018.

2 Der Beitrag basiert auf Vorträgen gehalten bei den Open-Access-Tagen 2017 am 12.09.2017 in Dresden, (Anforderungen an Open-Access-Publikation von Forschungsdaten – Empfehlungen für einen offenen Umgang mit Forschungsdaten, <https://doi.org/10.15488/2554>) und beim 8. Workshop der DINI/nestor AG Forschungsdaten am 28.11.2017 in Stuttgart (Open-Access-Publikation von Forschungsdaten – Gestaltung des rechtlichen Rahmens für einen offenen Umgang mit Forschungsdaten,<http://www.forschungsdaten.org/images/f/f5/16--brehm-neumann--open-access.pdf>, Stand: 13.08.2018)

3 Rat für Informationsinfrastrukturen (RfII), <http://www.rfii.de/de/start/>, Stand: 13.08.2018.

4 European Commission: H2020 Programme. Guidelines on FAIR Data Management in Horizon 2020, Version 3.0, 26.07.2016, <https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf>, Stand: 17.02.2018.

5 DFG: Leitlinien zum Umgang mit Forschungsdaten, 2015, <www.dfg.de/download/pdf/foerderung/antragstellung/forschungsdaten/richtlinien_forschungsdaten.pdf>, Stand: 10.08.2018.

6 Herb, Ulrich: Open Science in der Soziologie. Eine interdisziplinäre Bestandsaufnahme zur offenen Wissenschaft und eine Untersuchung ihrer Verbreitung in der Soziologie, Glückstadt 2015. Online: <https://doi.org/10.5281/zenodo.31234>, Stand: 13.08.2018.

7 Fecher, Benedikt; Puschmann, Cornelius: Über die Grenzen der Offenheit in der Wissenschaft – Anspruch und Wirklichkeit bei der Bereitstellung und Nachnutzung von Forschungsdaten, in: Information - Wissenschaft & Praxis 66 (2-3), 2015, S. 146-150. Online: <https://doi.org/10.1515/iwp-2015-0026>, Stand: 13.08.2018.

8 Masum, Hassan; Rao, Aarthi; Good, Benjamin M. u.a.: Ten Simple Rules for Cultivating Open Science and Collaborative R&D, in: PLoS Computatonal Biology 9 (9), 2013: e1003244. Online: <https://doi.org/10.1371/journal.pcbi.1003244>, Stand: 13.08.2018.

9 Whyte, Angus; Wilson, Andrew: How to Appraise and Select Research Data for Curation. Digital Curation Centre How-to Guides, Edinburgh 2010. Online: <http://www.dcc.ac.uk/resources/how-guides/appraise-select-data>, Stand: 17.02.2018.

10 DFG: Sicherung guter wissenschaftlicher Praxis. Empfehlungen der Kommission „Selbstkontrolle in der Wissenschaft“, Weinheim 2013. Online: <http://doi.org/10.1002/9783527679188.oth1>, Stand: 10.08.2018.

11 Jones, Sarah; Guy Marieke; Pickton, Miggie: Research Data Management for librarians, 2013. Online: <http://www.dcc.ac.uk/training/rdm-librarians>, Stand: 17.02.2018.

12 Neylon, Cameron: NESTA – Science in Society, NESTA Crucible Workshop, 28.06.2009, <https://www.slideshare.net/CameronNeylon/nesta-science-in-society>, Stand: 17.02.2018.

13 Weitere Rechte können sich aus anderen Rechtsgebieten, z.B. dem immateriellen Güterrecht oder Geheimnisschutz ergeben. Auf die Darstellung kann im Rahmen dieses Artikels nicht eingegangen werden.

14 § 2 Abs. 2 UrhG, Urheberrechtsgesetz vom 9. September 1965 (BGBL I, Nr. 51, S. 1273-1293), zuletzt geändert durch Art. 1 des Gesetzes vom 1. September 2017 (BGBL I, Nr. 61), S. 3346-3351. Online: <http://www.gesetze-im-internet.de/urhg/>, Stand: 14.02.2018.

15 Dreier, Thomas; Schulze, Gernot; Specht, Louisa: Urheberrechtsgesetz. Kommentar, München 2015, § 2 Randnummer 14 f.

16 Ebd., § 2 Randnummer 37 f.

17 Ebd., § 2 Randnummer 41.

18 §§ 70, 72, 87a Urheberrechtsgesetz, zuletzt geändert durch Art. 1 des Gesetzes vom 1. September 2017 (BGBl. I S. 3346).

19 Dreier; Schulze: Urheberrechtsgesetz, § 28 Randnummer 3.

20 § 7 Urheberrechtsgesetz, zuletzt geändert durch Art. 1 des Gesetzes vom 1. September 2017 (BGBl. I S. 3346).

21 § 8 Urheberrechtsgesetz, zuletzt geändert durch Art. 1 des Gesetzes vom 1. September 2017 (BGBl. I S. 3346).

22 Art. 4 Nr. 1 Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (Datenschutz-Grundverordnung) (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72). Online: <http://eur-lex.europa.eu/legal-content/DE/TXT/?uri=CELEX:32016R0679>, Stand: 14.02.2018.

23 Gola, Peter: Datenschutz-Grundverordnung. VO (EU) 2016/679: Kommentar, München 2017, Art. 4 Randnummer 22, Art. 2 Randnummer 12, Art. 4 Randnummer 40.

24 Erwägungsgrund 14 Satz 2 Datenschutz-Grundverordnung (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72).

25 Art. 9 Abs. 1 Datenschutz-Grundverordnung (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72).

26 Art. 35 Datenschutz-Grundverordnung (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72).

27 Erwägungsgrund 33 Datenschutz-Grundverordnung (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72).

28 Art. 5 Abs. 1 Datenschutz-Grundverordnung (ABl. Nr. L119 S. 1, ber. Nr. L 314 S. 72).

29 Gola: Datenschutz-Grundverordnung, Art. 85 Randnummer 11 und 13, Art. 89 Randnummer 12 ff.

30 § 27 Abs. 4 Bundesdatenschutzgesetz in der Fassung vom 30.06.2017 (BGBL I, Nr. 44), S. 2097-2132, Geltung ab 25.05.2018. Online: <https://www.bgbl.de/xaver/bgbl/start.xav#__bgbl__%2F%2F*%5B%40attr_id%3D%27bgbl117s2097.pdf%27%5D__1534145573026>, Stand: 13.08.2018.

31 Vorgaben der Landesdatenschutzgesetze wie § 13 Abs. 3 Niedersächsisches Datenschutzgesetz in der Fassung vom 16.05.2018 (Nds. GVBl. Nr. 6, S. 66). Online: <http://www.niedersachsen.de/politik_staat/gesetze_verordnungen/20080.html> Stand: 04.09.2018.

32 Public Domain Mark 1.0 von Creative Commons, <https://creativecommons.org/publicdomain/mark/1.0/deed.de>, Stand: 16.02.2018.

33 CC0 1.0 Universal Public Domain Dedication, <https://creativecommons.org/publicdomain/zero/1.0/deed.de>, Stand: 16.02.2018.

34 European Commission: H2020 Programme, S. 4.