Content kuratieren

Das Projekt „GND für Kulturdaten“ (GND4C)

Detlev Balzer, BaliLabs, Lübeck

Barbara K. Fischer, Deutsche Nationalbibliothek, Frankfurt

Jürgen Kett, Deutsche Nationalbibliothek, Frankfurt

Susanne Laux, Landesarchiv Baden-Württemberg, Stuttgart

Jens Lill, Bibliotheksservice-Zentrum Baden-Württemberg, Konstanz

Jutta Lindenthal, BaliLabs, Lübeck

Mathias Manecke, Deutsche Nationalbibliothek, Leipzig

Martha I. Rosenkötter, Deutsches Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg

Axel Vitzthum, digiCULT Verbund eG, Kiel

https://lh3.googleusercontent.com/vKJQtcSk0eMFZmCBAZZnt8TsDb8rmpNDmncrPORgtPo8R3r5fYYSCoyAFRiT7e3L37qE0pVfQLGZFW-nSdE2IKDjrTYTgskduG3liZMziu0ucBM97vti7TqTcxOu0aNmILfAsSwW

Zusammenfassung

Die zunehmende Präsenz von Museen, Archiven, Forschungs- und anderen Kulturgut verwahrenden Einrichtungen mit ihren Sammlungsobjekten im Internet verstärkt das Bedürfnis nach Vernetzung der Daten. Eine Voraussetzung für die semantische Verknüpfung von Datensätzen sind gemeinsam verwendete Normdaten. Die Gemeinsame Normdatei (GND), geführt von der Deutschen National­bibliothek, ist ein weithin anerkanntes Vokabular für die Beschreibung und das Information-Retrieval in der Bibliothekswelt. Veröffentlicht als Linked Open Data, unterstützt die GND semantische Inter­operabilität und Nachnutzung von Daten. Objekte aus verschiedenen Häusern können zusammen aufgefunden werden und disziplinenübergreifende Forschung wird erleichtert. Doch um die GND sparten- und fächerübergreifend öffnen zu können, muss sie an die neuen Anforderungen angepasst und aktiv zwischen den Communities geteilt werden. In den vier Teilen des Beitrags geben Mitarbeiterinnen und Mitarbeiter des DFG-geförderten Projekts „GND für Kulturdaten“ (GND4C) einen Einblick in den Stand der Untersuchungen, welche konzeptuellen Veränderungen erforderlich sein werden und wo sich die GND bereits heute als flexibel genug für die Wünsche der neuen Anwendungen erweist.

Der erste Teil des Beitrags erläutert Ziel und Vorgehensweise des Projektes in vier thematischen Schwerpunkten: Organisationsstruktur des GND-Netzwerks, Datenmodell und Regelwerk der GND, technische Infrastruktur sowie Erfordernisse eines Dialogs über die Grenzen der Bibliothekswelt hinaus. Der zweite Teil beschreibt die Bedingungen und Erfordernisse für die Integration von Normdaten für Personen und Sachbegriffe in die GND, soweit diese nicht durch die Erschließungsarbeit der Bibliotheken vorgegeben sind. Daraufhin werden die Möglichkeiten des bestehenden Datenmodells und der bisher geltenden Regeln hinsichtlich ihres Anpassungspotenzials für historische Geografika sowie Bauwerke untersucht. Als ortsgebundene Entitäten haben Bauwerke Eigenschaften mit natürlichen Geografika gemeinsam, teilen als künstliche Objekte aber auch Eigenschaften der von Menschen geschaffenen Werke. Diese Dualität ortsgebundender Objekte gilt es, in der GND darstellbar zu machen. Im letzten Beitragsteil wird erläutert, warum es nur einen geringen Bedarf an einer konzeptionellen Änderung des Basisdatenmodells der GND gibt. Allerdings werden auch spezifische Eigenschaften identifiziert, die für Objekte aus Museen oder Archiven relevant sind und nicht vom aktuellen GND-Datenmodell abgedeckt werden. Diese zusätzlichen Anforderungen werden durch die Spezifikation von CORE- und PLUS-Bereichen erfüllt. Das CORE-PLUS-Modell unterscheidet zwischen Minimalanforderungen an einen Normdatensatz in einem CORE-Modell und zusätzlichen Regeln für einen jeweils community-spezifischen PLUS-Bereich. Ausblick und Fazit zeigen die noch offenen Fragen auf, deren Lösung in der zweiten Hälfte der Projektlaufzeit ansteht.

Summary

The growing online presence of museums, archives, research and other cultural heritage institutions requires efficient ways to semantically interlink the collection assets of our cultural treasures. One precondition for interlinking datasets is the shared use of authority files and controlled vocabularies. The Integrated Authority File (GND), managed by the German National Library, is a widely recognized vocabulary for description and information retrieval in library communities. Published as linked open data, the GND fosters semantic interoperability and re-use of data. Objects kept in different collections can be retrieved together, and cross-disciplinary research is facilitated. However, in order to open the GND for interdisciplinary and cross-domain use, it needs to be adapted and actively shared among the communities. In four parts of this article, members of the publicly funded project “GND for cultural data” (GND4C) give an insight into the state of the work, focusing on the question if, and to what extent the GND must adapt to the new requirements.

The first part of this article outlines the objectives and approaches of the project according to its four focal points: the organizational structure of the GND network, the data model and rule set for the GND, the technical infrastructure as well as the requirements for community-building and communication beyond the library community. The second part describes the conditions and requirements for incorporating authority data for persons and concepts into the GND, as far as they are not predefined by the cataloging needs of libraries. The third part of this article looks at the expressiveness of the existing data model and rule set with regard to the cataloging of historic geographical entities as well as buildings and other human-made structures. Being immovable, buildings share properties with natural geographical entities. As artificial objects, they have properties in common with human-made works of any kind. Representing this dual nature of location-bound objects is one of the challenges for modelling. In the last part the authors outline why there is little need for conceptual changes to the basic GND data model. However, they identify specific properties pertinent to museum and archival objects which are not yet covered by the current model. These additional demands are met by specifying CORE and PLUS rules. The CORE-PLUS model distinguishes between minimum rules to define an authority entity in the CORE model, and additional rules in the particular community-specific PLUS rule set. The conclusion gives an overview of the issues still to be resolved in the second half of the GND4C-project.

Zitierfähiger Link (DOI): https://doi.org/10.5282/o-bib/2019H4S59-97

1. Neuland – Museen und Archive als gleichberechtigte Partner in der GND-Kooperative

Jürgen Kett, Barbara K. Fischer und Axel Vitzthum

2012 legte die Deutsche Nationalbibliothek mit ihren Partnern mit dem Aufbau der global vernetzten Gemeinsamen Normdatei (GND) den Grundstein für eine fächer- und spartenübergreifende Normdatenbank. Sie gründet auf dem Zusammenschluss der Vorgängernormdateien: Personennormdatei (PND), Gemeinsame Körperschaftsdatei (GKD), Schlagwortnormdatei (SWD) sowie Einheitssachtitel-Datei des Deutschen Musikarchivs (DMA-EST-Datei). Damit verfügten die deutschsprachigen Bibliotheken erstmals über ein einheitliches Werkzeug zur Datenvernetzung.

Sie ist ein freies, nach einem Entity-Relationship-Modell strukturiertes Datenset. Die darin enthaltenen Datensätze bilden durch semantische Verknüpfungen einen Datengraphen. Diese Datensätze repräsentieren aktuell Entitäten wie Personen, Körperschaften, Geografika, Konferenzen, Werke und Sachbegriffe.

Gleichzeitig ist sie ein Bestandteil anderer Datengraphen und Netzwerke und verbindet Titel- und Objektdaten innerhalb einzelner Kataloge und untereinander (z. B. in Verbundkatalogen oder Portalen­ wie der Deutschen Digitalen Bibliothek). Die GND ist eine international anerkannte, fächerübergreifende, verknüpfte Datenbank und damit wichtiger Bestandteil des Semantic Web (wie z. B. der Linked Data Cloud) und baut so Datenbrücken zwischen Communities, wie z. B. zwischen Wikipedia und den Bibliothekskatalogen.

Schon zu Beginn stand die Idee im Raum, die GND zu einem spartenübergreifenden Instrument auszubauen und zum Rückgrat eines Semantic Web für Kultur und Wissen im deutschsprachigen Raum weiterzuentwickeln: eine gemeinsame Normdatei für und von Bibliotheken, Archiven, Museen, Mediatheken, Denkmalbehörden, Universitäten und Wissenschaftsnetzwerken sowie anderen Einrichtungen als gleichberechtigte Partner.

Genau darum geht es in dem DFG-geförderten Kooperationsprojekt „GND für Kulturdaten“ (GND4C), das im Mai 2018 offiziell gestartet ist. Es ist das zentrale Leuchtturmvorhaben auf diesem Weg – einem Weg mit unbestreitbar hohen Hürden, aber auch mit riesigen Chancen. Hierzu müssen abermals verschiedene Sichten und Prozesse zusammengebracht, Konzepte erweitert, Regeln erarbeitet, Standards vereinheitlicht, Schnittstellen entwickelt und organisatorische Strukturen geschaffen werden. Das braucht Zeit und kostet Geld. Vor allen anderen Dingen erfordert ein solches Vorhaben von allen Beteiligten Pioniergeist. Denn Neuland betreten wir mit diesem Projekt alle – die bisherigen und die neuen Anwendergruppen.

Diesen Pioniergeist bringen die GND4C-Partner mit. Stellvertretend für die große Vielfalt im Kulturbereich haben sich das Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) mit den Personendaten zu Künstlerinnen und Künstlern2, das Deutsche Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg (DDK) mit Bauwerken als Fallbeispiel3, das Landesarchiv Baden-Württemberg (LABW) mit der Fragestellung von historischen Orten4 und die Schleswig-Holsteinische Landes­bibliothek (SHLB) / digiCULT-Verbund eG zu Sachbegriffen des Deutschen Historischen Museums5 vorgenommen, die GND auf ihre spartenübergreifende Eignung hin zu analysieren. Die Deutsche Nationalbibliothek (DNB) und die Deutsche Digitale Bibliothek (DDB) koordinieren die Aufgaben, steuern mit ihrer jeweiligen Fachexpertise die Entwicklung von Lösungskonzepten an und koppeln diese zurück in die bestehende GND-Gemeinschaft.

Zwar wirken bereits einige Museen, Archive und Forschungsprojekte an der GND mit, sind dabei aber meist an Bibliotheken oder Bibliotheksverbünde angeschlossen und durch deren Expertise in der Lage, sich in der bibliothekarischen Umgebung der GND zu bewegen. Da die GND von bibliothekarischen Partnern erstellt wurde und ihre Kernaufgabe bislang auf der bibliografischen Erschließung liegt, wird sie den Bedarfen von Partnern aus dem Kulturbereich wie Museen, Denkmalämtern oder Forschungsinstituten nur eingeschränkt gerecht. Für eine großangelegte Partizipation anderer Kultursparten müssen zunächst systematisch Voraussetzungen geschaffen werden – organisatorisch, inhaltlich, technisch und im Bereich der Kommunikation. Diese vier verschiedenen Ebenen entsprechen konsequenterweise auch den vier fachlichen Arbeitspaketen des Projekts GND4C mit den folgenden Zielen:

  1. Nachhaltiger Aufbau einer sparten- und fächerübergreifenden Organisation,
  2. Weiterentwicklung des Datenmodells und der Regeln im Hinblick auf nicht-bibliothe­karische Anwendungskontexte,
  3. Bereitstellung von Schnittstellen und Werkzeugen zur Unterstützung nicht-bibliothe­karischer Anwendungskontexte,
  4. Stärkung der Kommunikation mit den verschiedenen Interessengruppen über ­verschiedene Kommunikationskanäle und Sichtbarmachen des GND-Netzwerks.

Das Projekt verfolgt diese Ziele in zwei Phasen. Der Testbetrieb startet erst in der zweiten Phase. Die erste, zweieinhalb Jahre andauernde Projektphase widmet sich schwerpunktmäßig der Grundlagenarbeit: Evaluieren von Bedarfen und Rahmenbedingungen, Entwickeln von Konzepten und Aufbau von Prototypen und Pilotdienstleistungen.

Die Konzeptentwicklung in allen Arbeitspaketen erfolgt anhand repräsentativer und gleichzeitig besonders vielversprechender Fallbeispiele nicht-bibliothekarischer Anwendungskontexte, die die bisherigen Strukturen der GND herausfordern:

Die spezifischen Erkenntnisse aus dem Blickwinkel der Fallbeispiele werden in den anschließenden Abschnitten erläutert. Hier folgt zunächst ein Überblick über den jeweils erreichten Stand der einzelnen Arbeitspakete nach rund einem Jahr Projektlaufzeit.

1.1. Einblick in Arbeitspaket 1: Aufbau einer sparten- und fächerübergreifenden Organisation

Die gleichberechtigte Einbindung der neuen Interessengruppen in die Organisation und Kommunikation hat in der ersten Projektphase oberste Priorität. Nicht zuletzt als Vorbereitung auf die Öffnung der GND wurde 2017 die GND-Kooperative gegründet. Das mehrstufige Organisationsmodell, bei dem die Arbeit durch den Standardisierungsausschuss (STA) gesteuert wird, umfasst einen GND-Ausschuss, eine GND-Zentrale, also die Geschäftsstelle in der Deutschen Nationalbibliothek, GND-Agenturen und Teilnehmer und Teilnehmerinnen.

Die Aufgabe des Projekts besteht nun darin, tragfähige Konzepte zur Erweiterung dieser Organisa­tionsstruktur für die Partizipation weiterer Kultursparten zu entwickeln. Dies beinhaltet auch die Konzeption von Abstimmungsprozessen und Beteiligungswegen. Das wichtigste organisatorische Element ist der Aufbau neuer GND-Agenturen, welche die Rolle von Koordinierungsschnittstellen, unter anderem zwischen GND und den verschiedenen Kultursparten, übernehmen sowie eine Mitwirkung der Kultureinrichtungen auf allen erforderlichen Ebenen ermöglichen. Am Ende der ersten Projektphase soll der Pilotbetrieb von GND-Agenturen für die im Projekt adressierten Fallbeispiele durch die Projektpartner stehen.

GND-Agenturen gibt es bereits heute, beispielsweise in den Zentralen der Bibliotheksverbünde. Sie haben ein breites Aufgabenportfolio. Doch neue Bedarfe aus anderen Sparten oder Kontexten bringen auch neue Aufgaben mit sich. Abbildung 3 zeigt in Form eines Baumes die Vielfalt der denkbaren Aufgaben einer GND-Agentur, die wir im Rahmen unserer Bestandsaufnahme und Bedarfsanalyse ermittelt haben.6

Diese Dienste lassen sich grob in fünf Kategorien aufteilen: Beratung und Support (pink), Community-­Arbeit (rot), Regeln und Standards (grün), Redaktion und Datenqualität (gelb) und technische Dienste (blau). Dieser Baum ist nur eine idealtypische Darstellung von vielen Dienstleistungs- und Aufgabenmodellen, die GND-Agenturen ihren Sparten und Communities anbieten können. Eine reale Agentur wird ihr Portfolio und die Ausprägung der Dienste auf die spezifischen Bedarfe ihrer Zielgruppe ausrichten. Einige Gruppen benötigen beispielsweise eine starke Zentralredaktion, weil sie selbst kaum redaktionelle Erfahrungen und Möglichkeiten haben. Andere Agenturen haben eher die Rolle einer Koordinierungsstelle, die die redaktionelle Arbeit verteilt.

Wie viel wird der Betrieb einer GND-Agentur konkret kosten? Aus unseren Analysen ergibt sich, dass einige Dienste einen starken Einzelbetreuungsaufwand bedeuten (Blätter mit weißen Vögeln). Für diese ist es nicht sinnvoll, den Aufwand pauschal abzuschätzen, sondern sie müssen fallspezifisch, in Abhängigkeit von Faktoren wie der Zahl der zu betreuenden Einrichtungen und deren konkreten Voraussetzungen betrachtet werden. Andere Dienste (Blätter mit schwarzen Vögeln) lassen sich hingegen gut auf einheitliche Weise für eine gesamte Fachcommunity umsetzen. Natürlich besteht auch hier ein Zusammenhang zwischen Aufwand und Größe der Community, dieser schlägt aber deutlich weniger zu Buche als andere Faktoren. Zudem besteht bei den Kundendiensten eine unmittelbare gegenseitige Abhängigkeit und Verbindlichkeit zwischen Agentur und mitwirkender Einrichtung, was in der Regel eine vertragliche Vereinbarung zwischen den Parteien notwendig macht. Selbstverständlich können die aufgeführten Kundendienste durch eine pauschal finanzierte Agentur (z. B. durch einen öffentlichen Träger) erbracht werden. Die Kalkulation des Budgets muss dann allerdings die Anzahl und Komplexität der zu betreuenden Einrichtungen berücksichtigen. Um potenziellen Agenturen eine fundierte Abschätzung zu ermöglichen, werden im weiteren Verlauf des Projekts praktikable Berechnungsmodelle entwickelt. Für die bislang detailliert betrachteten Communities lässt sich zumindest eine untere Grenze bereits jetzt beziffern: Unterhalb eines Vollzeitäquivalents per anno ist der Betrieb einer Agentur nicht sinnvoll. Hierbei ist zu beachten, dass es sich natürlich empfiehlt, die erforderlichen, sehr vielfältigen Kompetenzen möglichst auf mehrere Personen zu verteilen. Optimale Voraussetzungen haben hier Einrichtungen, die bereits vergleichbare Aufgaben erfüllen (wie z. B. Einrichtungen, die Fachstellen für die Deutsche Digitale Bibliothek oder ähnliche zentrale Dienstleistungen für die Kulturdomäne betreiben).

Zudem muss das benötigte Portfolio für eine bestimmte Community nicht durch eine einzelne Einrichtung abgedeckt werden. Kooperativ aufgebaute Agenturen oder Kooperationen zwischen Agenturen könnten helfen, Leistungspaletten zu vervollständigen. Dadurch, dass Kooperationspartner von dem Know-how der anderen lernen und profitieren, könnten Kooperationen für Agenturen zum Medium des wichtigen Wissenstransfers werden.

1.2. Einblick in Arbeitspaket 2: Weiterentwicklung des Datenmodells der Regeln

Auch die bestehenden fachlichen Strukturen und Regeln müssen den Bedarfen der alten und der neuen Anwenderkreise gleichermaßen gerecht werden. Als zentrales Konzept für die fachliche Konsensbildung verfolgt das Projekt einen Ansatz aus dem GND-Entwicklungsprogramm8
– ­das „CORE-PLUS-Modell“. Dessen Hauptanliegen ist die Erarbeitung eines gemeinsamen, für alle verbindlichen spartenübergreifenden Standards, um den sich allerdings modular interessenspezifische Erweiterungen, im sogenannten PLUS-Bereich, gruppieren können. Diese PLUS-Bereiche sollen der Tatsache Rechnung tragen, dass es berechtigte Unterschiede bei den Anforderungen der Interessengruppen an Normdaten gibt.

Die Bedarfe nicht-bibliothekarischer Anwendungen wurden im Projekt über die Analyse der Fallbeispiele9, aber auch aus den Erfahrungen der letzten Jahre mit der Zusammenarbeit mit Museen, Archiven und Forschungsprojekten ermittelt. Zwar gehen wir davon aus, mit dieser Auswahl das Gros der Anforderungen erfasst zu haben, dennoch können mit jedem neuen Partner und jeder neuen Community weitere Anforderungen hinzukommen. Das künftige Fachkonzept der GND muss für solche Veränderungen offen sein.

Diese Flexibilität ist auf der Ebene des Datenmodells gegeben: Die GND bietet ein reichhaltiges Angebot an Möglichkeiten, Entitäten zu beschreiben – sei es über textuelle Merkmale wie Bezeichnungen oder über Relationierungen, die spezifizieren, in welchem Verhältnis eine Entität zu einer anderen steht. Besonders mächtig, aber auch anspruchsvoll ist die Integration von Sachbegriffen und individuellen Entitäten. Damit kann innerhalb eines Datenraums das Beziehungsgeflecht zwischen Individualentitäten und Allgemein- und Gattungsbegriffen dargestellt und prinzipiell ein fließender Übergang zwischen Individual- und Allgemeinbegriff in der GND ermöglicht werden. Aufgrund dieser guten Voraussetzung im Bereich des Datenmodells lassen sich die im Projekt ermittelten Minimalanforderungen in den bestehenden Strukturen umsetzen.

Etwas schwieriger stellt sich die Situation auf der Ebene der Regeln dar: Diese stehen teilweise im Konflikt mit den Anforderungen und vorliegenden Rahmenbedingungen. Zwar erhebt der für die GND maßgebliche Standard Resource Description and Access (RDA)10 einen Anspruch als spartenübergreifendes Regelwerk, aber insbesondere die darauf basierenden GND-Erfassungsleitfäden und Hilfen haben in erster Linie bibliothekarische Erschließungsprozesse im Blick. Gleiches gilt für die „Regeln für die Schlagwortkatalogisierung (RSWK)“11 , welche die Anwendung der GND im Rahmen der bibliothekarischen Inhaltserschließung regeln. Problembereiche sind insbesondere die Regeln zur Bildung von Benennungen sowie fehlende Beziehungskennzeichen. Aber auch Regeln zur Fest­legung, ab wann Sachverhalte durch mehrere eigenständige Entitäten ausgedrückt werden (häufig als „Splitting-Regeln“ bezeichnet), sind für nicht-bibliothekarische Anwendungen häufig nicht praktikabel.

Einige dieser Probleme lassen sich durch einfache Regelerweiterungen lösen, andere aber würden tiefe Eingriffe in die Regeln und auch den Datenbestand bedeuten. Im weiteren Verlauf des Projektes werden wir hierzu Konzepte und Handlungsoptionen erarbeiten, um diese innerhalb der Community zu diskutieren.12

1.3. Einblick in Arbeitspaket 3: Die Bereitstellung von Schnittstellen und Werkzeugen

Mit den neuen Anwendergruppen wird die Zahl der in der GND registrierten Entitäten und Änderungen stark ansteigen. Dies fällt in eine Zeit, in der mehr Medien und Kulturobjekte zu erschließen sind als je zuvor, also weniger Bearbeitungszeit pro Objekt verbleibt und zunehmend auf Automatisierung und Datenübernahme gesetzt wird. Damit die GND-Redakteurinnen und -Redakteure dennoch den Überblick behalten, Dubletten vermeiden und effizient arbeiten können, müssen sich die Redaktions­umgebungen und Werkzeuge deutlich weiterentwickeln.

Bei den weiteren Kultursparten ist am Anfang der Öffnung der GND insbesondere mit einem erhöhten Bedarf an neuen Normdaten zu rechnen, der über die bibliothekarischen Anforderungen hinausgeht. Die Datensätze liegen oft schon strukturiert als Quelldaten vor, allein der Import steht aus. Vor einem gewünschten Massenimport muss aber sichergestellt werden, dass dieser nicht unnötige Dubletten in die GND spült. Die Quelldaten sollen sortiert werden in Datensätze, die bestehende GND-Datensätze sinnvoll ergänzen, in neue GND-Datensätze und solche, die bereits in der GND enthalten sind, eben die Dubletten.

Abbildung 5: Datenfluss, technische Architektur von GND4c

Abbildung 5 zeigt die grobe technische Architektur von GND4C.13 Die externen Datenbestände der vier Fallbeispiele (Personen, Geografika, Sachbegriffe, Bauwerke) werden zunächst in den normalisierten Datenspeicher (NDS) importiert. Aus dem NDS werden die Metadaten über ein JSON-API in die Lucene-basierte Solr-Suchplattform übernommen. Von hier aus stehen die normalisierten Quelldaten der Werkzeugkiste zur Verfügung.

Der Matching-Service durchsucht unterschiedliche Quell- und Zieldaten auf übereinstimmende oder ähnliche Zeichenketten. Die vom Matching-Service automatisch gelieferten Matches sind Kandidaten für den intellektuellen Mapping-Prozess. Dabei werden im Mapping-Service semantisch übereinstimmende Begriffe oder Entitäten mit Angabe der Art der Übereinstimmung aufeinander abgebildet.14 Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder gegebenenfalls korrigiert. Am Ende des Prozesses teilt sich der Quelldatenbestand in die drei oben genannten Kategorien auf: neue GND-Datensätze, Ergänzungen zu bestehenden GND-Datensätzen und nicht zu importierende Dubletten. Der Import von Daten in die GND verläuft über die existierenden, in Betrieb befindlichen Prozesse und Infrastrukturen.

Der gewählte Ansatz bietet auch einen großen organisatorischen Vorteil: Bislang konnte die Datenanalyse und Qualitätssicherung nur durch die GND-Zentrale an der Deutschen Nationalbibliothek selbst durchgeführt werden. Zudem konnten Aufräumarbeiten erst nach der Einspielung in die GND beginnen. Zur Gewährleistung des reibungslosen Betriebs wird die Endabnahme und letztendliche Einspielung zwar immer durch die Deutsche Nationalbibliothek erfolgen, aber ein großer Teil der Arbeit könnte mit den neuen Werkzeugen durch die Datenlieferanten und deren Agenturen im Vorfeld erledigt werden – ein wichtiger Beitrag zu einer deutlich produktiveren Arbeitsteilung.

1.4. Einblick in Arbeitspaket 4: Community-Arbeit und Öffentlichkeitsarbeit

Bevor Normdaten unsere kulturellen Bestände semantisch vernetzen können, müssen sich zunächst einmal die beteiligten Communities, die diese Normdatenverbindungen später als selbstverständlichen Teil ihres Arbeitsalltags erstellen sollen, besser verstehen. Für das GND-Netzwerk bedeutet dies, sich für Blickwinkel aller Kultursparten zu öffnen und Elemente aufzunehmen, für die die GND bisher nicht gemacht war. Umgekehrt gilt es für die neuen Anwender, die GND auf ihrem aktuellen Stand und in ihren bisherigen Zielen kennenzulernen. Die Deutsche Nationalbibliothek, die GND-Kooperative und die GND4C-Partner unternehmen gemeinsam große Anstrengungen, um den Austausch auf unterschiedlichen Ebenen zu fördern. Er muss gleichermaßen nach innen in den bibliothekarischen Raum wie community-spezifisch nach außen stattfinden. Im Standardisierungsausschuss sind bereits Archive vertreten, andere Sparten werden folgen. Über diverse Kommunikationskanäle von Fachpub­likationen über Fachtagungen bis hin zu Twitter besteht das Angebot zum Dialog.

Um den Austausch aller Beteiligten zu intensivieren, fand im Dezember 2018 in der Deutschen Nationalbibliothek in Frankfurt am Main die erste GND-Convention, kurz GNDCon, statt. Mit 300 Teilnehmerinnen und Teilnehmern aus GND-Redaktionen, Bibliotheken, Museen, Archiven, Forschungsinstitutionen, Verlagen und der Entwicklerszene war die Veranstaltung sehr gut besucht. Parallel wurde die Ausstellung „Die GND vor Augen“ gezeigt. Sie präsentierte und erklärte die GND aus unterschiedlichen Perspektiven. Diese Veranstaltung leitete eine Reihe interner und externer Arbeitstreffen und gemeinsamer Diskussionsrunden ein, die als Plattformen des aktiven Austausches die Kommunikation zwischen den betreffenden Communities vorantreiben, zuletzt auf dem GND4C-Forum im Juni 2019.15

Die folgenden Teilbeiträge widmen sich den einzelnen detaillierten Überlegungen, die sich aus den Arbeitspaketen auf der bisherigen Werkbank GND4C ergeben. Der zweite und dritte gehen auf die spezifischen Herausforderungen und Lösungsansätze bei der Betrachtung der konkreten Fallbeispiele des Projektes ein. Im vierten werden die notwendigen Weiterentwicklungen des Datenmodells und der Regeln (Arbeitspaket 2 des GND4C-Projekts) betrachtet. Insbesondere die Relevanzkriterien, wie auch die CORE- und PLUS-Bereiche werden näher beleuchtet. Am Ende folgen ein kurzer Ausblick auf den weiteren Projektverlauf und ein Fazit.

2. Personeninformationen und Sachbegriffe aus Museen in der GND und ihre Repräsentation im GND-Datenmodell

Jens M. Lill, Jutta Lindenthal und Detlev Balzer

2.1. Standardisierung in der Museumsdokumentation: Ausgangslage in Deutschland16

In der allgemeinen Objektdokumentation und wissenschaftlichen Dokumentation musealer Forschungsdaten nehmen Personeninformationen wie zum Beispiel Lebensdaten, Wirkungszeiten und -orte, ausgeübte Berufe oder Rollen/Funktionen eine ebenso zentrale Rolle ein wie in der bibliothekarischen Erschließung; Sachbegriffe werden dagegen eher für die Beschreibung von Objekteigenschaften wie Objekttyp, Material- und Technikangaben oder zur zeitlichen Einordnung (Stil- und Epochenbezeichnung) verwendet und weniger für eine thematische (inhaltliche) Erschließung, wie dies bei den Bibliotheken der Fall ist.

Voraussetzung für eine zukunftsfähige Dokumentation ist die Verwendung und Einhaltung anerkannter Standards und Regelwerke sowie die konsequente gemeinsame Nutzung von Normdaten. Wenngleich deren Potenziale verstärkt seit Einführung der softwarebasierten Erfassung durchaus erkannt worden sind, fehlt es bislang an einem allgemein verbreiteten Standardisierungskonzept im deutschen Museumsbereich. Die Gründe dafür sind vielfältig und reichen von einer fehlenden zentralen Lenkungs- und Organisationsstruktur bis hin zu den heterogenen, teils unikalen Beständen, für die allgemeingültige Lösungen gefunden werden müssen. An überzeugenden Vorschlägen und Standardisierungsinitiativen verschiedener Arbeitsgruppen und Verbünde fehlte es in der Vergangenheit nicht: Das MIDAS-Regelwerk17 orientierte sich in seiner Entstehungsphase in den 1980er Jahren an den Bibliotheken, konnte sich aber ebenso wenig durchsetzen wie der 1993 von der Arbeitsgruppe Dokumentation des Deutschen Museumsbunds herausgegebene Datenfeldkatalog zur Grundinventarisation18 oder die International Guidelines for Museum Object Information19 des CIDOC. Die Verwendung softwarebasierter Erfassungssysteme seit den 1990er Jahren führte de facto zwar zu schleichenden Standardisierungsansätzen auf Feldebene, minderte jedoch nicht die Vielfalt an hauseigenen, meist nicht austauschbaren Insellösungen beim Erschließungsvokabular.20 Ein Desiderat ist daher vor allem die einheitliche Erschließung mit verbreiteten, qualitativ hochwertigen kontrollierten Vokabularen.

Im Zuge der digitalen Transformation von Museumsdaten haben in den letzten Jahren insbesondere die Deutsche Digitale Bibliothek (DDB) sowie zahlreiche Fach- und Regionalportale als Katalysator gewirkt: Das internationale Harvestingformat LIDO21 findet im deutschen Museumsbereich zunehmend Anwendung für Datenlieferungen aller Art; ebenso wird die Anreicherung von Metadaten mit GND-Identifiern forciert, um heterogene Datensätze in spartenübergreifenden Kulturportalen miteinander präsentieren zu können.

In beiden Fällen – Personeninformationen und Sachbegriffe – hat sich die GND in der Museumsdokumentation bislang noch nicht flächendeckend etabliert, da ein großer Teil der verwendeten Schlagwörter zu Sachbegriffen oder Personen noch nicht in der GND verfügbar ist. Ein quantitativer Ausbau der GND wäre daher ein wichtiger Schritt zu einer verbreiteten Nachnutzung, einer besseren Metadatenqualität sowie auch Voraussetzung für ein verlässliches, semantisches Retrieval in Kultur­portalen wie der DDB oder Europeana, aber auch den Datenbanken der einzelnen Institutionen. Gleichzeitig bedarf es einer breiteren Diskussion hinsichtlich der Relevanzkriterien für die Aufnahme neuer Datensätze, um die Verlässlichkeit und Qualität der GND zu erhalten. Im Projekt GND4C wird diesen Fragestellungen in konkreten Fallanalysen nachgegangen.

2.2. Fallanalyse Personen

Für die zeitliche, geografische oder kontextuelle Zuordnung von Objekten des kulturellen Erbes nehmen Personeninformationen eine zentrale Stellung ein. GND-referenzierte Personennormsätze ermöglichen die eindeutige Identifizierung von Personen sowie deren semantische Vernetzung mit anderen Entitäten und wissenschaftlichen Ressourcen. Obwohl (individualisierte) Personennormsätze den überwiegenden Teil der GND ausmachen, lässt der Abdeckungsgrad von im Museumsbereich relevanten Personen noch zu wünschen übrig: Zeitgenössische Künstler, abgebildete Personen auf Bildwerken, Münzherren und Münzmeister, Kunsthandwerker an Fürstenhöfen als Objekthersteller,­ taxonomische Bestimmer oder Sammler von naturkundlichen Objekten oder Voreigentümer im Rahmen der Provenienzforschung usw. sind in bibliothekarischen Kontexten meist noch nicht in Erscheinung getreten und aufgrund der anlassbezogenen Erfassung in der GND bislang nicht enthalten.

In Anbetracht dessen hat das BSZ Personendaten aus verschiedenen Museen und Sammlungen analy­siert, um einerseits herauszufinden, inwieweit das Datenmodell der GND-Personen mit den Anforderungen aus der Museumswelt zurechtkommt und andererseits, welche Voraussetzungen erfüllt sein müssen, damit eine Datenanreicherung beziehungsweise -integration in der GND gelingen kann.

2.2.1. Die Datengrundlage

Mit dem Fokus auf der Verzeichnung von Künstlerinnen und Künstlern für die museale Forschung wurden für die Untersuchungen Personendaten aus einem Kunstmuseum (Staatliche Kunsthalle Karlsruhe) und den beiden Kunstsammlungen der Mehrspartenhäuser Stiftung Schloss Friedenstein Gotha sowie Städtische Museen Freiburg des am BSZ betreuten MusIS-Verbunds22 (Kooperationsverbund der Staatlichen Museen in Baden-Württemberg) ausgewählt. Zusätzlich konnte man auf einen Auszug aus dem Allgemeinen Künstlerlexikon (AKL)23 zurückgreifen, der uns freundlicherweise vom Verlag De Gruyter zur Verfügung gestellt wurde. Um auch noch andere Personenkreise zum Beispiel­ aus der Archäologie, Ethnologie, Kulturgeschichte, Numismatik oder Naturkunde abdecken zu können,­ wurden in die Auswertung die entsprechenden Sammlungen aus Gotha und Freiburg sowie Personendaten aus dem Linden-Museum Stuttgart und dem Staatlichen Museum für Naturkunde Karlsruhe einbezogen. Insgesamt konnten für die Datenanalyse somit etwas mehr als 40.000 Personendatensätze konsultiert werden.

2.2.2. Die Datenanalyse

Anhand der vorliegenden Personendaten wurde das Datenmodell der GND-Personen analysiert und Vorschläge für dessen Ergänzung identifiziert. Erfreulicherweise hat sich gezeigt, dass die meisten Anforderungen in der GND-Ontologie bereits abgedeckt sind: Individualisierende Angaben zu Personennamen (Namensvarianten, Beinamen), Zeitangaben zur Person (Lebensdaten, Wirkungszeit), analog dazu Relationen zu Geografika (Geburts-, Sterbe-, Wirkungsort), zu Sachbegriffen (Berufe, Adelsstand) oder zu Körperschaften und anderen Personen.

Gerade hinsichtlich der Angabe von Verwandtschaftsbeziehungen oder Schüler-Lehrer-Relationen bei Künstlerinnen und Künstlern ergibt sich aber der Wunsch nach einer Präzisierung: Bislang können diese nur als Bemerkung (Freitext) im Anschluss an eine familiäre beziehungsweise berufliche Beziehung angegeben werden – eine Ausgestaltung als codierte Relation ließe dagegen eine bessere­ ­maschinelle Auswertung erwarten.24 Ähnlich verhält es sich bei Relationen zu Werken, Sammlungen oder Familien: In der Praxis werden diese nur von den jeweils anderen Entitäten auf die entsprechenden­ Personennormsätze gesetzt – reziproke Verknüpfungen könnten gleichermaßen Zusammenhänge und neue Erkenntnisse aufzeigen, die ansonsten im Verborgenen bleiben würden.

In einem GND4C-Workshop zu Personennormdaten mit der Museumscommunity25 wurden weitere­ Vorschläge für Erweiterungen ermittelt, die es im CORE-PLUS-Modell zu verorten gilt. Um nur einige zu nennen: Angabe von Quellenbelegen zu einzelnen Aussagen für eine transparente Qualitäts­sicherung, Unterscheidung von Berufs- und Funktionsangaben, Zeit-Ort-Relation, Relation zu historischen Ereignissen, Beschreibung von Künstlersignaturen wie Handzeichen, Marken, Monogrammen auf grafischen Blättern oder Porzellanobjekten sowie die Beschreibung von Steinmetz- und Zimmermannszeichen zur Identifizierung von Personen beziehungsweise die Verlinkung (und/oder Einblendung) entsprechender Online-Quellen.26

Ein häufig vorgebrachter Wunsch war auch, Identifier aus anderen biografischen Korpora wie zum Beispiel dem Lexikon zur Kunst in der Schweiz (SIKART)27 oder dem in die Untersuchung eingebundenen AKL als Äquivalenz-Relation im Datenfeld für sonstige Standardnummern erfassen zu können – und nicht nur als Quellenangabe wie bislang praktiziert (und dann meist ohne Angabe einer ID). Als Verlagsprodukt ist das AKL subskriptionspflichtig und zugangsbeschränkt und bislang wegen enger Nachnutzungskonditionen nicht für Linked-Open-Data-Anwendungen geeignet.28 In Kunstmuseen (und -bibliotheken) ist es als Standardwerk allerdings weit verbreitet und wird in der Liste der fach­lichen Nachschlagewerke als Quelle für die Ansetzung von bildenden Künstlern aufgeführt.

2.2.3. Die Datenqualität

So erfreulich das Ergebnis der Fallanalyse in puncto Datenmodellierung ist, bei der Qualität der Quelldaten sieht das leider anders aus: Viele individualisierende Merkmale zu Personen finden sich oft nur in biografischen Beschreibungen oder anderen Freitextfeldern. Neben einer breiten Fülle an Datumsformaten beziehungsweise deren literalen Umschreibungen (um, circa, vor, nach; sowie etliche Abkürzungsformen für Jahrhundertangaben), herrscht softwareübergreifend – dem eingangs geschilderten fehlenden Standardisierungskonzept geschuldet – auch noch ein wahrer Felder-„Wildwuchs“ hinsichtlich der Benennung gleicher Kontexte. Sieht man sich hier schon beim Datenaustausch (Stichpunkt: LIDO-Transformation) vor Herausforderungen gestellt, hat dies natürlich auch unmittelbare Auswirkungen auf die Verlässlichkeit automatisierter Matching-Prozesse im Matching-Service.

Unabdingbar erscheint vor diesem Hintergrund die Normalisierung der Quelldaten in ein einheit­liches Lieferformat: Datumsformate sowie unscharfe Zeitangaben mit Präfixen (um, circa, vor, nach) werden in ein ISO 8601-konformes Format29 umgewandelt. Dabei gilt es, projektintern die Größe der Unschärfe von literalen Umschreibungen zu definieren und in eine Zeitraumangabe mit festem Start- und Endwert zu überführen. Neben den Zeitangaben spielen zur Identifizierung und Individualisierung von Personen auch Orts- oder Berufsangaben eine Rolle. Für einen automatisierten Matching-Prozess bedeutet dies (vor allem bei großen Treffermengen) die Implementierung eines mehrstufigen Verfahrens, an dessen Ende unter Umständen aber immer noch ein intellektuelles Mapping stehen kann/muss. Ausschlaggebend hierfür ist nicht allein die Qualität der Lieferdaten, sondern auch die der Zieldatensätze – denn auch in der GND gibt es noch etliche fehlerhafte Personeninformationen oder gar falsche Ansetzungen.

Der Weg zum spartenübergreifenden Gemeinschaftsunternehmen GND mag für den ein oder anderen noch etwas holprig erscheinen: So manche neue Anforderung muss noch diskutiert, so manche neue Eigenschaft oder Relation modelliert, so manche bestehende Anwendungsregel modifiziert werden. Fakt ist, dass sich die GND nur durch die interdisziplinäre Zusammenarbeit zu einem Knotenpunkt im globalen Wissensnetz weiterentwickeln und langfristig als Gemeinsame Normdatei für alle Kultur- und Wissenseinrichtungen etablieren kann.30

2.3. Fallanalyse Sachbegriffe

Braucht die Gemeinsame Normdatei (GND) eine Badekarre? Oder vielleicht Schilduhr, Rommelspargel, Cithrinchen? Und wenn ja, warum und in welcher Weise?

Das Projekt „GND für Kulturdaten“ (GND4C) will Museen ermuntern, vermehrt die GND zu nutzen und zu ihrer Weiterentwicklung beizutragen. Viele der aktuell über 200.000 Sachbegriffe der GND sind auch für die Museumsdokumentation geeignet. In Museen werden Sachbegriffe, anders als in Bibliotheken, nicht überwiegend zur thematischen Erschließung verwendet, sondern zur Beschreibung der besonderen Objekteigenschaften: allen voran der Objekttyp, der aussagt, was ein Ding ist. Material, Technik, Stil oder Epoche sind weitere Objektmerkmale, für die Normdaten gebraucht werden.

Heute bietet die GND als RDF-basiertes Vokabular, orientiert an Standards für Information-Retrieval-Thesauri,31 formal gute Voraussetzungen, die semantische Vernetzung von Daten über Sparten und Domänen hinweg zu unterstützen. Da die GND ursprünglich jedoch nicht als Wissensorganisationssystem angelegt war, vielmehr mit dem praktischen Bedarf an Normschlagwörtern gewachsen ist, erfüllt sie inhaltlich-strukturell noch nicht alle Voraussetzungen, um das Rückgrat eines maschinenlesbaren, semantischen Netzes der Kultur und Wissenschaft zu sein.

Den Museen stehen mit dem Austauschformat LIDO32 und den Vokabularen und Regelwerken des Getty Research Institute33 exzellente Instrumente für die Erschließungsarbeit zur Verfügung, die aber noch kaum beachtet werden. Es dominieren hauseigene Instrumente und Regeln, oder es wird frei erschlossen. Auch die GND wird, wie Erhebungen34 zeigen, in der Museumsdokumentation bisher kaum verwendet.

Vor diesem Hintergrund werden die Voraussetzungen, unter denen Schlagwörter aus der Museumssparte für eine Ergänzung der GND in Frage kommen, und die Frage, wie eine Datenintegration gelingen könnte, untersucht.

2.3.1. Die Datengrundlage

Für die Untersuchung wurden drei Vokabulare ausgewählt, die als weitgehend repräsentativ für Museen angesehen werden können. Folgende Einrichtungen haben dankenswerterweise ihre Daten zur Auswertung zur Verfügung gestellt:

  1. Stiftung Deutsches Historisches Museum (DHM): 30.445 Deskriptoren,
  2. Deutsches Dokumentationszentrum für Kunstgeschichte (DDK): 10.478 Deskriptoren,
  3. Das Portal „Museen im Saarland“: 3.668 Deskriptoren.

Diese drei Korpora geben einen Eindruck von der Spannbreite der Museumsdokumentation zwischen normierter Erschließung und freier Beschreibung:

Die Stiftung Deutsches Historisches Museum (DHM) hat einen umfangreichen Bestand mit breiter­ inhaltlicher Abdeckung. Das Vokabular basiert auf der Schlagwortnormdatei (SWD), die heute Bestandteil der GND ist, und enthält etwa 1.000 zusätzliche Begriffe. Die Indexierung ist an dokumen­tarischen Inhaltsstandards35 orientiert. Dabei ist das DHM eines der wenigen Museen, die auch inhaltlich erschließen und dafür die GND nutzen.

Das Deutsche Dokumentationszentrum für Kunstgeschichte (DDK) verfügt über einen großen Bildbestand zu verschiedenen Objekttypen, insbesondere auch Bauwerken. Erschlossen wird nach Hausregeln mit eigenem Vokabular, das die Deskriptoren, ergänzt um spezifische Formschlagwörter,­ facettiert organisiert. Von Vorteil für unsere Auswertung sind die teilweise bereits vorliegenden Mappings zur GND und zum Art & Architecture Thesaurus (AAT). Auch das DDK erschließt seine Objekte inhaltlich, nutzt für diesen Zweck aber ausschließlich Iconclass.36

Das Portal Saarland ist ein Beispiel für kleine Museen, die zum Teil auch frei indexieren. Das Vokabular entstammt einer Datenkumulation aus 26 Museen zu ganz unterschiedlichen Themengebieten.

Die Datengrundlage wurde auch im Hinblick auf einen möglichen Nutzen für die Deutsche Digitale Bibliothek (DDB) gewählt: DHM und DDK gehören zu den Datengebern mit der umfangreichsten Datenlieferung an die DDB, und das Portal Saarland fungiert selbst sowohl als Aggregator wie auch als DDB-Datenlieferant.

2.3.2. Die Datenanalyse 

Das als Text gelieferte, strukturierte Vokabular des DHM wurde in eine SKOS-basierte37 Form gewandelt­ und in eine RDF-Datenbank (Triplestore) überführt. Es folgten mehrere Durchgänge automatischer Zeichenkettenvergleiche mit den Sachbegriffsbenennungen der GND, die in der Linked-Data-Fassung ebenfalls im Triplestore vorliegt. Die unstrukturierten Schlagwortlisten des DDK und der saarländischen Museen wurden denselben Matching-Verfahren unterzogen.

Neben dem exakten Zeichenkettenvergleich sind verschiedene unscharfe Verfahren angewendet worden, darunter eine experimentelle Suche nach Grundworten in Komposita und häufig genutzte Distanzmetriken. Fünf Typen von Matching-Ergebnissen haben wir identifiziert, darunter: eindeutige und korrekte Matches, wenn die Bezeichnungen äquivalente Begriffe repräsentieren; falsch positive Matches, oft bedingt durch Homonyme, und falsch negative Ergebnisse, häufig aufgrund fehlender Synonyme; sowie ergebnislose Zeichenkettenvergleiche, weil tatsächlich kein Äquivalent in der GND existiert. Ein solches Schlagwort ohne Match ist ein Kandidat für eine Neuaufnahme in die GND.

Um die Gründe für die Mismatches aufzudecken, haben wir Stichproben aus den Matching-Ergebnissen intellektuell analysiert. Dabei zeigten sich Hindernisse für einen erfolgreichen automatischen Zeichenkettenabgleich auf beiden Seiten der Vokabulare: Fehlende Synonyme und Homonymkennzeichnungen sind die häufigsten Ursachen für ein Versagen des automatischen Abgleichs in Fällen, in denen tatsächlich bedeutungsgleiche Begriffe im Vokabular des Museums und in der GND existieren.

2.3.3. Mögliche Relevanzkriterien

In jedem der untersuchten Vokabulare finden sich Deskriptoren, für die es in der GND bisher kein geeignetes Äquivalent gibt. Das wirft die Frage auf, unter welchen Voraussetzungen eine Übernahme in das GND-Vokabular denkbar, möglich und wünschenswert ist.

Um uns einer Relevanzeinschätzung zu nähern, legen wir unseren Untersuchungen heuristisch folgende­ ­Annahmen zu Grunde: Ein Begriff könnte relevant für die GND sein, wenn

Diese Annahmen werden der intellektuellen Untersuchung der Matching-Ergebnisse zu Grunde gelegt. Eine Auswertung und Ableitung von Relevanzkriterien für die Integration von Museumsvokabular in die GND sowie eine Harmonisierung mit bibliotheksspezifischen Kriterien steht derzeit noch aus.

2.3.4. Datenintegration

Anders als bei Normdaten für Personen oder Bauwerke werden Massenimporte bei Sachbegriffen kaum in Frage kommen. Wahrscheinlicher ist ein Szenario, das von einem Mapping mit GND-Normdaten oder einer Integration einzelner Sachbegriffe in die GND ausgeht. In jedem Fall müssen die Datensätze festgelegten Mindestanforderungen entsprechen, und es muss sichergestellt sein, dass nicht bereits äquivalente Begriffe in der GND existieren. Diese Mindestanforderungen an Sachbegriffe gilt es im Projekt zu spezifizieren und die Matching-Verfahren zu optimieren.

Ein Abgleich von Sachbegriffsvokabular, soviel zeigen die bisherigen Untersuchungen, sollte unter keinen Umständen rein maschinell erfolgen. Ohne Interaktion mit dem Menschen (human-in-the-loop automation) wird hier keine überzeugende Lösung zu finden sein. Im GND4C-Arbeitspaket-3 wird deshalb an Mensch-Maschine-Schnittstellen gearbeitet, die, nicht zuletzt auch als Resultat unserer Untersuchungen, eine maximale automatische Unterstützung für intellektuelle Mapping-Entscheidungen ermöglichen sollen.

Die größte Schwierigkeit bei der Datenintegration, insbesondere beim Verschmelzen von Datensätzen,­ liegt aber in den semantischen Relationen. Dieser Aspekt wird von uns deshalb künftig vertieft untersucht werden.

2.3.5. Das Datenmodell

Mit der GND-Ontologie (GNDO) ist ein Schema für eine RDF-basierte Publikation der GND entwickelt worden, die zurzeit noch nicht alle Aussagen abdeckt, die im Pica-Erfassungssystem gemacht werden,­ zum Beispiel die Unterscheidung zwischen Benennung und Homonymzusatz. Auch die Öffnung der GND für andere Kultursparten wird Erweiterungen des Datenmodells erfordern. Ein Zweig des GND4C-Projektes ist daher auch der Frage gewidmet, was ein zukünftiges, spartenübergreifendes Modell für die GND definieren sollte.

Aus den bisherigen Auswertungen, Matching-Versuchen und Analysen der Museumsvokabulare gehen bereits einige Wünsche an ein künftiges GND-Datenmodell hervor, darunter:

Einige dieser Desiderate wären prinzipiell bereits mit den bisherigen Systemplattformen und Werkzeugen umsetzbar. Andere werden sich dagegen vermutlich erst nach einem Wechsel vom Pica-Erfassungssystem zu einem neu zu entwickelnden Produktionssystem realisieren lassen.

Eine gemeinsame Nutzung der GND-Sachbegriffe durch Bibliotheken und Museen könnte erheblich dazu beitragen, dass spartenübergreifende Recherchen, insbesondere in Aggregationsportalen wie der Deutschen Digitalen Bibliothek und Europeana, künftig befriedigendere Ergebnisse liefern. Auf dem Weg dahin werden jedoch nicht nur bibliothekarische Konventionen, sondern auch manche Herangehensweise in der Museumsdokumentation mit Herausforderungen konfrontiert werden.Stadt, Land, Bauwerk. Geografika auf dem Prüfstand

Susanne Laux und Martha I. Rosenkötter

Ende 2018 standen der Öffentlichkeit etwa 305.543 Geografikadatensätze als GND-Normdaten zur Verfügung. Das entspricht in etwa zwei Prozent der Gesamtdatensätze der GND. Innerhalb der Geografika differenziert die GND zwischen verschiedenen Entitätencodierungen, wie unter anderem

Für Archive und die Bauforschung, aber auch für andere Kulturgut verwahrende Einrichtungen ist eine Steigerung der Abdeckungsdichte der Geografika in der GND erforderlich, damit auch diese Sparten die GND zur Erschließung und Vernetzung ihrer Bestände systematisch einsetzen können. Ein quantitativer Ausbau der Datensätze hat jedoch nicht nur eine erweiterte Anwendergemeinschaft zur Folge, sondern trägt auch zur Nachhaltigkeit und Zukunftsfähigkeit der GND bei. Darüber hinaus stellt er die Weichen für die semantische Vernetzung verschiedener Ressourcen unterschiedlicher Kulturgut verwahrender Einrichtungen. Außerdem unterstützen eindeutige geografische Angaben zu den Beständen eine zielgerichtete Recherche durch Nutzerinnen und Nutzer.

Der erforderliche quantitative Ausbau wirft diverse Fragestellungen auf, die im Laufe des Projekts analysiert, mit den jeweiligen Communities, also Datennutzenden und Datenhaltenden, diskutiert und hier als ein kleiner Einblick in die bisherige GND4C-Werkstatt der Geografika-Abteilung vorgestellt werden sollen.

2.4. Fallanalyse Gebietskörperschaften, Wüstungen und Co.

2.4.1. Die Anforderungen

Das Fehlen erforderlicher GND-Einträge stellt ein großes Hindernis für die Nutzung der GND durch Archive und die historische Forschung dar. Bei den Geografika betrifft dies vor allem den Bereich der historischen Gebietskörperschaften und die Ebene unterhalb der Gemeinden, also Teilorte und historische Orte wie Wüstungen und abgegangene Siedlungen. Auch in Bezug auf eine möglichst ­flächendeckende Aufnahme von Geokoordinaten, die als Anforderung aus mehreren Sparten formu­liert worden ist, ist ein Ausbau der GND wünschenswert. In diesem Zusammenhang stellen sich weitere Fragen, beispielsweise wie granular Geografika in der GND aufgenommen werden sollen und welche Relevanz bestimmten Entitäten zugesprochen werden soll.

2.4.2. Die Datengrundlage

Archive können mit ihrer Fachkompetenz zu einer systematischen Erweiterung der GND beitragen, von der der gesamte GND-Anwenderkreis profitieren kann. Ein Beispiel hierfür ist das landeskundliche Informationssystem für Baden-Württemberg (LEO-BW) , das vom Landesarchiv Baden-Württemberg in Zusammenarbeit mit Partnerinstitutionen aufgebaut und gepflegt wird. Mit rund 26.500 Datensätzen zu baden-württembergischen Orten umfasst LEO-BW den gesamten aktuellen und einen Großteil des historischen Siedlungsbestandes des Bundeslandes. Enthalten sind Informationen zu allen 1.101 Städten und Gemeinden, zu circa 3.500 Teilorten beziehungsweise bis ins 20. Jahrhundert­ ­selbstständigen Gemeinden, außerdem zu circa 16.700 weiteren Siedlungs- beziehungsweise Wohnplätzen, zu circa 3.500 Wüstungen/abgegangenen Orten sowie zu circa 1.480 aufgegangenen Orten. Jeder Eintrag ist mit den übergeordneten Verwaltungsebenen (Land, Regierungsbezirk, Regionalverband, Kreis, Gemeinde) verknüpft.

Den Daten liegt eine Ortsnormdatenbank (ONDB) zugrunde, die vom Landesarchiv Baden-Württemberg mit dem Landesamt für Geoinformation und Landentwicklung und dem Statistischen Landesamt
entwickelt wurde. Das Ortslexikon ist bereits vor einiger Zeit in die GND integriert worden, wodurch eine flächendeckende Normdatenreferenzierung von Orten in Baden-Württemberg möglich geworden ist. Für eine systematische Anreicherung der Geografika erscheinen daher vergleichbare Datensets bestens geeignet. Das Landesarchiv Baden-Württemberg arbeitet an einer Übersicht über potenzielle Datengeber, die über hinreichend strukturierte Korpora sowohl für aktuelle als auch historische Geografika verfügen. Ebenso werden potenzielle Quellen für die Einbindung von Koordinaten für die Georeferenzierung erfasst. Ein systematischer Ausbau der Geografika setzt jedoch unbedingt voraus, dass neben der in der bibliothekarischen Praxis üblichen anlassbezogenen Anreicherung auch eine Einspielung von Daten auf Vorrat möglich ist. Ergänzend zu solchen Massenverfahren haben Archive ein dezidiertes Interesse daran, sich redaktionell bei der GND einbringen und eigenständig Einzeldatensätze erfassen zu können. Ein GND-Webformular für die Neuerfassung von Geografika, wie es bereits für die Neuerfassung von Personennormsätzen existiert, wäre daher ein erfolgversprechender Ansatz.

Darüber hinaus gibt es eine Notwendigkeit, die bibliothekarischen Regelwerke in den Blick zu nehmen­ und künftig in der GND mit spartenübergreifend praktikablen Umsetzungen zu agieren. So zeigen sich zum Beispiel bei der Handhabung der GND-Geografika schwerwiegende Probleme, die aus den RDA-Regeln resultieren, den sogenannten Splitting-Regeln. Diese sorgen dafür, dass bei einer Änderung des im Deutschen gebräuchlichen Namens einer Entität, wie sie in der Regel bei der Eingemeindung von Orten vorgenommen wird, jeweils neue GND-Sätze angelegt werden und so stets entschieden werden muss, mit welchem der vorhandenen Einträge verknüpft werden soll. Dies erweist sich als Hemmnis, sowohl bei der Erschließung als auch bei der semantischen Verknüpfung der Daten in Portalen.

2.4.3. Das Datenmodell

Ein weiterer Punkt betrifft die Überlegungen zur Erweiterung des Datenmodells. Eine erste Analyse verschiedener Referenzdaten aus unterschiedlichen Archiven hat ergeben, dass der überwiegende Teil der enthaltenen geografischen Bezüge, die auf allen archivischen Verzeichnungsstufen vorkommen können, innerhalb des bestehenden Datenmodells der GND abgebildet werden könnten. Allerdings ist zu beachten, dass viele Archive bei der Verwendung von Normdaten noch am Anfang stehen und sehr viel mehr inhaltliche Informationen bereitstellen oder selbst einbringen könnten. Diese sollten in dem zu entwickelnden CORE-PLUS-Datenmodell mitbedacht werden, um die als relevant erachteten Informationen inhaltlich wie informationstechnologisch strukturiert abbilden zu können und um das Entstehen unerwünschter Behelfskonstrukte zu vermeiden.

Im weiteren Verlauf des Projektes GND4C wird der Fokus daher auf der Konzeption eines Geografika-Webformulars oder einer vergleichbaren Lösung zur vereinfachten Erfassung und eines alternativen Ansatzes zu den bestehenden Regelwerken in CORE-PLUS-Bereiche liegen.

2.5. Fallanalyse Bauwerke und Denkmale

Die in der GND zu den ortsgebundenen Geografika gehörenden Bauwerke gelten als zentrale Zeugnisse des kulturellen Erbes und sind somit keine isolierten, unveränderlichen Objekte, sondern stets im Zusammenhang mit anderen Objekten, also den materiellen und visuellen Forschungsgegenständen der Kunst- und Kulturgeschichte sowie der historischen Wissenschaften zu betrachten. Innerhalb des Projektes nehmen sie demnach eine Sonderstellung ein, denn sie sind der Schmelztiegel für alle im Fokus befindlichen Entitäten. Um ein Bauwerk zu identifizieren und einen Normdatensatz zu kreieren, braucht es mindestens, neben dem Namen des Bauwerks, einen präzise beschreibenden Sachbegriff für die Objektgattung mit den dazugehörenden Oberbegriffsanbindungen, die Angabe des Standorts und den Verweis auf die wichtigsten Akteure. Der Bedarf der Forschung ist jedoch über die Sacherschließung, wie sie bislang in der bibliothekarischen Praxis üblich ist, hinausgewachsen. Man möchte die Bauwerknormsätze nicht nur nachnutzen, sondern diese auch gegebenenfalls korrigieren oder eigene Ressourcen als Quellen daran anbinden. Die qualifizierten Links werden benötigt, um nicht nur das Bauwerk als ein von Menschen gemachtes Objekt an sich zu referenzieren, sondern auch um Sammlungsgegenstände und weitere Objekte der Forschung, wie Bauskulpturen, Wandmalereien, vorbereitende Zeichnungen, Nachbauten oder weitere Personen, die maßgeblich an ihrem Bau beteiligt waren, daran anbinden zu können.

2.5.1. Die Datengrundlage

Es gilt, den quantitativ unterrepräsentierten GND-Bestand von 67.977 Bauwerk-Datensätzen
auszubauen, um die hohe Nachfrage an Bauwerknormsätzen zu decken. Dazu braucht es gesonderte Strategien, um die benötigten Daten ressourcensparend, massenhaft und kontrolliert einzubringen – ohne dabei den Qualitätsansprüchen der Bauforschung oder dem Regelwerk der gegenwärtigen GND zu widersprechen.

Um auch unter den Herausforderungen durch die Datenquantität ein definiertes Qualitätsniveau gewährleisten zu können, hat sich das Deutsche Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg (DDK) zum Ziel gesetzt, die Daten der deutschen Denkmalpflege als Quelle für Bauwerknormsätze zu analysieren. Die bundesweit insgesamt achtzehn Landesdenkmalämter erheben systematisch hochwertige, aktuelle, nach der europäischen Richtlinie zur Erhebung einer einheitlichen Geodateninfrastruktur INSPIRE auch georeferenzierte Daten zu Bau- und Kunstdenkmälern in sämtlichen Regionen Deutschlands. Deshalb, und weil die Frage nach der kulturhistorischen Relevanz durch den amtlichen Denkmalstatus gesichert ist, wurden sie als Autoritäten in Sachen Bauwerke für die GND identifiziert. Ihre Denkmallisten umfassen rund 750.000 Denkmäler, die durchweg digital erfasst sind, wenn auch teilweise nur mit Basisangaben. Der Zugriff auf diese Daten ist jedoch „behördenintern konzipiert und bleibt damit der breiten Öffentlichkeit verschlossen“39. Bislang veröffentlichen nur sechs Landesdenkmalämter ihre Bestandsdatenbank online.40 Trotz der zumeist nur in Ausschnitten publizierten Denkmaldaten machen diese aber bereits annähernd ein Fünftel aller Denkmale in Deutschland aus. Die Gründe für die geringe Abdeckung an für die Öffentlichkeit frei verfügbaren Denkmalinformationen sind mannigfaltig. Als ein Hauptaspekt sei hier der primäre Fokus der Denkmalämter zu nennen, der im Denkmalschutz und in der Verwaltung von amtlichen Informationen zur Vermittlung und Kartierung von Denkmalobjekten liegt. Die Bereitstellung einer Dienstleistung, wie sie strukturiert in einem Online-Portal zur Recherche für eine breite Öffentlichkeit zugänglich sein kann, nimmt jedoch zu. Bereits vier der Landesdenkmalämter (Bremen, Hessen, Berlin und Brandenburg) liefern ihre Daten an die Deutsche Digitale Bibliothek (DDB) und bedienen somit die Bedarfe an freien Zugängen zu Informationen über Bauwerke, mit der Möglichkeit der Bildung von semantischen Beziehungen zu den erfassten Objekten anderer Kultureinrichtungen. Basis für diese Lieferdaten ist ein aus der AG Denkmalinformationssysteme41 länderübergreifend vereinbarter, kurzer Kernfeldkatalog aller Landesdenkmalämter, der auch den Überlegungen zum Datenmodell für Bauwerke in der GND als Grundlage dient.

2.5.2. Die Datenanalyse

Das enorme Potenzial an qualitativ hochwertigen Bauwerkdaten birgt natürlich auch besondere Herausforderungen innerhalb des Projekts. Achtzehn Landesdenkmalämter in sechzehn Bundesländern bedeuten sechzehn Denkmalschutzgesetze und damit einhergehend sechzehn unterschiedliche Herangehensweisen hinsichtlich Vokabular und Klassifizierung, Regeln für die Erschließung und Veröffentlichung sowie separate Softwarelösungen. So darf zum Beispiel das Land Baden-Württemberg bislang nicht im Web publizieren,42 andere Länder sind jedoch gesetzlich dazu verpflichtet. Eine Harmoni­sierung steht trotz der Einigung auf ein Set an Kerndatenfeldern noch aus. Es gilt also nicht nur, diesen Fundus an Bauwerkdaten für die GND zu heben und ihn systematisch mit den bestehenden Regelwerken der GND abzugleichen, sondern auch eine Basis zu schaffen, um die Vokabularpflege der Denkmalämter voranzutreiben.

In enger Zusammenarbeit mit Vertretern der Landesdenkmalämter werden beispielhaft anhand der vom Landesdenkmalamt Bremen43 zur Verfügung gestellten Daten die Bedarfe aus der Denkmalpflege analysiert und diese den Bedarfen aus der Forschung gegenüber gestellt. Der Hauptzweck der GND muss dabei stets gewährleistet bleiben, nämlich: eindeutige Identifizierung, Referenzierbarkeit der Hauptinstanzen und Binnenreferenzierung der beteiligten Entitäten, wie Akteur oder Ort. Betrachtet man die einzelnen Eigenschaften, die notwendig sind, um ein Bauwerk strukturell zu erfassen (z. B. Bauwerkname, alternativer Bauwerkname, Datierung, Ort, Akteur etc.) so fällt auf, dass von den 72 Eigenschaften, die aus den Bremer Denkmalpflegedaten herausgezogen werden konnten, nur etwa die Hälfte in der gegenwärtigen GND abgebildet werden können. Es fehlt meist an codierten Relationen, um zum Beispiel Beziehungen innerhalb von Bauensembles zu beschreiben und Rollen, die eine Zeitspanne (z. B. Umbau, Erweiterung, Teilzerstörung) oder Akteure (z. B. Auftraggeber, Bauherr, Stukkateur) qualifizieren.

2.5.3. Das Datenmodell

Aus den fehlenden Relationen ergeben sich weiterführend Fragen zum Datenmodell: Welche Angaben­ eines Denkmaldatensatzes sind essenziell notwendig, um diesen zu identifizieren, und welche Eigenschaften müssen besser in einen spartenspezifischen PLUS-Bereich übernommen werden, um den Bedarf der kunst- und kulturhistorischen Forschung abzudecken? Um diese Frage eingehend zu beantworten, müssen die Communities noch stärker in den Entwicklungsprozess mit einbezogen werden. Klar ist jedoch jetzt schon: Teil-von-Beziehungen sollen immer dann übernommen werden, wenn sie vorhanden sind.

Weitere Herausforderungen ergeben sich durch die Bandbreite der denkmalpflegerisch erfassten Objekte, denn diese umfassen nicht nur einzelne, für sich stehende Bauwerke und Denkmäler. Die länderspezifischen und amtsbedingten Denkmalkategorien44 umfassen neben Einzeldenkmälern (darunter auch Ehrenmale oder einzelne Scheunen) auch Ensembles, Gesamtanlagen, Gruppen, sowie Objekte aus dem technischen Bereich wie Schiffe. Die GND-Bauwerksentität45, die hier laut bibliothekarischem Regelwerk46 noch zur Anwendung kommt, beinhaltet jedoch nur ortsfeste Bauwerke und Denkmale. Im weiteren Verlauf erarbeiten wir Vorschläge für den Umgang mit Fragen, wie:

Es gibt einige offene Fragen zum Datenmodell und die gilt es, in enger Zusammenarbeit mit der ­Community zu klären und prototypisch in die nächste Projektphase zu transferieren.

3. GND-Erschließung der Zukunft – Konzepte zur Weiterentwicklung des Datenmodells und der Erfassungsregeln aus dem Projekt GND4C

Mathias Manecke und Jürgen Kett

Die Öffnung der GND ist insbesondere auch eine fachliche. Dieser Aufgabe widmet sich das Arbeitspaket 2 des Projekts GND4C, das in seinen Grundzügen bereits im ersten Abschnitt zur Einführung in das Projekt vorgestellt wurde. Der folgende Beitrag beschreibt nun nach der Darstellung der Fallanalysen und ihrer spezifischen Beobachtungen die allgemeinen Schlussfolgerungen für die zukünftige GND-Erschließung.

Einleitend seien noch einmal die beiden für dieses Themenfeld grundlegenden Regelwerke erwähnt: Die Resource Description and Access (RDA)49 gelten für Entitäten, die sowohl in der Formal- als auch in der Inhaltserschließung vorkommen (zum Beispiel Personen). Die Regeln für die Schlagwort­kata­logisierung (RSWK)50 gelten für Entitäten, die nur in der Inhaltserschließung Anwendung finden (zum Beispiel Sachbegriffe).

3.1. Die GND als Produkt bibliothekarischer Erschließungsprozesse

RDA hat den selbst gestellten Anspruch, auch für die Nutzung durch nicht-bibliothekarische Kultur­einrichtungen geeignet zu sein. Zwar ist dieser Anspruch für die Öffnung der GND unbestritten hilfreich, aber es wäre deutlich zu kurz gegriffen, daraus Rückschlüsse auf die aktuelle Eignung der GND als spartenübergreifendes Instrument zu ziehen.

Nichts kann diesbezüglich einen Blick auf die konkreten fachlichen Prozesse ersetzen, in deren Rahmen die GND aktuell gepflegt wird. Diese Prozesse bestimmen, wann ein neuer Normdatensatz angelegt wird, über welche Merkmale dieser verfügt und in welcher Form (Bildungsregeln und Syntax)­ diese Merkmale angegeben sind. Auch wenn viele Angaben – wie beispielsweise Personennamen oder Lebensdaten – wie eindeutiges, allgemeingültiges Faktenwissen anmuten: die Herkunft der GND als Produkt bibliothekarischer Erschließungsprozesse ist bei genauerer Betrachtung der Datensätze nicht zu verkennen. Einige Eigenarten der GND sind ohne dieses Kontextwissen schlicht nicht nachvollziehbar.

Die GND ist auch heute nicht gänzlich frei von Spuren anderer Einflüsse. Es wird aufgrund ihres umfangreichen nationalbibliografischen Auftrags gelegentlich übersehen, dass die Deutsche National­bibliothek durch ihre Sondersammlungen und Sonderabteilungen wie das Deutsche Exilarchiv (DEA) und das Deutsche Buch- und Schriftenmuseum (DBSM) mit ihren musealen und archivarischen Methoden und Prozessen selbst eine spartenübergreifende Einrichtung ist. Diese Erfahrung hat sehr dazu beigetragen, dass schon bei der Entwicklung der GND nicht-bibliothekarische Aspekte Berücksichtigung fanden. Im Projekt gilt es nun, diese bereits angelegten Ansätze weiterzuent­wickeln. Hierzu wurden die Anforderungen von vier konkreten Fallbeispielen näher betrachtet51 und daraus allgemeine Rückschlüsse gezogen.

3.2. Wann und für welchen Zweck benötigen Bibliotheken GND-Normsätze?

In der Bibliothekswelt ist der Zweck der GND so selbstverständlich klar, dass es entbehrlich schien, Relevanzkriterien für die GND schriftlich zu fixieren. Die Kriterien ergeben sich aus dem Erschließungszusammenhang: Für die Formalerschließung wird eine GND-Entität immer dann benötigt, wenn diese eine Akteurs-Rolle (Verfasser, Illustrator, Verleger, Hersteller usw.) in Bezug auf die Ressource einnimmt. Welche Rollen zu erschließen sind, regelt der Anhang I der RDA. In welchen Fällen dies zu geschehen hat, regeln ebenfalls die RDA. Für diesen Zweck werden Normsätze für Personen, Körper­schaften (einschließlich Gebietskörperschaften), Familien und Konferenzen gebraucht. Die Werk-Eigenschaften von Ressourcen sind GND-relevant, wenn für die Ressource die jeweilige Werk-Ebene gemäß IFLA LRM53 / RDA durch eine GND-Instanz abgebildet werden soll. Für die Inhaltserschließung wird eine GND-Entität immer dann benötigt, wenn sie zur inhaltlichen Beschreibung gemäß RSWK für die Bildung einer Schlagwortfolge benötigt wird. Dafür können sowohl Individualbegriffe (Personen, Körperschaften, Familien, Konferenzen, Geografika und Werke) als auch Sachbegriffe relevant sein. Sachbegriffe können für die Inhaltserschließung darüber hinaus relevant sein, wenn sie als Oberbegriffe in einer Begriffshierarchie (z. B. als generischer oder partitiver übergeordneter Allgemeinbegriff) oder als Oberbegriffe für Individualbegriffe (als instanzieller Oberbegriff) benötigt werden. Darüber hinaus können GND-Entitäten immer dann relevant sein, wenn sie gebraucht werden,­ um eine andere GND-Entität eindeutig zu identifizieren (Geografikum als Sitz einer Körperschaft, Sachbegriff als Beruf einer Person usw.).

3.3. Verallgemeinerte Relevanzkriterien

Wie oben erwähnt, berücksichtigt die GND allerdings bereits heute auch Anforderungen anderer Sparten. Dies hatte nicht zuletzt auch Einfluss auf die darin enthaltenen Entitäten. Teilnehmende Museen, Archive und diverse Forschungsprojekte erweiterten den Bestand pragmatisch um neue Arten von Werken, Körperschaften, Berufe und andere Schlagwörter. Schon bei diesen Erweiterungen wurde diskutiert, welche Entitäten relevant genug für die GND sind.

Nach einer Gesamtbetrachtung der Fallbeispiele und aller bekannten Anfragen ergeben sich hierzu folgende allgemeine Überlegungen:

Die GND ist keine Fachdatenbank und auch kein allgemeiner Datenpool. Ihr Hauptzweck ist es, Datenbestände (also beispielsweise Fachdatenbanken und allgemeine Datenpools) auf verlässliche Weise miteinander zu verbinden. Sie enthält also „Brückenteile“ von allgemeinem Interesse. Dies beinhaltet potenziell alle Entitäten, die Kultur- und Wissenschaftseinrichtungen sammeln, verzeichnen oder beforschen oder die wichtige Verbindungsstücke zwischen diesen bilden. Die zuständige GND-Agentur bringt die Autorität mit, über die Relevanz in ihrem Zuständigkeitsbereich zu entscheiden (und wird diese Entscheidung im Alltag auf die einzelne, redaktionell tätige Einrichtung übertragen). Die GND-Agentur übernimmt gleichzeitig die Verantwortung für die Gewährleistung der dauerhaften Pflege und des Supports der entsprechenden Entitäten.

Zusammengefasst heißt das: In die GND gehören Normsätze, die der verlässlichen Vernetzung kultu­reller und wissenschaftlicher Daten dienen und für die mindestens ein Partner dauerhaft die Verantwortung übernimmt. Dementsprechend wird die GND künftig einen deutlichen Zuwachs durch Entitäten erfahren, die für die Prozesse der neuen Partner notwendig sind, zum Beispiel die von den Fallbeispielen benötigten Geografika, Bauwerke und historischen Personen.

3.4. CORE und PLUS. Wie kann und muss sich das GND-Datenmodell verändern?

Aber auf welche Weise sollen diese Entitäten in der GND beschrieben werden? Reicht das bisherige Datenmodell aus oder muss es angepasst werden, um den verschiedenen Interessengruppen und deren Prozessen gerecht zu werden?

In den Blick zu nehmen sind die möglichen Bedarfe anderer Kultursparten oder Interessengruppen an neuen Entitätstypen, neuen Eigenschaften und neuen Relationen. Ebenso müssen neue Regeln mit den bestehenden Regelwerken auf Widersprüche abgeklopft und gegebenenfalls miteinander abgeglichen werden. Das Ergebnis sollten Eigenschaften und Regeln sein, die von allen Kultursparten­ gleichermaßen eingehalten werden können (CORE-Regeln), und mögliche Erweiterungen, die sparten­spezifische Anforderungen erfüllen, aber der spartenübergreifenden Arbeit nicht im Wege stehen (PLUS-Regeln).

Man kann das Vorhaben mit folgender Knobelaufgabe vergleichen:

„Welcher Körper passt gleichermaßen flächenfüllend durch eine kreisförmige, eine dreieckige und eine ­quadratische Öffnung?“

Das klingt wie eine unlösbare Aufgabe – um im Bild zu bleiben – wie die Quadratur des Kreises. Aber es gibt eine Lösung.54 Für die konzeptionelle Arbeit an der GND ist es ebenfalls wichtig, sich nicht vorschnell mit „Entweder/oder“-Antworten zufriedenzugeben, sondern kreativ nach „Sowohl/als auch“-Ansätzen zu suchen – oder wie es in einem Workshop unmittelbar im Anschluss an den Biblio­thekskongress 2019 formuliert wurde: „Man sollte es nicht müssen, aber dürfen können.“

3.4.1. Basisregeln eines gemeinsamen Datenmodells

Aber sind die Anforderungen überhaupt so unterschiedlich? Mit einem gewissen Grad an Abstraktion ist es möglich, gemeinsame Grundregeln zu formulieren:

3.4.2. Ansätze zur Ergänzung neuer Eigenschaften, Relationen und spartenspezifischer Regeln

Unterschiede bestehen zwischen den Sparten in der Frage, welche Eigenschaften beziehungsweise Relationen benötigt werden oder gar verpflichtende Angaben sind. Wie man der Analyse des Fallbeispiels zu den „Bauwerken“ entnehmen kann,55 ist es beispielsweise für die Denkmalämter wichtig, Baudenkmäler einer sogenannten Denkmalkategorie (Flächendenkmal, Einzeldenkmal und andere) zuordnen zu können. Bei der bibliothekarischen Inhaltserschließung werden zwar Bauwerke, Denkmäler und andere ortsgebundene Werke in der GND erfasst, eine spezielle Eigenschaft „Denkmalkategorie“ gibt es bisher jedoch nicht. Aber ist eine solche explizit modellierte Eigenschaft überhaupt notwendig? Es geht bei diesem Bedarf darum, bestimmte Individualbegriffe (Bauwerke, Denkmäler) als Instanzen (Beispiele) für eine bestimmte Gruppe von Allgemeinbegriffen auszuweisen. Für diesen Zweck gibt es in der GND bereits die passende Relation: die instanzielle Oberbegriffsbeziehung. Diese wird auch für Bauwerke bereits intensiv genutzt. Mit dem Allgemeinbegriff „Kirchenbau“56 sind fast 24.000 Bauwerke verknüpft. Die GND kennt knapp 3.000 Schlösser,57 circa 2.200 Burgen, circa 300 Fachwerkbauten,58 circa 100 Baudenkmäler59 und so weiter. Bei näherer Betrachtung fällt auf, dass diese Oberbegriffsbeziehungen relativ uneinheitlich vergeben worden sind: circa 6.000 Bauwerke (9 %) haben gar keine Oberbegriffsbeziehung. Wenn die Denkmalämter als neue Anwendergruppe aktiv an der GND mitarbeiten und jedes von ihnen erfasste Bauwerk nach klaren Regeln einer beziehungsweise mehreren Bauwerkkategorien zuweisen würden, wäre dies ein Gewinn für alle.60 Im Sinne des obigen Ausspruchs sollte diese Regel allerdings nur für die Denkmalämter verbindlich sein (PLUS-Regel). Die anderen Anwender hätten dadurch keinen Mehraufwand, und die Nutzer hätten einen zusätzlichen Mehrwert bei der Recherche.

Nicht alle Anforderungen lassen sich allein durch Regelerweiterungen lösen, sondern erfordern zusätzlich die Ergänzung von Eigenschaften beziehungsweise Relationstypen. Nicht selten geht es dabei um den Bedarf an höherer Präzision in den Aussagen. In solchen Fällen bietet sich die Einführung eines Konzepts hierarchischer Ableitung von Eigenschaften beziehungsweise Relationstypen vom Allgemeinen zum Speziellen an. Beispielsweise benötigt eine an der Geschichte von Adelsgeschlechtern­ interessierte Anwendergemeinschaft die Möglichkeit, exakte Verwandtschaftsbeziehungen zu setzen. Zwar können in der GND bereits Verwandtschaftsbeziehungen erfasst werden (Relationstyp „Familiäre Beziehung“), dabei ist es aber zulässig, diese ohne weitere Angabe auch über Generationen hinweg (Urgroßvater-Urenkel) oder als Seitenbeziehungen (Tante-Neffe) zu erfassen.

Der o.g. Anwendungsfall benötigt dagegen präzise Eltern-Kind-Beziehungen als eigenen Relationstyp und spezifische PLUS-Regeln für die Anwendergemeinschaft, wie und wann dieser Relationstyp verwendet wird. Allen anderen Anwendern wäre es weiterhin möglich, die bisher übliche unspezifische Verwandtschaftsbeziehung zu verwenden.

Auch die Regeln zur Selbstbeschränkung sind eine Form der PLUS-Regel. Wir kennen diese aus dem bibliothekarischen Bereich, in dem es mit Blick auf die Erschließungseffizienz und die Interoper­abilität der Daten sinnvoll sein kann, die Komplexität der Auswahlmöglichkeiten einzuschränken (z. B. nur die Akteursrelationen zu verwenden, die laut RDA Anhang I verbindlich sind; oder nur bis zu vier Ländercodes beziehungsweise Sprachencodes zu verwenden). Selbstbeschränkungen einer Anwendergemeinschaft sollten nicht zwingend für alle anderen gelten. Im Idealfall gelingt es, sich in solchen Fällen auf gemeinsame Minimalprofile festzulegen, die aber präzisiert (s. o.) oder erweitert werden können.

3.4.3. Ansätze zur gleichzeitigen Unterstützung mehrerer Regelwerks-Dialekte

Was aber ist zu tun, wenn kein spartenübergreifender Konsens über die korrekte Belegung einer Eigenschaft besteht: Welcher Benennung ist beispielsweise der Vorzug zu geben, wenn es für eine Entität alternative Benennungen gibt? Ist ein bestimmter Sachbegriff als Gattungsbegriff für ein Werk zu verwenden oder nicht?

In solchen Fällen muss es erlaubt sein, die Eigenschaft mehrfach zu belegen und jeweils zu vermerken,­ auf welche Regelung sich der Wert bezieht. Diese zusätzlichen Vermerke könnten maschinell so ausgewertet werden, dass die jeweilige Anwendergemeinschaft eine Sicht auf die GND bekommt, die ihrem Regelwerk entspricht. Die generelle Möglichkeit zur Angabe von Metainformationen zu Aussagen (z. B. auch zur zeitlichen Gültigkeit einer Aussage oder die Angabe einer Quellenreferenz) wären auch zur Erfüllung anderer Anforderungen ein probates Mittel. Ein weiteres Beispiel dafür bietet der folgende Abschnitt.

3.4.4. Ansätze zum Umgang mit unterschiedlichen Anforderungen an Splitting-Regeln und Klassenzuweisungen

Ab wann ist ein Sachverhalt so komplex, dass er in mehreren eigenständigen Normdatensätzen repräsentiert werden sollte? In der Theorie ließe sich das Problem lösen, indem man den Sachverhalt so fein wie nötig aufsplittet, dort wo nötig Über- und Unterordnungen bildet und den Zusammenhang zwischen den Einzelteilen durch Relationen festhält. In der Praxis ist es nicht so einfach. Mangels technischer Unterstützung lassen sich den Katalog- und Retrievalsystemen solche Zusammenhänge nur mit viel Geduld abringen. Auch ist das nachträgliche Aufsplitten eines Datensatzes für die darauf verweisenden Ressourcen potenziell ein Problem. Mit Blick auf die Brückenfunktion der GND sollten Splitting-Regeln also tendenziell konservativ sein – ein gewisser Hang zum groben Zusammenfassen ist hilfreich, um verschiedene fachspezifische Datenbestände und Sichten miteinander zu verbinden. Die GND sollte es diesen verknüpften Fachdatenbanken überlassen, die Details herauszuarbeiten.

Wie wir aus den GND4C-Fallbeispielen lernen können, sind einige der bestehenden Splitting-Regeln für andere Anwendergruppen ungünstig. Für Geografika und Körperschaften gilt derzeit das Prinzip, dass Umbenennungen in der Regel zu neuen Entitäten führen. Es gibt einen Datensatz, der Karl-Marx-Stadt61 repräsentiert. Dieser ist mit dem Datensatz für Chemnitz62 sowohl als Nachfolger als auch als Vorgänger verknüpft. Es gibt je einen Datensatz für die selbstständige Gebietskörperschaft Connewitz63 und ihren unselbstständigen Nachfolger Leipzig-Connewitz.64 Wichtig ist diese Differenzierung für die Formalerschließung, wenn diese Gebietskörperschaften als Akteure (beispielsweise Herausgeber einer Publikation) auftreten. Problematisch ist sie allerdings für den Bedarf der Benutzer, die sich für Ressourcen interessieren, die Geografika beziehungsweise Körperschaften zum Inhalt haben. Wer sich für die Geschichte der Stadt Chemnitz interessiert, wird in der Regel auch an dem Zeitraum interessiert sein, in dem sie als Karl-Marx-Stadt eine Bezirksstadt der DDR gewesen war. Mit etwas erhöhtem Aufwand lässt sich dieses Interesse noch befriedigen. Wie ist es aber mit einem Überblick über die Literatur zur Geschichte des Lexikon-Giganten Bibliographisches Institut & F.A. Brockhaus? Dieser Überblick kann sich nicht nur auf die Medien beschränken, die direkt mit dem entsprechenden Normdatensatz verknüpft sind. Auch alle Normsätze für die untergeordneten Körperschaften und alle Normsätze für die drei Vorgänger (F.A. Brockhaus Leipzig, F.A. Brockhaus Wiesbaden, Bibliographisches Institut), deren untergeordnete Körperschaften beziehungsweise Vorgänger wären für einen solchen Überblick relevant. Für diese Fragestellung ist der Split der Normdaten bei Namensänderung eher kontraproduktiv. Ein Lösungsansatz für dieses Problem wäre es, die für die bibliothekarische Formalerschließung notwendige Benennungshistorie mittels der Angabe von Gültigkeitszeiträumen innerhalb eines einzigen Normdatensatzes zu verwalten.

Eine weitere Herausforderung besteht darin, dass die bisherigen, aus den Satzarten und Entitätencodes abgeleiteten GND-Haupt- und Unterklassen nur einen Teil der realen Welt und diesen auch nur auf eine ganz bestimmte, den praktischen Erfordernissen der Erschließung von Medienwerken geschuldeten Art und Weise abbilden. Die Unterordnung von Bauwerken unter die Geografika betont beispielsweise deren Charakter, immobil zu sein. Andere Anwendergemeinschaften könnten die Eigenschaft von Bauwerken, eine architektonische Schöpfungsleistung darzustellen, für wichtiger halten und diese deshalb eher der Klasse der Werke zuordnen. Da es in solchen Fragen kein richtig­ oder falsch geben kann, sollte das langfristige Ziel der GND-Modellierung darin bestehen, eine Klassen-Hierarchie zu entwickeln, die ohne großen Aufwand erweiterbar ist und in solchen Fällen beiden Aspekten gerecht wird.

3.4.5. GND-Werk vs. RDA-Work: Ansätze zur nötigen Flexibilisierung der Bedeutung
von Werknormsätzen

Der Hauptzweck der Sammlungs- und Erschließungsaktivitäten von Bibliotheken ist es, den Biblio­theksbenutzern Medien (Publikationen) zur Verfügung zu stellen und ihnen deren Inhalt nutzbar zu machen. Mit welchem konkreten Exemplar der Publikation dieses Ziel realisiert wird, ist für den Benutzer meist unerheblich. Es liegt nahe, die Eigenschaften einer Publikation, die allen Exemplaren gleich sind, gemeinsam und genormt und die Eigenschaften, die von Exemplar zu Exemplar variieren, jeweils individuell zu erfassen. Die Functional Requirements for Bibliographic Records (FRBR) haben diesem Grundgedanken ein theoretisches Konzept und die RDA haben ihm einen Namen gegeben: WEMI-Ebenen.65 Es liegt ebenso nahe, die Werk- und unter bestimmten Bedingungen auch die Expressionsebene durch einen GND-Satz zu repräsentieren und bei der Erschließung jeweils auf diese Normsätze zu referenzieren.

Wer Handschriften katalogisiert oder in einer Rara-Abteilung arbeitet, ist sich darüber im Klaren, dass dieses Konzept seine Grenzen hat. Sobald die Exemplare besonders alt, besonders wertvoll sind oder aus anderen Gründen gesammelt werden, kommen weitere Aspekte hinzu, für die eine Erweiterung des Konzeptes notwendig ist: Unter bestimmten Bedingungen sind auch Manifestationen (Gutenberg-Bibel) oder Exemplare (Leipziger Exemplar der Gutenberg-Bibel) Gegenstand der Forschung und damit von Fachpublikationen, für deren Erschließung auf GND-Normsätze referenziert werden sollte, die diese Ebenen repräsentieren.

Der in einer Publikation enthaltene Text- beziehungsweise Bildinhalt ist die wichtigste, aber nicht die einzige Schöpfungsleistung. Ein Buch ist immer auch ein Gestaltungswerk, es hat einen Einband, der mehr oder weniger aufwendig konzipiert wurde. Selbst die verwendeten Schriften sind im urheberrechtlichen Sinne Werke. Bei genauer Betrachtung handelt es sich bei jedem Buch um ein komplexes Konglomerat verschiedener Schöpfungsleistungen, auf die jeweils das WEMI-Konzept anwendbar wäre. Obwohl das bei der weit überwiegenden Zahl von Publikationen nicht zielführend wäre, gibt es Einzelfälle, in denen genau diese anderen Schöpfungsleistungen relevant sind, und Interessengruppen, die diese Einzelfälle im Fokus haben (Einbandforschung, Papier- beziehungsweise Schriftgeschichte usw.).

Die Idee, in der Regel nur die Werk- beziehungsweise Expressionseigenschaften als GND-Normsätze zu repräsentieren, geht auf den seriellen Charakter von Medienwerken zurück. Zwar ist es auch für unikale Objekte möglich, deren Eigenschaften den einzelnen WEMI-Ebenen zuzuordnen, es wäre aber nicht zielführend, diese jeweils auch durch eigene Entitäten abzubilden, da bei unikalen Objekten 1:1-Relationen zwischen diesen Entitäten bestehen würden. Alle Eigenschaften können deshalb in einer einzigen Entität abgebildet werden. Allerdings kommt hier auch ein Unterschied zwischen einzelnen Werk-Typen (Text-, Bild-, Aufführungs-Werke usw.) zum Tragen: Während Text-Werke im Prinzip nicht unikal sein können, weil immer ohne inhaltliche Abstriche Kopien von dem Text-Werk gemacht werden können, trifft dies für die anderen Werktypen nicht in gleichem Maße zu.

In der Bibliothekswelt handelt es sich um eine überschaubare Menge von Sammlungsobjekten, für die solche Spezialanforderungen zutreffend sind. Durch die Öffnung der GND kommen aber Anwendergemeinschaften hinzu, in denen derartige Anforderungen nicht die Ausnahme, sondern die Regel darstellen. Museen sammeln in der Regel unikale (Kunst-)Werke. Im Projekt GND4C werden im Zusammenspiel der vier Fallanalysen Lösungen entwickelt, wie das Datenmodell, das CORE-PLUS-Modell und die Relevanzkriterien der offenen GND aussehen können.

4. Ausblick bis Herbst 2020

Barbara K. Fischer

Im ersten Jahr der Projektlaufzeit ist es durch die Analyse der Fallbeispiele gelungen, eine klare Vorstellung davon zu bekommen, dass die GND sich weniger in ihrem Datenmodell, sondern stärker in Bezug auf den Geltungsbereich von Regeln verändern muss. Im Einzelnen stehen im weiteren Projektverlauf die Ausarbeitung sowohl konkreter Vorschläge zu entsprechenden fachspezifischen Regeln, zu Verbesserungen in der GND selbst wie auch bei den Daten der neuen Fachcommunities auf der Agenda.

4.1. Beispiel: Zeitangaben in der GND

Die Identifizierung fehlerhafter Personennormsätze (und deren Korrektur) oder von Dubletten ist nur ein Aspekt, wie die GND von einer Öffnung für Museumsdaten profitieren wird. Durch technische Analysen und semantische Auswertungen können Inkonsistenzen innerhalb der GND sichtbarer gemacht werden, beispielsweise fehlende reziproke Verknüpfungen bei den Personenrelationen. Neben einem quantitativen Ausbau und der Anreicherung bestehender Normdatensätze durch den Abgleich mit in Museen vorhandenen Künstlerverzeichnissen oder den Kerndaten des AKL sowie gegebenenfalls weiterer biografischer Korpora ergeben sich aber auch neue Anforderungen, Präzisierungen oder Fragestellungen an das GND-Datenmodell, die bis Herbst 2020 angegangen werden:

Wie lassen sich unscharfe Zeitangaben für die Identifizierung, eine kalendarische Recherche oder Sortierung in der GND verwenden? Wie begegnet man der bislang uneinheitlich gehandhabten Erfassung von Zeitangaben, welche einerseits als Zeitspanne oder Zeitpunkt in einem eigenen Feld mit Codierung für die Art der Zeitangabe, andererseits oftmals aber nur als Freitextangabe für die zeitliche Gültigkeit der Relation zu einer anderen Entität ergänzt wird? Letzteres hat gerade im Hinblick auf eine chronologische Kontextualisierung von Wirkungszeiten und Wirkungsorten große Relevanz (vor allem auch in nachgeordneten Datenbanksystemen bei einer Datenübernahme aus der GND).

Andere Anforderungen ließen sich hingegen durch eine Präzisierung der bestehenden Anwendungs­regeln (Erfassungsleitfaden) bereits umsetzen: So wäre es aus Sicht der Museumscommunity durchaus wünschenswert, die Geschlechtsangabe bei Personen nicht nur fakultativ, sondern verpflichtend zu vermerken – sofern sich das aus dem Personennamen erschließen lässt. Im GND-Webformular zur Personenerfassung,67 das seit Herbst 2016 von den Museen des MusIS-Verbunds rege genutzt und vom BSZ redaktionell betreut wird,68 ist dies bereits so umgesetzt (wobei natürlich auch die Angabe „unbekannt“ möglich ist). Bislang weisen aber überhaupt nur rund 38 % der individualisierten Personen­normsätze (Stand: Februar 2019) einen Eintrag im Feld „Geschlecht“ auf.

4.2. Beispiel: Neue Wege für Sachbegriffe

Die Bandbreite der Sammlungsgegenstände in der musealen Welt, ihre unterschiedlichen Erschließungs- und Forschungstraditionen mit den daran geknüpften Thesauri wecken den Wunsch nach einer Normdatenbank, die alle Thesauri enthält und es dennoch schafft, Homonyme mit all ihren unterschiedlichen Kontexten geschuldeten Bedeutungen und daran geknüpften Hierarchien zu trennen – in der Pointierung erkennt man das Paradoxon. Im Sinne des Semantic Web werden die Projektpartner im weiteren Verlauf daher versuchen, ein Konzept zu entwickeln, mit dem Begriffe aus unterschiedlichen Thesauri mit Angabe der Art der Übereinstimmung auf einen GND-Normdatensatz gemappt werden können. In jedem Fall müssen die Normdatensätze festgelegten Mindestanforderungen entsprechen, und es muss sichergestellt sein, dass nicht bereits äquivalente Begriffe in der GND existieren. Diese Mindestanforderungen an Sachbegriffe gilt es im Projekt zu spezifizieren und die Matching-Verfahren zu optimieren.

4.3. Beispiel: Geordnete Granularität für Geografika und Bauwerke

Erste Lösungsansätze hinsichtlich der Abbildung historischer Kontinuitäten beziehungsweise einer persistenten Identifikation stehen im GND4C-Projekt aktuell zur Diskussion. Sowohl die im dritten Abschnitt beschriebene Problematik der Splitting-Regeln als auch eine Möglichkeit zur granularen Referenzierung auf einen einzelnen zeitbezogenen Zustand eines Geografikums müssen berücksichtigt werden. In Verbindung dazu stehen weiterführende Überlegungen zu Vorgänger/Nachfolger-Relationen, genauso wie Teil-Ganzes-Beziehungen. Ein erster Denkansatz besteht darin, einen GND-Datensatz als eine Art Master-Datensatz zu definieren, dem weitere GND-Datensätze zugewiesen werden können. Die Vor- und Nachteile müssen hier noch genau abgewogen werden. Einig ist sich die Projektgruppe darüber, dass es möglich werden soll, über die Gültigkeitsdauer der einzelnen Ausprägungen eines Geografikums im betreffenden Datensatz Aussagen zu treffen. Das Geschichtliche Ortsverzeichnis (GOV) des Vereins für Computergenealogie setzt eine solche Lösung bereits um.69

Die Beispiele machen deutlich, wie sehr es im weiteren Projektverlauf bei der Öffnung der GND als Datenbank um die Entwicklung von PLUS-Regeln für die jeweiligen Communities gehen wird. Jedoch, bevor wir in der zweiten, noch zu beantragenden Projektphase den Testbetrieb für die Integration von neuen Normdaten ausgewählter Communities aufnehmen können, müssen wir außerdem die jetzt noch abstrakten Vorstellungen zur Organisationsstruktur und zur notwendigen technischen Infrastruktur nach den Bedürfnissen der jeweiligen Community konkret ausgestalten und in Funktion bringen. Damit dies geschehen kann, muss es einen Konsens darüber geben, wer die tätige Umsetzung und Beratung in Form einer auf die Belange beispielsweise rund um die Entität der „Bauwerke und Bauensembles, Monumentalplastiken, Denkmäler, Grabmäler und ähnliches“ angesiedelten Agentur übernimmt und vor allem, wie sich das Aufgabenspektrum, ausgehend vom bereits eruierten Portfolio für GND-Agenturen, speist.70 Eine Agentur für kann nur in Zusammenarbeit mit den Communities entwickelt werden. Diesen Prozess gilt es, für alle an Fachcommunities orientierten GND-Agenturen voranzutreiben.

5. Fazit

Barbara K. Fischer

Es ist nicht übertrieben zu sagen, dass sich die GND neu erfinden muss. Doch diese Anstrengung ist so notwendig wie lohnend. Ein offenes und verlässliches Datennetz der Kultur, an dem alle Kultureinrichtungen partizipieren, gibt es nicht geschenkt. Das Vernetzen von Kultur und Wissenschaft ist eine gesellschaftliche Aufgabe. Hier sind insbesondere strukturell herausragende, kooperationserfahrene Kultureinrichtungen und deren Träger gefordert, Personal für die nötigen Querschnittsdienstleistungen bereitzustellen und GND-Agenturen aufzubauen. Diese eignen sich nicht nur für die GND-Arbeit, sondern bilden Kompetenzzentren mit vielfältigem Potenzial. Ein offenes und unabhängiges Datennetz der Kultur und Wissenschaft aufzubauen, verspricht nachhaltig Qualität wie Transparenz, freie Zugänglichkeit und Verlässlichkeit der Normdaten für den Kultursektor. Vor allem fördert dies jedoch die Auffindbarkeit im anschwellenden Netz der Daten.

Literaturverzeichnis

AmIIgnorant: One Shape to fit them all, Youtube, 15.04.2012, <https://youtu.be/whpPoaYdmzM>, Stand: 17.07.2019.

Arbeitsgruppe Denkmalinformationssysteme, Vereinigung der Landesdenkmalpfleger (VDL), <https://www.vdl-denkmalpflege.de/arbeitsgruppen.html>, Stand: 08.07.2019.

Arbeitsstelle für Standardisierung (Hg.): Regeln für die Schlagwortkatalogisierung. RSWK, Deutsche Nationalbibliothek, Leipzig Frankfurt am Main, 2017. Online: <https://d-nb.info/1126513032/34>.

Beyer, Andreas; Savoy, Bénédicte; Tegethoff, Wolf (Hg.): AKL-Online, Allgemeines Künstlerlexikon – Internationale Künstlerdatenbank – Online, De Gruyter Saur, <https://www.degruyter.com/view/db/akl>, Stand: 03.07.2019.

Bove, Jens; Heusinger, Lutz; Kailus, Angela (Hg.): Marburger Inventarisations-, Dokumentations- und Administrations-System, 4. überarbeitete Auflage, 2016. Online: <https://doi.org/10.11588/artdok.00003770>.

CIDOC, Supporting Museum Documentation, in: ICOM International Committee für Documentation (CIDOC), <http://network.icom.museum/cidoc/>, Stand: 27.06.2019.

Deutsches Institut für Normung: DIN 31623. Indexierung zur inhaltlichen Erschließung von Dokumenten. Teile 1-3 (1988). In: Publikation und Dokumentation. Bd. 2. Hrsg. vom DIN. 4. Aufl. Berlin u. a.: Beuth, 1996, S. 180–204.

Entitätencodierung Vergaberichtlinien - Kurzliste (für GND), <https://wiki.dnb.de/download/attachments/90411323/entitaetenCodes.pdf?version=1&modificationDate=1561639536000&api=v2>, Stand: 24.06.2019.

Ermert, Axel; Ludewig, Karin: Museen (D 11), in: Rainer Kuhlen u.a. (Hg.): Grundlagen der ­praktischen Information und Dokumentation: Handbuch zur Einführung in die Informationswissenschaft und -praxis (Kap. D - Informationsinfrastruktur). Berlin [u.a.]: De Gruyter Saur, 2013. S. 609–622.

Fischer, Barbara; Manecke, Mathias: GND4C-Forum, Blogbeitrag: Über die allmähliche Verfertigung der Gedanken beim Reden, Juni 2019, <https://wiki.dnb.de/pages/viewpage.action?pageId=148603894>, Stand: 16.07.2019.

FAIR Data Principles, <https://www.forschungsdaten.org/index.php/FAIR_data_principles>, Stand: 08.07.2019.

Getty Research Institute (Hg.):

Art & Architecture Thesaurus® Online (AAT), <https://www.getty.edu/research/tools/vocabularies/aat/>.

Categories for the Description of Works of Art (CDWA), <https://www.getty.edu/research/publications/electronic_publications/cdwa/index.html>.

Cultural Objects Name Authority® Online (CONA), <http://www.getty.edu/research/tools/vocabularies/cona/index.html>.

GND-Entwicklungsprogramm, <https://wiki.dnb.de/display/GND/GND-Entwicklungsprogramm+2017-2021>, Stand: 08.07.2019.

GND4C-Forum Dokumentation, <https://wiki.dnb.de/x/NJrbC> Stand: 14.07.2019.

GND-Webformular, <https://www.dnb.de/DE/Professionell/Standardisierung/GND/gnd_Webformular/gnd_webformular.html?nn=58014>, Stand: 17.07.2019.

Haffner, Dorothee; Schweibenz, Werner: Ergebnisse der Online-Umfrage zur Nutzung von kontrolliertem Vokabular in Museen im Herbst 2016. Online: <https://nbn-resolving.org/urn:nbn:de:bsz:576-opus4-12544>.

Hartmann, Sarah: GND-Webformular: Eine neue Schnittstelle für die Gemeinsame Normdatei, in: AKMB-news 23 (2017), 2, S. 22–25. Online: <https://doi.org/10.11588/akmb.2017.2.58369>.

IFLA Library Reference Model (LRM), <https://www.ifla.org/publications/node/11412>, Stand: 17.07.2019.

International Guidelines for Museum Object Information, <http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/DocStandards/guidelines1995.pdf>. Herausgegeben von ICOM International Committee for Documentation (CIDOC), 1995.

INSPIRE, Geodateninfrastruktur in Deutschland, <https://www.geoportal.de/DE/GDI-DE/INSPIRE/inspire.html?lang=de>, Stand: 08.07.2019.

ISO 8601:2019, Date and time format, <https://www.iso.org/iso-8601-date-and-time-format.html>, Stand: 03.07.2019.

ISO 25964, Information and documentation – Thesauri and interoperability with other vocabularies.

Part 1 (ISO 25964-1:2011): Thesauri for information retrieval.

Part 2 (ISO 25964-2:2013): Interoperability with other vocabularies.

SKOS extension (iso-thes), <http://pub.tenforce.com/schemas/iso25964/skos-thes>, Stand: 03.07.2019.

Jahresbericht 2018, Deutsche Nationalbibliothek, Leipzig Frankfurt am Main 2019. Online: <urn:nbn:de:101-2019052102>.

Kailus, Angela; Stein, Regine: Besser vernetzt: über den Mehrwert von Standards und ­Normdaten zur Bilderschließung, in: Piotr Kuroczyński u. a. (Hg.): Computing art reader: ­Einführung in die digitale Kunstgeschichte. Heidelberg 2018, S. 118–139. Online: ­<http://dx.doi.org/10.11588/arthistoricum.413.596>.

Katalog der Deutschen Nationalbibliothek, <https://portal.dnb.de/opac.htm>.

Landesamt für Denkmalpflege Bremen, <https://www.denkmalpflege.bremen.de/>.

Landesamt für Denkmalpflege Bremen: Pilotpartner des Projektes GND4C. <https://www.denkmalpflege.bremen.de/medien/denkmaldatenbank-37984>, Stand: 08.07.2019.

LEO-BW, Landeskunde entdecken online, <www.leo-bw.de>, Stand: 12.06.2019.

LGL, Landesamt für Geoinformationen und Landentwicklung, <www.lgl-bw.de>, Stand: 4.07.2019.

LIDO – Lightweight Information Describing Objects. Specification Document, Version 1.0, 2010, <http://www.lido-schema.org/schema/v1.0/lido-v1.0-specification.pdf>, hg. von ICOM International Committee for Documentation (CIDOC), <http://network.icom.museum/cidoc/working-groups/lido/what-is-lido/>.

Lill, Jens M.: Erfahrungsbericht zur Nutzung des GND-Webformulars im Rahmen der GNDCon 2018, Frankfurt/Main. Online: <https://nbn-resolving.org/urn:nbn:de:bsz:576-opus4-13335>.

Lill, Jens M.: Gemeinsam neu definiert: das Projekt „GND für Kulturdaten (GND4C)“, in: AKMB-news 25 (2019), 1, S. 18–23. Online: <https://doi.org/10.11588/akmb.2019.1.63016>.

lobid-gnd – ein LOD-Dienst des Hochschulbibliothekszentrum des Landes NRW, <http://lobid.org/gnd/>.

Lugt, Frits: Les Marques de Collections de Dessins & d´Estampes, Fondation Custodia, <https://francofil.hypotheses.org/6118>, Stand: 03.07.2019.

MuseumsInformationsSystem (MusIS), <www.musis-service.de>, Stand: 27.06.2019.

Pröstler, Viktor: Datenfeldkatalog zur Grundinventarisation. Ein Bericht der Arbeitsgruppe Dokumentation des Deutschen Museumsbundes, Karlsruhe 1993. Online: <https://www.museumsbund.de/wp-content/uploads/2017/06/datenfeldkatalog.pdf>, Stand: 27.06.2019.

RDA: Resource Description and Access, in: <https://wiki.dnb.de/display/RDAINFO/RDA-Info>, Stand: 23.09.2019.

Schulze, Francesca: Objektbeschreibende Metadaten in der Deutschen Digitalen Bibliothek: Analyse der Eignung als Informationsfilter im Retrieval [Masterarbeit]. Berlin: Humboldt-­Universität zu Berlin, 2019. Online: <https://doi.org/10.18452/19655>.

Schwartz, Uwe: Denkmalinformationssysteme der Denkmalämter, in: Landesdenkmalamt ­Berlin (Hg.): Zwischen Welterbe und Denkmalalltag – erhalten, erschließen, engagieren. ­Dokumentation des 82. Tags für Denkmalpflege und der gemeinsamen Jahrestagung der ­Vereinigung der Landesdenkmalpfleger (VDL) und des Verbands der Landesarchäologen (VLA), 2015, S. 254–261. Online: <urn:nbn:de:101:1-201504024953>.

SIKART Lexikon zur Kunst in der Schweiz, <http://www.sikart.ch/home2.aspx>, Stand: 27.06.2019.

SKOS Reference: Simple Knowledge Organization System – Reference, W3C Recommendation, 18.08.2009, <https://www.w3.org/TR/skos-reference/>, Stand: 03.07.2019.

SKOS-XL: SKOS eXtension for Labels (SKOS-XL), <https://www.w3.org/TR/skos-reference
/#xl
>, Stand: 03.07.2019.

Statistisches Landesamt Baden-Württemberg, <www.statistik-bw.de>, Stand: 4.07.2019.

Verein für Computergenealogie: Das Geschichtliche Ortsverzeichnis (GOV), Beispiel: Stadtkreis Heidelberg, <http://gov.genealogy.net/item/show/HEIERGJN49IJ>, Stand: 04.07.2019.

Vereinigung der Landesdenkmalpfleger (VDL): AG Denkmalinformationssysteme, <https://www.vdl-denkmalpflege.de/arbeitsgruppen.html>, Stand: 08.07.2019.

20. MusIS-Nutzertreffen, Staatsgalerie Stuttgart 2./3. April 2019, Stand jeweils: 27.06.2019:

Blogbeitrag, <https://wiki.dnb.de/display/GND/2019/05/06/Bericht+vom+20.+MusIS-Nutzertreffen+2019+in+der+Staatsgalerie+Stuttgart>.

Dokumentation des Workshops, <https://swop.bsz-bw.de/frontdoor/index/index/docId/1349>.

1 Die Klasse der Personennamen („Names of Persons“) wird aufgrund ihrer geringen Aussagekraft künftig wegfallen.­ Dort, wo der Individualisierungsgrad ausreicht, werden Personennamen zu vollwertigen Personendatensätzen ­(„Persons“) umgewandelt.

2 Zu den Ergebnissen der Fallanalyse informiert Jens Lill in Kapitel 2.2. „Fallanalyse Personen“ in diesem Beitrag.

3 Zu den Ergebnissen der Fallanalyse informiert Martha Rosenkötter in Kapitel 3.2. „Fallanalyse Bauwerke und ­Denkmale“ in diesem Beitrag.

4 Zu den Ergebnissen der Fallanalyse informiert Susanne Laux in Kapitel 3.1. „Fallanalyse Gebietskörperschaften, ­Wüstungen und Co.“ in diesem Beitrag.

5 Zu den Ergebnissen der Fallanalyse informieren Jutta Lindenthal und Detlev Balzer in Kapitel 2.3. „Fallanalyse ­Sachbegriffe“ in diesem Beitrag.

6 Weitere Informationen zu Arbeitspaket 1 siehe GND4C-Forum: Dokumentation, <https://wiki.dnb.de/x/NJrbC>, Stand: 14.07.2019.

7 Originalabbildung im GND-Wiki, <https://wiki.dnb.de/pages/viewpage.action?pageId=148605989>, Stand: 16.07.2019.

8 Vgl. GND-Entwicklungsprogramm, <https://wiki.dnb.de/display/GND/GND-Entwicklungsprogramm+2017-2021>, Stand: 08.07.2019.

9 Siehe Kapitel 2. zu Personeninformationen und Sachbegriffen aus Museen in der GND und ihre Repräsentation im GND-Datenmodell und Kapitel 3. in diesem Beitrag.

10 Vgl. RDA: Resource Description and Access, in: <https://wiki.dnb.de/display/RDAINFO/RDA-Info>, Stand: 23.09.2019.

11 Vgl. Arbeitsstelle für Standardisierung (Hg.): Regeln für die Schlagwortkatalogisierung. RSWK, Deutsche National­bibliothek, Leipzig Frankfurt am Main, 2017. Online: <https://d-nb.info/1126513032/34>, S. 246 ff.

12 Einen detaillierten Einblick in den Stand der Überlegungen gibt das sich anschließende Kapitel 4.: Manecke, Mathias; Kett, Jürgen: GND-Erschließung der Zukunft.

13 Zur GND4C-Infrastuktur siehe auch GND4C-Forum, <https://wiki.dnb.de/pages/viewpage.action?pageId=148606157>.

14 Siehe auch SKOS Reference: Simple Knowledge Organization System – Reference, W3C Recommendation, 18.08.2009, 10. Mapping Properties, <https://www.w3.org/TR/skos-reference/#mapping>, Stand: 08.07.2019.

15 Siehe Fischer, Barbara; Manecke, Mathias: Blogbeitrag zum GND4C-Forum: Über die allmähliche Verfertigung der Gedanken beim Reden, Juni 2019, <https://wiki.dnb.de/pages/viewpage.action?pageId=148603894>, Stand: 16.07.2019.

16 Als Einführung sei empfohlen: Ermert, Axel; Ludewig, Karin: Museen (D 11), in: Rainer Kuhlen u. a. (Hg.): Grundlagen der praktischen Information und Dokumentation: Handbuch zur Einführung in die Informationswissenschaft und -praxis (Kap. D - Informationsinfrastruktur). Berlin [u.a.]: De Gruyter Saur, 2013. S. 609–622.

17 Vgl. Bove, Jens; Heusinger, Lutz; Kailus, Angela (Hg.): Marburger Inventarisations-, Dokumentations- und ­Administrations-System, 4. überarbeitete Auflage, 2016. Online: <https://doi.org/10.11588/artdok.00003770>, Stand: 03.07.2019.

18 Vgl. Pröstler, Viktor: Datenfeldkatalog zur Grundinventarisation. Ein Bericht der Arbeitsgruppe Dokumentation des Deutschen Museumsbundes, Karlsruhe 1993, <https://www.museumsbund.de/wp-content/uploads/2017/06/datenfeldkatalog.pdf>.

19 International Guidelines for Museum Object Information. Hg.: International Committee for Documentation of the International Council of Museums (CIDOC), 1995, <http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/DocStandards/guidelines1995.pdf>.

20 Vgl. Haffner, Dorothee; Schweibenz, Werner: Ergebnisse der Online-Umfrage zur Nutzung von kontrolliertem ­Vokabular in Museen im Herbst 2016. Online: <https://nbn-resolving.org/urn:nbn:de:bsz:576-opus4-12544>, ­Stand: 27.06.2019.

21 LIDO, Lightweight Information Describing Objects, in: ICOM International Committee for Documentation (CIDOC), 2019, <http://network.icom.museum/cidoc/working-groups/lido/what-is-lido/>, Stand: 03.07.2019.

22 Weitere Informationen zum Portfolio der Dienstleistungen beim Sammlungsmanagement: Kooperationsverbund der Staatlichen Museen in Baden-Württemberg: MusIS-Verbund, <www.musis-service.de>, Stand: 27.06.2019.

23 Beyer, Andreas; Savoy, Bénédicte; Tegethoff, Wolf (Hg.): AKL-Online, Allgemeines Künstlerlexikon - Internationale Künstlerdatenbank - Online, De Gruyter Saur, <https://www.degruyter.com/view/db/akl>, Stand: 03.07.2019.

24 Diese Überlegungen sind in das CORE-PLUS-Modell eingeflossen. Vgl. Kapitel 4.: Manecke, Matthias; Kett, Jürgen: GND-Erschließung der Zukunft – Konzepte zur Weiterentwicklung des Datenmodells und der Erfassungsregeln aus dem Projekt GND4C.

25 Siehe 20. MusIS-Nutzertreffen, Staatsgalerie Stuttgart, 2./3. April 2019, Blogbeitrag, <https://wiki.dnb.de/display/GND/ 2019/05/06/Bericht+vom+20.+MusIS-Nutzertreffen+2019+in+der+Staatsgalerie+Stuttgart>, Stand jeweils: 27.06.2019.

26 Siehe Lugt-Nummer L.370 für die Marke (Eigentumsvermerk) des Schriftstellers William A. Baillie-Grohman, <http://www.marquesdecollections.fr/detail.cfm/marque/5891>, dessen GND-Datensatz <http://d-nb.info/gnd/11776504X>; Einführung in die Verwendung der Lugt-Nummern in der Provenienzforschung, <https://francofil.hypotheses.org/6118>, Stand: 03.07.2019.

27 Das Lexikon zur Kunst in der Schweiz verlinkt seinerseits auch zur GND. Siehe SIKART: Lexikon zur Kunst in der Schweiz, <http://www.sikart.ch/home2.aspx>, Stand: 27.06.2019.

28 Vgl. Kailus, Angela; Stein, Regine: Besser vernetzt: über den Mehrwert von Standards und Normdaten zur Bild­erschließung, in: Piotr Kuroczyński u. a. (Hg.): Computing art reader: Einführung in die digitale Kunstgeschichte. Heidelberg 2018, S. 118–139. Online: <http://dx.doi.org/10.11588/arthistoricum.413.596>, Stand 03.07.2019.

29 ISO 8601:2019 – Date and time format, <https://www.iso.org/iso-8601-date-and-time-format.html>, Stand: 03.07.2019.

30 Vgl. Lill, Jens M.: Erfahrungsbericht zur Nutzung des GND-Webformulars im Rahmen der GNDCon 2018, Frankfurt/Main, <https://nbn-resolving.org/urn:nbn:de:bsz:576-opus4-13335>, Stand: 03.07.2019.

31 ISO 25964: Information and documentation – Thesauri and interoperability with other vocabularies. SKOS extension (iso-thes), <http://pub.tenforce.com/schemas/iso25964/skos-thes>, Stand: 03.07.2019.

32 LIDO – Lightweight Information Describing Objects, Specification Document, Version 1.0, 2010, <http://www.lido-schema.org/schema/v1.0/lido-v1.0-specification.pdf>.

33 Getty Research Institute: Art & Architecture Thesaurus® Online (AAT); Categories for the Description of Works of Art (CDWA); Cultural Objects Name Authority® Online (CONA).

34 Schulze, Francesca: Objektbeschreibende Metadaten in der Deutschen Digitalen Bibliothek: Analyse der Eignung als Informationsfilter im Retrieval [Masterarbeit]. Berlin: Humboldt-Universität zu Berlin, 2019. Online: <https://doi.org/10.18452/19655>.

35 Deutsches Institut für Normung: DIN 31623. Indexierung zur inhaltlichen Erschließung von Dokumenten. Teile 1–3 (1988). In: Publikation und Dokumentation. Bd. 2. Hrsg. vom DIN. 4. Aufl. Berlin u. a.: Beuth, 1996, S. 180–204.

36 Klassifikationssystem zur Erschließung von Bildinhalten, <http://www.iconclass.nl>, Stand: 03.07.2019.

37 Vgl. SKOS Reference, <https://www.w3.org/TR/skos-reference/>, Stand: 03.07.2019.

38 Vgl. SKOS-XL, <https://www.w3.org/TR/skos-reference/#xl>, Stand: 03.07.2019.

39 Schwartz, 2015, S. 259.

40 Berlin, Bremen, Hessen, Saarland, Brandenburg und Bayern. Vgl. Schwartz, 2015, S. 259.

41 Arbeitsgruppe Denkmalinformationssysteme, Vereinigung der Landesdenkmalpfleger (VDL), <https://www.vdl-denkmalpflege.de/arbeitsgruppen.html>, Stand: 08.07.2019.

42 Vgl. Schwartz 2015, S. 258.

43 Pilotpartner des Projektes GND4C. Landesamt für Denkmalpflege Bremen, <https://www.denkmalpflege.bremen.de/>, Stand: 08.07.2019.

44 Siehe Kapitel 4. in diesem Beitrag.

45 Entitätencode: gib.

46 Siehe Arbeitsstelle für Standardisierung (Hg.): Regeln für die Schlagwortkatalogisierung. RSWK, Deutsche Nationalbibliothek, Leipzig Frankfurt am Main, 2017. Online: <https://d-nb.info/1126513032/34>, S. 246 ff.

47 Entitätencode: gio.

48 Entitätencode: wit.

49 Vgl. Resource Description and Access (RDA), in: <https://wiki.dnb.de/display/RDAINFO/RDA-Info>, Stand: 23.09.2019.

50 Vgl. Arbeitsstelle für Standardisierung (Hg.): Regeln für die Schlagwortkatalogisierung. RSWK, Deutsche Nationalbibliothek, Leipzig Frankfurt am Main, 2017. Online: <https://d-nb.info/1126513032/34>, S. 246 ff.

51 Vgl. Kapitel 2. in diesem Beitrag.

52 Vgl. GND4C-Forum Dokumentation, <https://wiki.dnb.de/x/NJrbC> Stand: 14.07.2019.

53 Vgl. IFLA Library Reference Model (LRM), <https://www.ifla.org/publications/node/11412>, Stand: 17.07.2019.

54 AmIIgnorant: One Shape to fit them all, Youtube, 15.04.2012, <https://youtu.be/whpPoaYdmzM>, Stand: 17.07.2019.

55 Vgl. Kapitel 3. in diesem Beitrag.

56 Siehe Katalog der Deutschen Nationalbibliothek, <https://portal.dnb.de/opac.htm>: GND-Eintrag „Kirchenbau“, <http://d-nb.info/gnd/4073436-5>, Stand: 16.07.2019.

57 Ebd., GND-Eintrag „Schloss“, <http://d-nb.info/gnd/4052753-0>, Stand: 16.07.2019.

58 Ebd., GND-Eintrag „Fachwerkbau“, <http://d-nb.info/gnd/4071095-6>, Stand: 16.07.2019.

59 Ebd., GND-Eintrag „Baudenkmal“, <http://d-nb.info/gnd/4004973-5>, Stand: 16.07.2019.

60 Dies stellt sich jedoch als schwierig heraus, da die Denkmalkategorien gekoppelt sind an den aktuellen Denkmal­status, der den Gebäuden auch wieder aberkannt werden kann.

61 Siehe Katalog der Deutschen Nationalbibliothek, <https://portal.dnb.de/opac.htm>: GND-Datensatz „Karl-Marx-Stadt“, <http://d-nb.info/gnd/2015221-8>, Stand: 09.07.2019.

62 Ebd., GND-Datensatz „Chemnitz“, <http://d-nb.info/gnd/4029702-0>, Stand: 09.07.2019.

63 Ebd., GND-Datensatz „Connewitz“, <http://d-nb.info/gnd/4331602-5>, Stand: 09.07.2019.

64 Ebd, GND-Datensatz „Leipzig-Connewitz“, <http://d-nb.info/gnd/4331601-3>, Stand: 09.07.2019.

65 Einteilung der Eigenschaften einer Publikation in die vier Ebenen: Work, Expression, Manifestation und Item.

66 Siehe GND4C-Forum Dokumentation, <https://wiki.dnb.de/x/NJrbC> Stand: 14.07.2019.

68 Siehe Lill, Erfahrungsbericht, 2018. Einführende Literaturempfehlung: Hartmann, Sarah: GND-Webformular: Eine neue Schnittstelle für die Gemeinsame Normdatei, in: AKMB-news 23 (2017), 2, S. 22-25. Online: <https://doi.org/10.11588/akmb.2017.2.58369>.

69 Vgl. Verein für Computergenealogie: Das Geschichtliche Ortsverzeichnis (GOV), Beispiel: Stadtkreis Heidelberg, <http://gov.genealogy.net/item/show/HEIERGJN49IJ>, Stand: 04.07.2019.

70 Vgl. Kapitel 1.1. in diesem Beitrag.