Aus dem Daten-Silo ins Discovery-System
Bibliographien im Index des Katalog Plus der Württembergischen Landesbibliothek Stuttgart
1. Einleitung und Ausgangssituation
Am 3. Januar 2024 konnte die Württembergische Landesbibliothek in Stuttgart (WLB) in ihrem Blog den Relaunch des Discovery-Systems Katalog Plus verkünden.1 Wichtigste Neuerungen waren die Integration von etwa 470.000 Titelnachweisen der Landesbibliographie Baden-Württemberg, die zusammen mit der Badischen Landesbibliothek (BLB) erstellt wird, sowie von etwa 50.000 Titelnachweisen der Internationalen Hölderlin-Bibliographie (IHB) und 26.000 Titelnachweisen der Stefan George-Bibliographie (StGA), die von den Literaturarchiven in der WLB erfasst werden. Neben den neuen Datensammlungen wurden umfangreiche Neuerungen bei Funktionalitäten und Anzeigen integriert. Darüber hinaus wurde eine One-Stop-Search umgesetzt, mit der selbstständig und unselbstständig erschienene Medien aus dem Bibliotheksbestand, den Bibliographien sowie weiteren Datenkollektionen in einem Reiter2 durchsuchbar sind.
Motor für diese Katalogentwicklung war ein umfangreiches Migrationsprojekt, um die bis dato in getrennten Datenbanken gehaltenen Bestände der Bibliographien in den K10plus3 zu importieren. Seit Anfang der 1980er-Jahre betreute das Statistische Landesamt Baden-Württemberg als technischer Partner die Bibliographien. Abb. 1 zeigt den Überblick über das ADABAS4-Mehrdateiensystem für Großrechner mit jeweils eigenständigen Modulen für die Titelerfassung, Datenhaltung und Webrecherche. Die Anforderungen zur Vernetzung mit externen Angeboten gelangen für die Landesbibliographie beispielsweise mit der Integration in die Virtuelle Deutsche Landesbibliographie (VDL)5 oder das landeskundliche Portal LEO-BW.6 Auch wurden Synergien mit von der WLB entwickelten Tools zur Erfassung mit Verbunddaten geschaffen7; trotzdem blieb das Problem, dass es für die in den „Daten-Silos“ gespeicherten Metadaten keine Schnittstellen zum K10plus, zum WLB-Katalog und zum Discovery-System gab.
Da vor allem die technische Infrastruktur zunehmend veraltete und einen höheren Pflegeaufwand bedeutete, sollte das System ersetzt werden. Es war eine logische Konsequenz die an der WLB erstellten Bibliographien in die Verbunddatenbank K10plus einzubringen, weil die WLB als Mitglied des Südwestdeutschen Bibliotheksverbundes (SWB) bereits mit ihren Beständen in die Verbundlandschaft eingebunden war. Unter dieser Voraussetzung wurde das Migrationsprojekt ab Sommer 2022 gemeinsam mit dem Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) und der WLB für die IHB und die StGB sowie für die Landesbibliographie Baden-Württemberg mit der BLB als Projektpartner vorangetrieben. Eine weitere zentrale Entscheidung betraf das künftige Rechercheportal: Es sollten nicht wieder separate Webrecherchen angeboten, sondern die Daten in Anzeige- und Suchmöglichkeiten des bestehenden Discovery-Systems der WLB, das vom BSZ entwickelte BOSS (BSZ One Stop Search)8, integriert werden.9
Infolge der notwendigen spezifischen Anpassungen des BOSS-Systems für die Bibliographien fand im Frühjahr 2023 begleitend eine Evaluierung der Bibliothekskataloge an der WLB statt. Parallel neben dem BOSS-Discovery-System „Katalog Plus“ ist dies der klassische „WLB-Katalog“. Sowohl das Migrationsprojekt als auch die Evaluation des Katalogangebots brachten Anforderungen hervor, die miteinander in Einklang gebracht werden mussten. Bis zur Deadline der Abschaltung der Altsysteme der Bibliographien zum Jahresanfang 2024 verblieb nicht mehr viel Zeit, um den neuen Katalog Plus zur Verfügung zu stellen.
2. Migration der Bibliographien in die Verbunddatenbank
K10plus
2.1 Datenkonvertierung
Eine große Herausforderung für die Migration der Bibliographien stellte sich den Landesbibliotheken gleich zu Projektbeginn dar: Das eigens entwickelte Intern-Format musste vor Auslieferung an das BSZ in das Standardformat MARC 21 konvertiert werden. Erst nach dieser Datenaufbereitung, die die Gruppe Metadaten in der WLB inhouse übernahm, war ein Import in den K10plus möglich.
Die Daten wurden aus der ADABAS-Datenbank als diverse CSV-Einzeldateien exportiert, zur Weiterverarbeitung in eine PostgreSQL-Datenbank importiert und hier mithilfe von Python-Skripten zu einem vollständigen Titel-Datensatz zusammengeführt. Die Daten wurden im Anschluss als MARCXML-Dateien ausgegeben, bevor sie im letzten Schritt mithilfe des Tools MARCEdit in
MARC-Maschinenformat umgewandelt und an das BSZ weitergegeben wurden.
Nicht mit einem externen Dienstleister zusammenzuarbeiten, hatte für das Projektmanagement große Vorteile: Weil Datenformate und Datenbankstrukturen beim Statistischen Landesamt sich grundlegend vom K10plus unterschieden, musste während der Konvertierungsphase immer wieder auf die Expertise und Erfahrungen in der WLB zurückgegriffen werden. Auch waren so flexible Reaktionen auf sich ändernde Anforderungen während der gesamten Projektzeit möglich.
2.2 Datenmigration
Die Bibliographien wurden durch das BSZ beim Import in den K10plus unterschiedlich behandelt: Die Landesbibliographie, als gemeinsam geführte Bibliographie der WLB und der BLB, wurde als selbstständige virtuelle Bibliothek umgesetzt, die StGB und die IHB wurden in den Bestand der WLB integriert.
Das BSZ stand beim Datenimport vor der Herausforderung, möglichst alle Informationen der drei Bibliographien in den K10plus zu integrieren, ohne Dubletten zu schon vorhandenen K10plus-Titeln mit BLB- bzw. WLB-Bestand anzulegen. In großer Zahl konnten anhand von K10plus-Identifiern (PPN) und Signaturen die Bibliographie-Titel eindeutig auf K10plus-Titel gematcht werden. Ebenso konnten viele Aufsätze anhand der Signatur der Zeitschrift bzw. des Sammelbands mit der korrekten Überordnung im K10plus verknüpft werden.
Beim Import wurden die Titel der Bibliographien, die im Vorfeld nicht eindeutig mittels PPN oder Signatur einem K10plus-Titel zugeordnet werden konnten, anhand von Matchingkriterien wie ISBN, Titel, Autor, Umfang, Ausgabebezeichnung, Verlag, Serienangabe und bei Aufsätzen Quellenangabe mit schon vorhandenen K10plus-Titeln zusammengeführt („gemergt“). Beim Merge wurden die Sacherschließungsdaten der Landesbibliographie und der StGB (Einzelschlagwörter,10 Notationen der Landesbibliographie) in den schon vorhandenen Titelaufnahmen im K10plus ergänzt. Für die IHB konnte die Inhaltserschließung nur in den lokalen Bereich der WLB migriert werden.11 Für alle drei Bibliographien wurden recherchierbare Sammlungskennzeichen auf Titelebene ergänzt (vgl. 3.3).
In einem iterativen Prozess und in enger Zusammenarbeit zwischen BSZ, WLB und BLB wurden die Daten wiederholt in die K10plus-Testdatenbank importiert, um die festgelegte Umsetzung in das K10plus-Pica-Format sowie das Match & Merge zu testen und zu optimieren. Im Dezember 2023 konnten schließlich die Landesbibliographie Baden-Württemberg und die Stefan George-Bibliographie produktiv im K10plus freigegeben werden; die Internationale Hölderlin-Bibliographie folgte nur wenig später Mitte Januar 2024.
3. Entwicklung des Katalogangebots der WLB –
Relaunch des Katalog Plus
3.1 Ausgangslage: Kataloge, Discovery und Indizes
Für die Recherche bietet die WLB zwei Einstiege an. Um ausschließlich in den WLB-Beständen zu recherchieren, kann der „WLB-Katalog“ genutzt werden. Es handelt sich dabei um den aDIS-OPAC der Firma aStec. Vorteile dieses Katalogs bestehen unter anderem darin, dass Nutzerkonto-Funktionen wie die Bestellung mehrerer Medien mit nur einer Anmeldung möglich und lokale Daten wie zum Beispiel Signaturen recherchierbar sind.
Seit 2017 wird zusätzlich der „Katalog Plus“ angeboten; hierbei handelt es sich um die Discovery-Lösung BOSS des BSZ auf VuFind-Basis. Innerhalb des Katalog Plus wurden bis zum Relaunch Anfang des Jahres 2024 drei Reiter angeboten. Im Reiter „Bibliothekskatalog“ waren die Bestände der WLB als Ausschnitt aus dem Gemeinsamen Verbünde Index (GVI) hinterlegt. Die Verfügbarkeitsanzeige wurde mittels DAIA12 realisiert. Lokaldaten aus dem K10plus waren für die Anzeige nur eingeschränkt verfügbar, da in den GVI nur fernleihrelevante Informationen importiert werden. Damit war keine Recherche nach lokalen Daten wie beispielsweise nach Signaturen möglich. Im zweiten Reiter „Fernleihe“ war ebenfalls der GVI für alle Fernleihfunktionen, im dritten Reiter „Aufsätze und mehr“ der EDS (EBSCO Discovery Service) hinterlegt.
3.2 Ablösung der Indizes GVI/EDS durch den K10plus-Zentral
Das parallele Angebot von zwei Bibliothekskatalogen ist für die Nutzenden schwer nachvollziehbar. Daher wird von der WLB das Ziel verfolgt, den Katalog Plus als einzigen Sucheinstieg anzubieten. Dagegen sprach, dass zahlreiche Funktionen dort nicht verfügbar waren, insbesondere die Signaturen-Suche. Zusammen mit den spezifischen Anforderungen aus dem Migrationsprojekt der Bibliographien, vor allem aufgrund der notwendigen Recherchierbarkeit und Darstellung der lokalen Sacherschließung der IHB, stellte sich auch die Frage nach dem zum Einsatz kommenden Index. Denn mit der bisherigen Index-Konfiguration im BOSS-Discovery konnten die grundlegenden Anforderungen nicht erfüllt werden. Als Lösung kam der K10plus-Zentral-Index13 in Betracht, da dieser mit Daten aus der K10plus-Verbunddatenbank und weiteren getrennt gehaltenen Aufsatzdatenbanken, die von der Verbundzentrale des GBV (VZG) und dem BSZ gepflegt werden, befüllt wird. Die Daten werden als MARCXML nach K10plus-Zentral exportiert und dabei mit Lokal- und Exemplardaten im bibliographischen Bereich (MARC-Felder 980ff) angereichert. Bei den Aufsätzen werden die Bestände anhand der Angaben in den ZDB-Bestandssätzen der Bibliotheken erzeugt.
Der K10plus-Zentral war damit eine echte Alternative für die WLB, da wichtige lokale Daten wie Signaturen und Sacherschließungsdaten in BOSS angezeigt und recherchiert werden können. Zudem ergab die Prüfung der Kollektionen und Produkte, dass die für die WLB wichtigsten Aufsatzquellen aus dem EDS-Index auch im K10plus-Zentral enthalten sind. Auch wollte die WLB eine One-Stop-Search umsetzen, um die Recherche nach allen Medien über nur einen Reiter zu ermöglichen. Die Entscheidung, den Index zu wechseln und auf den K10plus-Zentral umzustellen, hatte zumindest den Nebeneffekt, dass Bibliotheks- und Aufsatzdaten ohne größeren Aufwand in einem Reiter zusammengeführt werden konnten. Damit war die Anforderung zur Reduzierung der angebotenen Suchzugänge umgesetzt, wenngleich leider keine echte One-Stop-Search möglich ist. Weiterhin sind zwei Reiter nötig; ein Reiter für den Katalog Plus und ein weiterer für die Fernleihe, da die Daten anderer Verbünde, die für die überregionale Fernleihe notwendig sind, nicht im K10plus-Zentral enthalten sind.
3.3 Umsetzung der wichtigsten Anforderungen bezogen auf
die Bibliographien
Anfang Januar 2024 konnte die WLB mit dem neuen Katalog Plus auf Basis von K10plus-Zentral in den Beta-Betrieb gehen. Aus drei Reitern wurden zwei: Im ersten Reiter „Katalog Plus“ sind die WLB-Bestände aus dem K10plus, die migrierten Bibliographien, E-Pflicht-Titel14 sowie weitere Aufsatzkollektionen wie zum Beispiel von Online-Contents, JSTOR, DOAJ, Springer und Wiley aus dem K10plus-Zentral enthalten. Der zweite Reiter „Fernleihe“ bietet nach wie vor die Titel aller Verbünde aus dem GVI an.
Die Bibliographie-Daten „aus dem Silo“ zu holen, sollte nicht bewirken, dass diese im großen Datenpool K10plus verschwinden. Im Gegenteil: sie sollten sichtbarer werden. Dafür wurden Filter eingerichtet, mit denen man per Checkbox gezielt in der Landesbibliographie Baden-Württemberg, der IHB und der StGB suchen kann (siehe Abb. 2 rechts oben). Technisch möglich gemacht wird dies durch Sammlungskennzeichen, auf die im Hintergrund eingeschränkt wird. Um Titellisten weiter thematisch filtern zu können, wurden die Systematik der Landesbibliographie, die lokale Systematik und lokale Schlagwörter der IHB als Facetten umgesetzt (siehe Abb. 2 rechts unten).
Zusätzlich zu den Filtern, die auf Titel der Bibliographien bzw. bestimmte Ressourcen einschränken, sollte auch bei jedem angezeigten Titel sofort ersichtlich sein, wenn er Teil einer Bibliographie ist – in diesem Fall wird ein entsprechendes Icon eingeblendet.15 In Abb. 2 sieht man dies bei den Treffern Nr. 1 und 2.
Die Anzeige der Sacherschließung der Landesbibliographie und der StGB sollte gemeinsam mit anderen Sacherschließungsdaten in die Titel-Vollanzeige integriert werden. Wie in Abb. 3 zu sehen, werden Schlagwörter aus den eventuell vorhandenen Schlagwortfolgen nach RSWK aus dem Verbund sowie Einzelschlagwörter aus den Bibliographien dedupliziert und als unsortierte Liste angezeigt. Auch die Systematik der Landesbibliographie und die Regensburger Verbundklassifikation (RVK), die von der WLB als Aufstellungssystematik für den Freihandbereich genutzt wird, werden zusammen gelistet. Die Hierarchie der jeweiligen Notation wird als Mouseover dargestellt (siehe Abb. 3).
Eine besonders „harte Nuss“ in der Migration selbst, aber auch in der Darstellung im Discovery-System waren die semantischen Strukturen der IHB-Inhaltserschließung. Zwischen Notationen und Schlagwörtern bestehen Beziehungen, die nicht verloren gehen sollten. Dabei gibt die Notation eine thematische Grobeinteilung vor, die durch das Schlagwort spezifiziert wird.16 Gelöst werden konnte dieses Problem durch datensatzinterne „Links“ zwischen den Notations- und Schlagwort-Feldern. Sowohl im K10plus-Pica-Format als auch in den 98X-MARC-Feldern im K10plus-Zentral wird durch eine aufsteigende Zählung jede Notation dem zugehörigen Schlagwort zugeordnet. Diese Zählungen werden ausgewertet und in die Anzeige der Notations-Schlagwort-Paare umgesetzt.
4. Vom Silo in den „Verbund-Discovery-Kosmos“ –
Fazit & Ausblick
Der Überblick nach der Migration der Bibliographien zeigt eine deutliche Vereinfachung der technischen Infrastruktur mit dem K10plus im Zentrum der Datenhaltung (Abb. 4). Es gibt keine separat geführten Datenbanken und keine eigenen Suchportale mehr, sondern die Recherche durch die Nutzenden findet jetzt integriert im Katalog Plus der WLB statt. Das führt zu einer großen Sichtbarkeit der Angebote und der Bibliographie-Daten.
Die Migration der Bibliographien ist weitgehend erfolgreich abgeschlossen. Von ihrer früheren Silo-Lösung wurden sie nicht nur in den K10plus migriert, sondern können nun direkt von weiteren Systemen wie Discoveries nachgenutzt werden. Für die WLB wurden Titel- und Sacherschließungsdaten, samt lokaler Sacherschließung, in den K10plus-Zentral-Index integriert. Die WLB ist damit erst die zweite Bibliothek überhaupt, die BOSS gemeinsam mit dem K10plus-Zentral-Index nutzt,17 und die erste große wissenschaftliche Bibliothek im SWB.
Auch das Fazit für den Relaunch des Katalog Plus fällt positiv aus. Das Migrationsprojekt war Katalysator für weitere umfangreiche Optimierungen, die als Arbeitspakete nach dem Go Live mit den Ergebnissen aus der Evaluierung der Bibliothekskataloge fortgesetzt wurden. Dazu gehören beispielsweise die Überarbeitung der Facetten, der bibliographischen Anzeigen oder der Bestellwege und Nutzerfunktionen. Aus WLB-Sicht liegen in der Konfigurierbarkeit des BOSS-Systems allerdings auch Grenzen. Die spezifischen Anforderungen der WLB konnten nicht immer umgesetzt werden, da dies Auswirkungen auf BOSS-Instanzen anderer Bibliotheken gehabt hätte.18 Den Ausgleich zwischen diesen Bedarfen und der Erhaltung der Wartbarkeit aller beim BSZ gehosteten BOSS-Instanzen zu wahren, war eine stetige Schwierigkeit aus BSZ-Sicht. Um die grundsätzliche Beschränkung zu umgehen, wurde und wird der BOSS-Code vom BSZ so umstrukturiert, dass individuelle Anpassungen möglichst in Konfigurationsdateien ausgelagert werden. Das ermöglichte es, im Projekt das Layout von BOSS und die Darstellung der Titel flexibler an die Anforderungen der WLB anzupassen und dabei den Wartungsaufwand für die einzelnen Instanzen zu reduzieren.
Zu den großen Herausforderungen zählte für die WLB insbesondere der Wissensaufbau über Metadaten (Formate, Datenmodelle, -Konvertierung), den Index oder Schnittstellen, der in sehr kurzer Zeit erfolgen musste. Für das BSZ war die Umstellung der BOSS-Instanz auf den K10plus-Zentral während des gleichzeitigen Relaunchs und der Integration der Bibliographien zu bewerkstelligen.
Die Vorteile der neuen Lösung liegen klar auf der Hand: Die Nutzenden können nun in einem Reiter des Katalog Plus nach Literatur und Themen recherchieren, ohne dass sie zwischen Büchern und Aufsätzen unterscheiden müssen. Die Bibliographien sind such- und sichtbar und können nun v.a. durch andere Bibliotheken in weiteren Rechercheportalen einfach nachgenutzt werden. Für die WLB stehen durch den Wechsel vom EDS-Index auf einen kostenfreien Index Mittel zur Verfügung, um beispielsweise Erwerbungen in anderen Bereichen zu tätigen.
Fertig ist ein solches Recherchesystem allerdings nie. So wird die WLB ihren Katalog Plus weiter evaluieren und gemeinsam mit dem BSZ so entwickeln, dass dieser künftig als alleiniger Bibliothekskatalog zur Verfügung gestellt werden kann. Insbesondere besteht der Bedarf, bestimmte Normdaten in BOSS zu integrieren, um zum Beispiel nach baden-württembergischen Personen und ihren Lebensdaten suchen zu können. Das BSZ arbeitet außerdem derzeit an einem grundsätzlichen Redesign von BOSS, um insbesondere die mobile Ansicht an die modernen Anforderungen anzupassen. Das Projekt mit der WLB hat dabei wertvolle Impulse gegeben, die für die Arbeiten der kommenden Monate mitberücksichtigt werden können.
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.
1 Thalhofer, Anja: Neues Jahr – neuer Katalog Plus der Württembergischen Landesbibliothek, WLB Blog, 03.01.2024, https://www.wlb-stuttgart.blog/neuer-katalog-plus-der-wlb/, Stand: 07.07.2024. Dieser Beitrag beruht auf dem Vortrag der Autorinnen „Daten aus dem Silo – Bibliographien im Index des Discovery-Systems der Württembergischen Landesbibliothek Stuttgart“ im Rahmen des Panels „Metadaten im Einsatz“ am 07.6.2024 anlässlich der 112. BiblioCon in Hamburg.
2 Unter „Reiter“ wird hier ein Recherchezugang mit festgelegten Kriterien verstanden.
3 Der K10plus ist die gemeinsame Katalogisierungsdatenbank des Südwestdeutschen Bibliotheksverbundes (SWB) und des Gemeinsamen Bibliotheksverbundes (GBV).
4 Adabas (Adaptable Database System) ist ein Datenbankmanagementsystem der Darmstädter Software AG.
7 Eigenentwicklung von Tools und Schnittstellen durch die WLB, um Titel der drei Bibliographien (PICA2Labi, PICA2
Hölderlin, PICA2George ) und GND-Personennormsätze der Landesbibliographie Baden-Württemberg aus dem K10plus zu importieren.
9 Diese Entscheidung bedeutete eine komplexe Projektstruktur, da die BLB als Discovery ein anderes System, nämlich den Katalog plus der UB Freiburg einsetzt. Weitere Informationen zum Projekt der Migration der Titel- und Sacherschließungsdaten der Landesbibliographie Baden-Württemberg in den K10plus und zur Umsetzung und Darstellung der Daten in den Discovery-Systemen finden sich auch im Beitrag: Heim, Gerrit; Thalhofer Anja: Die Landesbibliographie Baden-Württemberg im Doppelplus. Migration in den K10plus und neue Rechercheplattform Katalog Plus,
in: o-bib 4 (4), https://doi.org/10.5282/o-bib/6064.
10 Es werden GND-Schlagwörter und freie Nicht-GND-konforme Schlagwörter vergeben. Diese wurden getrennt in die jeweiligen PICA-Felder (5580, 5520) eingespielt.
11 Grund dafür war, dass eine Abbildung der semantischen Strukturen der IHB-Inhaltserschließung über die Zuordnung von Notationen und Schlagwörtern mittels Thesaurus nicht im bibliographischen Bereich des K10plus möglich war und IHB-Schlagwörter im Kontext Hölderlins perspektivisch keine GND-Nummern erhalten werden.
12 DAIA (Document Availability Information API) ist eine Schnittstelle zur Abfrage von aktuellen Verfügbarkeitsinformationen aus dem lokalen Bibliothekssystem.
14 Hierbei handelt es sich um E-Books und E-Journals, die die WLB gemäß ihrem gesetzlichen Auftrag als digitale Pflicht-
exemplare langzeitarchiviert. Aus urheberrechtlichen Gründen ist ein Zugang nur an gesicherten Rechnern in der WLB möglich. Ihre Metadaten werden dementsprechend in einer eigenen Kollektion im K10plus-Zentral angeboten.
15 Auf gleiche Art und Weise werden auch die Titel der E-Pflicht gekennzeichnet.
16 Beispielsweise steht die Notation „7Dk“ in Abb. 3 für das Thema „Gedenkstätten <an Hölderlin>“, durch das Schlagwort „Tübingen <Gedenkstätte>“ wird spezifiziert, welche Gedenkstätte genau Thema ist.
17 Außer bei der BOSS-Instanz der WLB ist K10plus-Zentral auch beim BOSS des Deutsch-Französischen Instituts
Ludwigsburg im Einsatz.
18 Gewünschte Änderungen in der Kurztitelanzeige waren nicht möglich. Das betrifft bei der Veröffentlichungsangabe u.a. hier nur den ersten Eintrag ohne einleitende Wendung anzuzeigen.