Der Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. (MPG) gehören derzeit 84 Institute an, die sich mit verschiedensten Themen aus den Bereichen biologisch-medizinischer, chemisch-physikalischer-technischer sowie geistes-, sozial- und humanwissenschaftlicher Forschung befassen. Für die Versorgung der ca. 10.000 Forschenden1 mit bibliothekarischen Services setzt die MPG auf zwei komplementäre Säulen. Die Max Planck Digital Library (MPDL) übernimmt eine Reihe an Aufgaben, durch deren Zentralisierung Mehrwerte im Vergleich zu einer lokalen Serviceerbringung generiert werden können. Hierzu gehört das Aushandeln von Verträgen für eine gemeinschaftliche Grundversorgung der Institute mit institutsübergreifend wichtigen Informationsressourcen wie Datenbanken und Zeitschriften, aber auch E-Books. Große Bedeutung kommt hier mittlerweile auch Open-Access- bzw. Transformationsverträgen wie z. B. den DEAL-Verträgen zu. Darüber hinaus werden verschiedene Nachweissysteme und Infrastrukturen für die Institute bereitgestellt, bspw. für MPG-weit lizenzierte E-Books und Datenbanken sowie die (Zweit-)Veröffentlichungen der Forschenden.2
Etwa 70 Institutsbibliotheken übernehmen die Betreuung der Wissenschaftler*innen vor Ort in den Instituten. Sie erbringen teils sehr unterschiedliche, auf die jeweiligen Bedürfnisse des Instituts zugeschnittene Services, von spezifischer Informationsversorgung bis hin zum Forschungsdatenmanagement, und vermitteln zugleich Services der MPDL. Bemerkenswert ist die personell stark unterschiedliche Ausstattung der Bibliotheken, die teilweise auch für mehrere Institute zuständig sind. So wird die Hälfte der Institute von einer One-Person-Library betreut, wohingegen die Hälfte der Vollzeitstellen aller Informationsdienstleistenden an den Instituten in den acht größten Institutsbibliotheken der geistes-, sozial- und humanwissenschaftlichen Sektion angesiedelt ist.
Diese heterogenen Rahmenbedingungen und Ausrichtungen der Institutsbibliotheken schlagen sich auch in deren Rechercheinfrastrukturen nieder. Bislang werden fast ausschließlich integrierte Bibliothekssysteme mit jeweils eigenem OPAC eingesetzt. Der Schwerpunkt liegt zwar auf Aleph 500, daneben werden jedoch zahlreiche weitere Bibliothekssysteme genutzt. Zudem sind nur wenige Institutsbibliotheken Mitglied in einem der deutschen Bibliotheksverbünde. Ein gemeinsamer Katalog mit den Beständen aller MPG-Bibliotheken existiert nicht, sodass die Ressourcen der Institutsbibliotheken, institutsübergreifend nutzbare E-Books, Institutspublikationen etc. bislang in separaten Systemen recherchiert werden müssen. Resource Discovery Systeme (RDS), die diese verschiedenen Datenbestände zusammenführen könnten, werden nur sehr vereinzelt genutzt. An einem 2011 durchgeführten Projekt zur Einführung eines auf der Open-Source-Software VuFind basierenden RDS in der MPG waren lediglich acht Institutsbibliotheken beteiligt. Die verschiedenen Datenbestände der MPG wurden hierbei nicht durchgehend systematisch integriert und die entsprechenden VuFind-Installationen sind heute außerdem stark veraltet, da der beteiligte Dienstleister kurz nach Ende des Projekts seinen VuFind-Support eingestellt hat. Kommerzielle RDS-Lösungen spielen in der MPG quasi keine Rolle. Damit ist für die gesamte MPG eine starke Zersplitterung in isolierte Daten-Silos zu konstatieren, die den Forschenden den effizienten Zugang zu verteilten Informationsressourcen erheblich erschwert.
Diese Situation soll durch ein neues RDS namens „MPG.Discovery“ verbessert werden, in dem verschiedenste MPG-interne und -externe Datenbestände unter einer Suchoberfläche zusammengeführt und durchsuchbar gemacht werden. Dabei wird bewusst auf Open-Source-Lösungen gesetzt – die RDS-Software VuFind sowie die Suchplattform Apache Solr –, um ein größtmögliches Maß an digitaler Souveränität herzustellen. MPG.Discovery soll den Forschenden nicht nur ein zeitgemäßes Sucherlebnis mit einer modernen, auch für mobile Endgeräte geeigneten Suchoberfläche bieten, sondern als Basisinfrastruktur die Anschlussfähigkeit an andere Umgebungen verbessern sowie ggf. für die Entwicklung KI-basierter Mehrwertdienste genutzt werden.
Bei einer MPG-internen Umfrage hatten etwa 40 Institute Interesse an einem derartigen Recherchesystem bekundet. Dieses muss dementsprechend in einem vorgegebenen Rahmen Individualisierungsmöglichkeiten zulassen, wie bspw. die Anpassung der Oberfläche an das Institutsdesign. Um sowohl den Implementierungs- als auch den Pflegeaufwand in Grenzen zu halten, wurde ein einheitliches, anpassbares Basis-Template entwickelt, das an das Corporate Design der MPG angelehnt ist. Darauf basierend sind für jede institutsspezifische MPG.Discovery-Instanz Anpassungen für die eigenen Bedürfnisse möglich, z. B. durch Auswahl zwischen verschiedenen MPG-Basisfarben, Einbringen eines individuellen Bilds im Hintergrund des Suchschlitzes, Festlegung von Funktionalitäten für die Suche oder indem Anzahl und Inhalte der redaktionellen Textboxen auf der Startseite bestimmt werden können. Abbildung 1 veranschaulicht anhand der Startseiten von drei Instituten diese Individualisierungsoptionen, die den Instituten gestalterische und inhaltliche Freiheiten geben und zugleich eine Zusammengehörigkeit erkennen lassen.

Mit Blick auf die Vielfalt der bearbeiteten Forschungsthemen in der MPG muss es darüber hinaus auch möglich sein, die Suchräume der verschiedenen MPG.Discovery-Instanzen entsprechend der Forschungsschwerpunkte der einzelnen Institute inhaltlich anzupassen. Abbildung 2 verdeutlicht die Struktur des für MPG.Discovery aufgebauten Indexes. Ausgangspunkt dafür war das Schema des K10+-Indexes, das Zug um Zug an projektspezifische Anforderungen angepasst wurde. Aufgenommen in den Index werden die Bibliotheksbestände der an MPG.Discovery beteiligten Institute, die verschiedenen Nachweissysteme für MPG-weit zugängliche Ressourcen, zahlreiche Open-Access-Quellen, die größtenteils über die Bielefeld Academic Search Engine (BASE) eingebunden werden können, außerdem Daten aus der Elektronischen Zeitschriftenbibliothek (EZB) und, da für die projektbeteiligten Institute besonders wichtig, JSTOR. Aus dem deduplizierten Gesamtindex, der gut 29 Mio. Items (Stand: Juni 2025) enthält, können die Institute dann die jeweils für sie interessanten Quellen auswählen, wodurch die einzelnen Instanzen für die Suche auf institutsspezifische Ausschnitte aus dem Gesamtindex zugreifen können.

Die Implementierung eines komplexen RDS an einer Vielzahl an Einrichtungen, die zudem teilweise von One-Person-Libraries betreut werden, bringt neben den Herausforderungen der Skalierbarkeit des Systems auch besondere Ansprüche an eine möglichst einfache Einführung des Systems mit sich. Daher ist die Erarbeitung von Onboarding-Dokumenten mit allgemeinen Informationen sowie Handlungsanweisungen und Checklisten für die bei der Implementierung zu durchlaufenden Schritte ebenso Teil der MPG.Discovery-Entwicklung wie die Erarbeitung möglichst standardisierter Workflows und die Etablierung eines „Mentorings“ für Institute, die neu zur MPG.Discovery-Anwendergemeinschaft hinzukommen.
Umgesetzt wird MPG.Discovery im Rahmen eines Projekts, das aus Mitteln eines MPG-internen Open-Source-Software-Förderprogramms finanziert wird. An dem von Juni 2023 bis Dezember 2025 laufenden Projekt sind zwölf Institute beteiligt, wobei drei Institute als Piloteinrichtungen fungieren. Die technische Umsetzung erfolgt durch die effective WEBWORK GmbH (eWW) in Hamburg.
Um das Projekt möglichst effizient durchführen zu können, wurden auf Seiten der beteiligten Institute eine Governance-Struktur entwickelt und Kommunikationskanäle festgelegt. Die Gesamtkoordination übernimmt ein Steuerungsgremium, bestehend aus je zwei Vertreter*innen der drei Pilotinstitute mit unterschiedlichen Kompetenzen und Aufgaben (z. B. technisches Datenhandling, Metadatenmanagement, Projektmanagement). Das Steuerungsgremium bespricht in Jours fixes die jeweils anstehenden Arbeiten und Projektfortschritte, übernimmt zahlreiche organisatorische Aufgaben und führt regelmäßige Treffen mit dem Dienstleister eWW durch. Ein wichtiger Schwerpunkt der Jours fixes mit eWW ist die detaillierte Ausgestaltung der umzusetzenden Anforderungen, die aufgrund der hohen Komplexität des Projekts im Vorfeld nur grob formuliert worden waren. Darüber hinaus sind die Mitglieder des Steuerungsgremiums zugleich Koordinator*innen von vier Projekt-Arbeitsgruppen. Diese befassen sich a) mit der Integration MPG-externer Ressourcen in MPG.Discovery, b) mit der technischen und datenmäßigen Anbindung der verschiedenen Lokalsysteme (Aleph, Koha, Pica), c) mit der Gestaltung der Suchoberfläche sowie d) mit Fragen des automatisierten Testens. In diesen Arbeitsgruppen bearbeiten alle am Projekt beteiligten Institute operativ spezifische, für das Projekt wichtige Themen, erbringen soweit wie möglich die auf übergeordneter Ebene benötigten Zuarbeiten für den Dienstleister und bereiten ggf. institutsspezifische Zuarbeiten vor. Der Austausch innerhalb und zwischen den beschriebenen Gruppen erfolgt über einen Mix aus MPG-internen Kanälen (Chat, SharePoint), regelmäßigen bzw. anlassbezogenen (Web-)Meetings sowie über eine von eWW bereitgestellte GitLab-Instanz, die der Steuerung und dem Monitoring konkreter Arbeitsaufgaben dient. Mit Beginn der Arbeiten an den einzelnen Institutsinstanzen wurde im zweiten Projektjahr das Format einer zweiwöchentlichen Sprechstunde mit den Mitgliedern des Steuerungsgremiums eingeführt, die allen projektbeteiligten Instituten offensteht. Bewährt hat sie sich nicht nur für den niedrigschwelligen Informations- und Erfahrungsaustausch, sondern auch für die gemeinschaftliche Priorisierung und Ausgestaltung der Anforderungen an den Dienstleister. So ist gewährleistet, dass die Institute stets nur mit gemeinschaftlich abgestimmten Anforderungen an eWW herantreten. Da in einem derart großen Projekt ein klarer Fokus auf die Kernanforderungen unabdingbar ist, um den zeitlichen und finanziellen Rahmen nicht zu sprengen, dient die Sprechstunde außerdem auch dem Erwartungsmanagement in Bezug auf Fragen wie das „Feintuning“ der Datenstrukturierung (z. B. mit Blick auf Über-/Unterordnungen) oder im Projektverlauf noch aufkommende Featurewünsche (s. Kapitel 5). Hier kann mit Blick auf insgesamt begrenzte Projektressourcen nicht alles umgesetzt werden, so dass es einer gemeinsamen Verständigung über im Projektrahmen realistisch Umsetzbares bedarf.
Nach Abschluss des ersten VuFind-Projekts 2011 stellte sich heraus, dass ein Upgrade zur VuFind Version 2 eine komplette Neukonfiguration bedeutet hätte. Dies wurde aus Kapazitätsgründen sowohl vom Dienstleistungspartner als auch den seinerzeit projektbeteiligten Instituten nicht in Angriff genommen. Vor dem Hintergrund dieser Erfahrungen sowie dem Interesse von insgesamt 40 Instituten an einer RDS-Lösung lag ein Schwerpunkt des MPG.Discovery-Projekts darauf, den Betrieb und die Weiterentwicklung von MPG.Discovery nachhaltig für einen größeren Anwenderkreis sicherzustellen. Daher wurde frühzeitig ein Betriebskonzept erarbeitet, das anschließend, auch unter Einbeziehung juristischer Expertise der MPG-Generalverwaltung, in eine formale Vereinbarung zur Zusammenarbeit der an MPG.Discovery beteiligten MPG-Einrichtungen überführt wurde, die zusammen die MPG.Discovery-Anwendergemeinschaft bilden. Als „Inspirationsquellen“ dafür dienten die Satzung des Kitodo-Vereins3 sowie die Erfahrungen der MPG-internen Anwendergemeinschaft für die Plattform Digital Libraries Connected (DLC)4.
Betrieb und Weiterentwicklung eines RDS sind mit einer Reihe an Aufgaben verbunden. Open-Source-Software hat prinzipiell den Vorteil, dass diese Aufgaben selbst wahrgenommen werden können, anstatt einen Dienstleister bzw. den Software-Anbieter teuer zu bezahlen. In den am Projekt beteiligten Instituten sind jedoch keine vertieften Kenntnisse der eingesetzten Software vorhanden und ein nachhaltiger Aufbau derartiger Spezialkenntnisse wäre angesichts der Vielzahl und Heterogenität der beteiligten Institute nur schwer möglich – zumal diese typischerweise keine Infrastrukturaufgaben für die MPG als Ganzes wahrnehmen und auch nur über wenig entsprechend qualifiziertes Personal verfügen. Daher sollen alle Aufgaben, die Expertenwissen zu VuFind, Apache Solr oder auch der dafür benötigten Infrastruktur erfordern, an Dienstleistungspartner ausgelagert werden. Dies betrifft insbesondere Hosting, Wartung und Support sowie die funktionale Weiterentwicklung von MPG.Discovery. Um Kosten und Aufwand in Grenzen zu halten, werden hierfür nach Möglichkeit zentrale Rahmenverträge geschlossen, auf deren Basis die an MPG.Discovery beteiligten Institute entsprechende Dienstleisteraufträge erteilen können. Die anfallenden Kosten werden gleichmäßig auf die Anwendergemeinschaft verteilt.
Daneben gibt es eine Reihe weiterer organisatorischer sowie (system-)bibliothekarischer Aufgaben wie bspw. das Monitoring der Daten-Pipelines, das Onboarding neuer Mitglieder oder auch die inhaltliche Ausgestaltung und Begleitung der Auftragsvergabe an Dienstleister. Die dafür erforderlichen Kenntnisse sind in der Anwendergemeinschaft vorhanden und sollen deshalb von deren Mitgliedern arbeitsteilig übernommen werden. Wichtig ist dabei, dass die Aufgaben möglichst gleichmäßig und, wo möglich, redundant auf alle, ggf. auch neue Mitglieder verteilt und in regelmäßigen Abständen überprüft werden, um eine Überlastung einzelner Mitglieder zu verhindern.
Der (funktionalen) Weiterentwicklung von MPG.Discovery kommt besondere Bedeutung zu, weshalb diese fest im Betriebskonzept verankert wurde. Für die Weiterentwicklung ist von jedem Mitglied der Anwendergemeinschaft jährlich ein festgelegtes Budget vorzuhalten. Die Kooperationsvereinbarung sieht vor, dass Versionswechsel, sofern diese nicht im Rahmen von Supportdienstleistungen erbracht werden können, zeitnah aus dem gemeinsamen Weiterentwicklungsbudget finanziert werden müssen. So soll die Aktualität der Software sichergestellt werden. Darüber hinausgehende Weiterentwicklungswünsche können von allen Mitgliedern der Gemeinschaft eingebracht werden. In der Mitgliederversammlung werden diese unter Berücksichtigung des verfügbaren Weiterentwicklungsbudgets priorisiert. Alle Weiterentwicklungen sollen unter der von VuFind genutzten Lizenz GPL 2.0 zur Verfügung gestellt werden.
Bereits während der Projektlaufzeit wurden in enger Abstimmung mit eWW zahlreiche Featurewünsche identifiziert, deren Umsetzung den Rahmen des laufenden Projekts sprengen würde. Diese werden schon jetzt auf einer Wunschliste gesammelt und können nach Abschluss des Projekts von der Anwendergemeinschaft diskutiert und priorisiert werden. Die Wünsche reichen von kleinen Verbesserungen in der Oberfläche wie bspw. der Anzeige von Autor*innen-Namen im Fenster für Vormerkungen bis hin zu größeren funktionalen Erweiterungen wie einem systematikbasierten Browsing-Einstieg in die Suche.
Einzelne Weiterentwicklungen ließen sich bereits direkt im Projekt umsetzen. So ist es ein wichtiges Anliegen des Projekts, dass Workflows nicht nur soweit wie möglich automatisiert ablaufen, sondern auch überwacht werden. Damit soll der Aufwand für den laufenden Betrieb weitestgehend begrenzt werden. Dafür wird die Plattform Apache Airflow in die Datenpipelines eingebunden, mit der eine laufende Überprüfung von Workflows möglich ist. Sollte ein Schritt in der Verarbeitung der zahlreichen in den Index aufgenommenen Datenquellen scheitern, erfolgt eine automatisierte Benachrichtigung an die Administrator*innen. Eine aufwändige manuelle Prüfung kann damit entfallen.
Die konkrete Umsetzung der Integration von KI-basierten Funktionalitäten in MPG.Discovery wurde dagegen vertagt. Während der Projektlaufzeit fanden hierzu bereits erste Gespräche mit der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)5 statt, an der das KI-Servicezentrum für sensible und kritische Infrastrukturen (KISSKI) angesiedelt ist.6 Im Rahmen eines Workshops wurden zudem Ideen für KI-Erweiterungen (z. B. natürlichsprachige Suche, KI-basierte Interaktion mit Volltexten aus einem Trefferset) zusammengetragen, die für die Forschenden in der MPG von Interesse sein könnten. Eine Umsetzung musste mit Blick auf die noch laufenden Implementierungsarbeiten zurückgestellt werden und wird dann voraussichtlich erst im Rahmen der funktionalen Weiterentwicklung nach Projektende erfolgen.
Obwohl der Großteil der Arbeit von einem erfahrenen Dienstleister übernommen wird, ist die Implementierung von MPG.Discovery für die beteiligten Institutsbibliotheken eine große Herausforderung. Die Zuarbeiten für eine sinnvolle Anzeige der Datenquellen in der Oberfläche und die Anbindung des eigenen Bibliothekssystems erfordern systembibliothekarische Kenntnisse, die nicht in allen, teils sehr kleinen Institutsbibliotheken vorhanden sind. Die notwendige gegenseitige Unterstützung führte ebenso wie die Zusatzarbeit im Steuerungsgremium bei einzelnen Projektbeteiligten zu einer zeitweise äußerst hohen Arbeitsbelastung, die durch starke Priorisierungen im Alltagsgeschäft aufgefangen werden musste. Dies unterstreicht die Notwendigkeit umfangreicher Onboarding-Unterlagen für neu hinzukommende Mitglieder der Anwendergemeinschaft, um deren Implementierungen so einfach wie möglich zu gestalten. Angesichts der teilweise bereits jetzt erheblichen Arbeitsaufwände für die Umsetzung des Arbeitsprogramms wurde auch klar, dass eine grundsätzlich wünschenswerte, ursprünglich aber nicht eingeplante Implementierung von KI-Features im Projektrahmen nicht mehr realistisch ist.
Die Zusammenarbeit mit eWW verläuft über das gesamte Projekt hinweg sehr gut. Als Erfolgsfaktor wird auf beiden Seiten der enge regelmäßige Austausch gesehen. Nur dadurch konnte der gewählte Ansatz einer agilen Feinspezifikation der Anforderungen erfolgreich umgesetzt werden. Denn erst im Gespräch mit dem Dienstleister konnten die verschiedenen Herausforderungen identifiziert werden, mit denen scheinbar einfach anmutende Featurewünsche in der Umsetzung verbunden sein können. Eine strikte Priorisierung und Fokussierung ist jedoch dringend erforderlich, um das Projekt im Zeit- und Budgetrahmen zu halten. Dass die Projektlaufzeit dennoch von zwei auf zweieinhalb Jahre verlängert werden musste, ist fast ausschließlich auf externe Verzögerungen bei der Migration von zwei beteiligten Institutsbibliotheken auf ein neues Bibliotheksmanagementsystem zurückzuführen.
Vom Erfolg des Projekts zeugt auch, dass bereits großes Interesse weiterer Institute an der Nutzung von MPG.Discovery besteht, obwohl die Arbeiten noch nicht abgeschlossen sind: Eine Warteliste für konkrete Interessenten umfasst derzeit sechs Institute. Werden diese Implementierungen zeitnah nach Abschluss des Projekts, das elf institutsspezifische und eine institutsübergreifende MPG.Discovery-Instanz umfasst, angegangen, könnte die MPG.Discovery-Anwendergemeinschaft damit schon bald auf knapp 20 Mitglieder anwachsen. Von einer weiteren Zunahme der Mitgliederzahl ist mit Blick auf die vor dem Projekt durchgeführte Umfrage auszugehen. Dadurch könnte sich MPG.Discovery schnell stabilisieren, der Spielraum für funktionale Weiterentwicklungen wachsen, und die einzelnen Mitglieder könnten durch die Gemeinschaft entlastet werden.
Insgesamt bedeutet MPG.Discovery eine deutliche Veränderung und Verbesserung hinsichtlich der Informationsversorgung in der MPG. Durch die Verbindung dezentraler Flexibilität mit zentraler Koordination soll eine zukunftssichere Discovery-Plattform entstehen, die wissenschaftliche Forschung auf hohem Niveau durch technologische Innovation unterstützt. Das Projekt zeigt exemplarisch, wie komplexe Digitalisierungsvorhaben in föderalen Forschungsorganisationen durch klare Governance-Strukturen und kooperative Arbeitsmodelle erfolgreich umgesetzt werden können.