Gerald Maier |

Geschichtswissenschaft und Archive gehören eng zusammen. Ohne die reichhaltige schriftliche Überlieferung in Archiven ist eine auf historischen Quellen basierte Forschung nicht möglich. Daher sind Archive als fest etablierte Gedächtnisinstitutionen und Forschungsinfrastruktureinrichtungen unverzichtbare Akteure in der historisch arbeitenden und insbesondere der geschichtswissenschaftlichen Forschungslandschaft. Sie sind damit ein integrales Element der übergreifenden Forschungsinfrastruktur der Bundesrepublik.

Insofern steht es außer Frage, dass Archive auch den Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI) mitgestalten und ihre einschlägige Expertise und Kompetenzen in den Prozess einbringen.1 Dabei ist vor allem das sich zurzeit bildende Konsortium NFDI4Memory von Bedeutung.2 Hier vernetzen sich historisch arbeitende Geisteswissenschaften mit entsprechenden Infrastruktureinrichtungen wie Archiven, Bibliotheken, historischen Museen, historischen Fachdatenzentren und IT-Infrastruktureinrichtungen, um Angebote und Services für primäre und sekundäre Forschungsdaten zu entwickeln und beide Formen von Forschungsdaten miteinander zu verknüpfen. 

Archive als Anbieter von primären Forschungsdaten

In den Überlieferungen von Archiven findet sich ein umfangreiches Angebot an interdisziplinär relevanten sogenannten primären Forschungsdaten, das heißt analoges und genuin digitales Archivgut, Erschließungsinformationen und digitalisiertes Archivgut. Archive beraten und unterstützen Forschende bei der Recherche und Auswertung dieser Informationen. In zahlreichen Kooperationsprojekten agieren sie bereits als aktive Partner insbesondere der historischen Forschung, zum Beispiel im Rahmen von Digitalisierungs- und Forschungsprojekten. Mit Blick auf die konkrete Rolle der Archive in der NFDI ist zu betonen, dass Archive bereits seit Jahren über umfangreiche, rasant wachsende und meist digital frei zugängliche primäre Forschungsdatenbestände verfügen. Sie besitzen langjährige Erfahrungen in der Digitalisierung und haben einheitliche Standards für das Digitalisieren, für Medienformate und Metadaten entwickelt und etabliert. 

Erschließungsinformationen und digitalisiertes Archivgut werden der Forschung vielfach kostenfrei in archiveigenen Online-Informationssystemen zugänglich gemacht sowie in übergreifenden Portalen zur Verfügung gestellt. Angebote zu digitization on demand eröffnen ebenso wie Überlegungen zu Nutzungskonzepten für zugangsbeschränkte Unterlagen weitere, zielgerichtete Zugangsperspektiven. Neuerdings kommen originär digitale Objekte (born digitals) hinzu, die es zu übernehmen, dauerhaft zu sichern und ebenfalls in geeigneter Weise zugänglich zu machen gilt.

Handlungsfelder für Archive im Rahmen der NFDI

Die große Herausforderung im Rahmen der NFDI und konkret dem dafür am besten geeigneten Konsortium NFDI4Memory ist die Verbindung der primären Forschungsdaten aus Archiven mit den sekundären Forschungsdaten der historisch arbeitenden Geisteswissenschaften und insbesondere der geschichtswissenschaftlichen Disziplinen. Sekundäre Forschungsdaten schlagen sich bisher vor allem in Printpublikationen nieder, die aber zunehmend auch um Onlinepublikationen und Online-Informationssysteme erweitert werden. Printpublikationen nutzen als Vorstufen oft datenbankgestützte Informationssysteme, in denen verstärkt historische Personendaten und geografische Informationen vorhanden sind, mit denen zum Beispiel prosopografische Auswertungen vorgenommen werden.

Bereits im Dezember 2018 hat sich die Konferenz der Leitungen der Archivverwaltungen des Bundes und der Länder (KLA) als Organ der staatlichen Archivverwaltungen mit einem Positionspapier in den Aufbauprozess der NFDI eingeschaltet.3 Als Handlungsfelder werden darin die folgenden Bereiche benannt:

  • Übernahme und Langzeitarchivierung von Daten sowie Bereitstellung für die Nutzung
  • Standardisierung, Normdaten und Interoperabilität  
  • Open Access, Nachnutzbarkeit und Schnittstellen
  • Datenanalyse, -auswertung und -anreicherung
  • Recherchierbarkeit von Volltexten 

Weiterentwicklung des Archivportals-D zur zentralen Datenplattform für eine Verknüpfung von primären und sekundären Forschungsdaten

Für die operative Implementierung eines Großteils der aus den angeführten Handlungsfeldern entstehenden Anforderungen, die auch für die sekundären Forschungsdaten der Geschichtswissenschaft von Bedeutung sind, bieten die deutschen Archive mit dem Archivportal-D (www.archivportal-d.de) als Teil der von Bund und Ländern gemeinsam getragenen Deutschen Digitalen Bibliothek (DDB) ( www.deutsche-digitale-bibliothek.de) bereits eine geeignete Infrastruktur.4 Diese kann im Rahmen der NFDI weiterentwickelt werden.

Aktuell steht mit dem Archivportal-D ein zentraler Zugang für primäre archivische Forschungsdaten aus der gesamten Bundesrepublik zur Verfügung. Es enthält Erschließungsinformationen, digitalisiertes Archivgut sowie Informationen zu Archiven. Seit seiner Freischaltung 2014 wächst das Angebot rasch, sodass inzwischen ein archivspartenübergreifender deutschlandweiter Forschungsdatenpool bereitsteht. Aktuell finden sich hier bereits 22,2 Millionen Erschließungsdatensätze – davon 1,2 Millionen mit Digitalisaten – aus knapp 200 Archiven (Stand: September 2020) sowie Kontaktinformationen zu über 2.500 Archiveinrichtungen in Deutschland. Über die gemeinsame Datenhaltung mit der DDB ergibt sich eine spartenübergreifende Anschlussfähigkeit der im Archivportal vorhandenen Metadaten und Digitalisate.

Das Archivportal-D trägt zu einer deutlichen Standardisierung der Arbeit der gesamten Archivsparte bei. Deutlich wird dies an einem einheitlichen Datenlieferformat und der normdatenbasierten Portalfunktionalität, die eine regelrechte Sogwirkung für die Verwendung kontrollierter Vokabulare wie der Gemeinsamen Normdatei (GND) in der archivischen Erschließung entwickelt hat. Archivdaten werden damit in zunehmendem Maße interoperabel und anschlussfähig an sekundäre Forschungsdaten der Geschichtswissenschaften.

Wie aber gestalten sich die konkreten Ausbauperspektiven des Angebots? Hier sei zunächst auf das aktuell laufende DFG-Projekt zur Etablierung sachthematischer Zugänge im Archivportal-D am Beispiel der Weimarer Republik verwiesen.5 Qualifizierte themenbezogene Recherchemöglichkeiten zu Kulturgut in übergreifenden Portalen sind aus wissenschaftlicher Sicht seit Langem ein Desiderat. Im Projekt werden die technischen Grundlagen dafür geschaffen. Insbesondere wird ein Verknüpfungstool realisiert, das eine zentrale Referenzierung vorhandener Datenbestände mit kontrollierten sachthematischen Vokabularen bzw. Systematiken in effizienter Weise ermöglicht. Außerdem wird in Kooperation mit dem FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur ein Anwendungsprototyp zur (teil-)automatisierten Verschlagwortung von Archivbeständen entwickelt. Hierbei kommen maschinelle Lernverfahren sowie semantische Technologien zum Einsatz. Eine gezielte Weiterentwicklung des Archivportals-D und der assoziierten Dienste und Werkzeuge im Rahmen der NFDI könnte an Szenarien zur Datenoptimierung, Auswertung und Nachnutzung anknüpfen. Gerade Technologiefelder wie machine learning bzw. deep learning ermöglichen perspektivisch die automatisierte Generierung zusätzlicher Erschließungsinformationen. Damit kann trotz begrenzter personeller Ressourcen in den Kultureinrichtungen eine erheblich höhere Datenqualität erreicht werden. Über entsprechende Verfahren des Text-Minings (Data-Minings) lassen sich Entitäten und sachthematische Referenzen in Textkorpora identifizieren und extrahieren, damit zusätzliche Recherchemöglichkeiten unterstützt und die semantische Vernetzung der Inhalte vorangetrieben werden kann. Auch Bildmuster- oder Objekterkennung kann eingesetzt werden, um digitalisierte Archivalien automatisiert zu klassifizieren.

Weiterentwicklungsbedarf im Hinblick auf sekundäre Forschungsdaten der Geschichtswissenschaft besteht außer für das Instrumentarium zur Metadatenoptimierung auch mit Blick auf ihre Nachnutzbarkeit unabhängig vom primären Entstehungszweck. Eine zentrale Rolle kommt hier der Datenbereitstellung über standardisierte und offene Schnittstellen (APIs) zu. Die Bereitstellung archivalischer Daten über Schnittstellen ermöglicht deren Integration, Auswertung und Anreicherung in anderen Forschungsumgebungen und die Verwendung mit anderen Forschungswerkzeugen, die zum Beispiel auf Transkriptionen, Annotationen oder Georeferenzierung der digital vorliegenden historischen Quellen zielen. 

»Langzeitarchivierung«, Bereitstellung und Nachnutzung von Forschungsdaten 

Für den Aufbau der NFDI in hohem Maße relevant ist ferner die in den Archiven vorhandene Expertise auf dem Feld der »Langzeitarchivierung« genuin digitaler wie auch digitalisierter Objekte.6 Neben umfassender theoretischer Fundierung sind in Archiven langjährige praktische Erfahrungen vorhanden und es sind substanzielle Erfolge auf diesem komplexen Handlungsfeld zu verzeichnen. Archive können ihr breites Wissen und ihre konkreten Erfahrungen in Bezug auf die Wahrung der Integrität und Authentizität digitaler Daten in die NFDI einbringen. Die Archivierung erfolgt auf Grundlage etablierter internationaler Standards, jedoch mit unterschiedlichen Herangehensweisen und verschiedenen technischen Lösungen. Abhängig von der jeweiligen Lösung sowie dem institutionellen Status von Einrichtungen oder Forscherinnen und Forschern ergeben sich somit unterschiedliche Anschlussperspektiven an bestehende Infrastrukturen der digitalen Archivierung. Letztere sind entweder bereits in der Lage, die Anforderungen aus der Langzeitsicherung digitaler Forschungsdaten zu erfüllen oder zumindest so weit entwicklungsfähig, dass entsprechende Strukturen im Rahmen der NFDI nicht von Grund auf etabliert werden müssen. Unter sachgerechter Berücksichtigung von Erhaltungsstrategien zur Migration und Emulation gilt das auch für die Archivierung komplexer Forschungsdatenerzeugnisse wie etwa Datenbanken oder Onlineanwendungen.

Jenseits der Datenarchivierung müssen in diesem Zusammenhang auch die Erwartungen der Nutzerinnen und Nutzer bezüglich der dauerhaften Auswertbarkeit von Daten berücksichtigt werden. Diese sollen einerseits in ihrer ursprünglichen technischen Umgebung zugänglich und lesbar bleiben, andererseits von dort aber auch reibungslos in diverse neue Tools zur Auswertung, Datenaufbereitung und -interpretation übergehen können.

Fazit und Ausblick 

Nach heutigem Stand verfügen Archive über einen der inhaltlich breitesten digitalen Forschungsdatenpools und zugleich über das Know-how, diesen dauerhaft zu erhalten und zugänglich zu machen. In dem Großvorhaben zum Aufbau der NFDI bietet sich Archiven die Chance, gemeinsam mit anderen Institutionen sowie den Nutzerinnen und Nutzern aus der historischen Forschung und Lehre Angebote und Services für deren Bedürfnisse auszubauen und weiter zu verbessern. Archive wollen aber auch Teil der NFDI werden, um ihrem Selbstverständnis als Forschungsinfrastruktureinrichtungen weiterhin gerecht werden zu können. Dies geschieht in der Überzeugung, dass sie auf Grundlage ihres Forschungsdatenangebots, vorhandener, ausbaufähiger Services und Kompetenzen die Etablierung der NFDI an zentraler Stelle unterstützen und bereichern können. Ein Teil der archivischen Angebote, die methodisch die Langzeitsicherung, Zugänglichmachung und Nachnutzung von Daten betreffen, kann auch für die konsortiumsübergreifende Strukturbildung von Interesse sein.

Sollten die in Archiven vorhandenen Forschungsdaten keine Berücksichtigung im Rahmen der NFDI finden, besteht die Gefahr, dass die historisch arbeitenden Geisteswissenschaften abgehängt werden. Hervorragende Anknüpfungspunkte als Dreh- und Angelpunkt der archivischen NFDI-Beteiligung bietet das Archivportal-D, das als gemeinschaftliches Vorhaben der gesamten Archivsparte bereits fest etabliert und zugleich organisatorisch-technisch so aufgestellt ist, dass sein Angebot bedarfsgerecht ausgebaut und um benötigte Services erweitert werden kann. 

Fußnoten

1 Siehe dazu Gerald Maier, Daniel Fähle, Andreas Neuburger, Bereitstellung, Aufbereitung, Langzeitsicherung. Funktionen der Archive in der Forschungsdateninfrastruktur, in: Archivar 73, 2020, H. 1, S. 13 – 18.

2 Informationen zum Aufbau sowie zur Zielsetzung und Arbeitsweise von NFDI4Memory finden Sie unter https://www.4memory.de sowie in dem Beitrag von Johannes Paulmann, John Carter Wood, Fabian Cremer, LINKAGE – Digitale Gegenwart und Zukunft historischer Forschung. Die Ziele der Konsortialinitiative 4Memory.

3 Archive als Informationsdienstleister und Infrastruktureinrichtungen. Positionspapier der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder (KLA) vom Dezember 2018 zum Aufbau einer Forschungsdateninfrastruktur für die historisch arbeitenden Geisteswissenschaften im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI), https://www.bundesarchiv.de/DE/Content/Downloads/KLA/positionspapier-forschungsdateninfrastruktur.pdf?__blob=publicationFile, zuletzt abgerufen am 26.3.2020.

4 Siehe dazu Gerald Maier, Christina Wolf, Das Archivportal-D und die Deutsche Digitale Bibliothek. Neue übergreifende Recherchemöglichkeiten nach Quellen für die historische Forschung, in: Rainer Hering, Robert Kretzschmar (Hg.), Recherche und Weiterverarbeitung. Digitale Angebote der Archive für die historische Forschung im Netz. Beiträge einer Sektion auf dem 51. Deutschen Historikertag 2016 in Hamburg, Stuttgart 2017, S. 10 – 35, und die übrigen Beiträge in diesem Band.

5 https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/ archivportal-d-weimar/archivportal-d-weimar_node.html und https://www.landesarchiv-bw.de/web/63525.

6 Archivierung per se im Sinne der Archivwissenschaft ist auf Dauer angelegt, daher ist der Begriff »Langzeitarchivierung« ein Pleonasmus. 

Bildnachweis

Wikimedia Commons/Marcus Gossler

Gerald Maier

Gerald Maier ist seit 2018 Präsident des Landesarchivs Baden-Württemberg. Nach dem Studium der Geschichte, der Evangelischen Theologie, Kunstgeschichte und Historischen Geografie in Tübingen und Bonn sowie Promotion in neuerer Geschichte an der Universität Tübingen absolvierte er das Archivreferendariat beim Land Baden-Württemberg. Danach übte er verschiedene Tätigkeiten an der Landesarchivdirektion Baden-Württemberg und in der Verwaltungsabteilung des Landesarchivs aus, zuletzt bis Anfang 2018 als Leiter der Abteilung »Zentrale Dienste« und Stellvertreter des Präsidenten. Von 2002 bis 2019 war er Bundesratsbeauftragter für die Digitalisierung und Onlinezugänglichkeit kulturellen Materials und dessen digitale Bewahrung. Er ist Vorstandsmitglied des Kompetenznetzwerks »Deutsche Digitale Bibliothek« und seit 2013 Honorarprofessor an der Staatlichen Akademie der Bildenden Künste Stuttgart für die Erhaltung digitaler Information und Digitalisierung von Kulturgut.