Ziel von VIAF ist es, weltweit verschiedene nationale und internationale Normdateiquellen zusammenzuführen und deren Einträge eindeutig zu bündeln. VIAF erleichtert so die Identifikation und Verknüpfung von Personen, Körperschaften, Werken und weiteren Entitäten im globalen Informationsmanagement. Für Institutionen, die beispielsweise Bibliotheksmanagement, Normenmanagement oder Datenanreicherung betreiben, stellt VIAF ein zentrales Instrument zur Harmonisierung und Optimierung von Normdaten dar.
Was ist VIAF?
VIAF wurde 2003 ins Leben gerufen und ist ein Gemeinschaftsprojekt, das heute von der OCLC (Online Computer Library Center), der Deutschen Nationalbibliothek, der Library of Congress, der Bibliothèque nationale de France und weiteren internationalen Partnerinstitutionen getragen wird. Technisch wird das Projekt von der OCLC betreut.
VIAF führt existierende Normdateneinträge aus mehr als 50 Partnerdatenbanken - darunter die deutsche Gemeinsame Normdatei (GND), die französische BN-Opale Plus, die amerikanische Library of Congress Name Authority File und weitere - in sogenannten „Clustern“ zusammen.
Das Prinzip: Wenn verschiedene Normdateiquellen zu einer Person, einer Organisation oder einem Werk unterschiedliche Schreibweisen, Varianten oder Informationen bereithalten, bündelt VIAF diese zu einem einzigen, eindeutig referenzierbaren Eintrag - dem VIAF-Cluster. Dabei werden die Originaldaten nicht verändert, sondern über Verlinkungen und Verweise aggregiert. Dieses Matching erfolgt automatisiert, Qualitätssicherung und manuelle Überprüfungen stellen sicher, dass fehlerhafte Zusammenführungen möglichst vermieden werden.
VIAF verwaltet schwerpunktmäßig Namen von Personen und Körperschaften. Darüber hinaus werden zunehmend auch Werktitel, Namen von Veranstaltungen, geografische Namen und ausgewählte weitere Entitäten berücksichtigt. Das Angebot an Entitäten ist jedoch im Vergleich zu den beiden Hauptkategorien noch eingeschränkt und befindet sich in fortlaufender Entwicklung.
Historischer Kontext und Entwicklung
VIAF startete als Pilotprojekt führender Nationalbibliotheken, um den Abgleich zwischen großen Normdateien zu erleichtern. Seitdem ist die Anzahl der Partnerinstitutionen und der beteiligten Datenquellen stetig gestiegen. Über die Jahrzehnte hat sich das System zu einem zentralen Knoten im internationalen Informationsaustausch entwickelt. Besonderer Wert liegt auf kontinuierlichen Updates: Die Synchronisation mit den Quellnormdateien erfolgt regelmäßig, sodass Änderungen und Korrekturen aus den Ursprungssystemen auch im VIAF sichtbar werden.
Bedeutung für Informationsmanagement und Bibliotheksmanagement
VIAF schafft erhebliche Vorteile für das moderne Management bibliografischer und normierter Daten:
- Erleichterung des internationalen Datenaustauschs durch einheitliche, zentral verknüpfte Identifikatoren für Autorinnen, Autoren, Organisationen und weitere Entitäten.
- Systematische Vermeidung von Dubletten und Fehlzuordnungen, indem unterschiedliche Namensformen und Varianten eindeutig zusammengeführt werden.
- Beschleunigte Migration und Harmonisierung von Datenbeständen, insbesondere bei Systemumstellungen, Digitalisierungsvorhaben oder dem Aufbau kooperationsübergreifender Infrastruktur.
- Verbesserung der Recherche und Ergebnispräzision, da verschiedene Sprach- und Schreibvarianten in einem Cluster vereint und durchsuchbar sind.
- Mehrsprachigkeit wird aktiv unterstützt: VIAF-Cluster enthalten Varianten und Kontextinformationen aus den jeweiligen nationalen Quellen.
- Stärkung der Datenqualität, Konsistenz und Nachvollziehbarkeit im unternehmensweiten oder bibliothekarischen Datenbestand.
Diese Vorteile sind nicht nur für Bibliotheken relevant, sondern auch für Einrichtungen im Bereich Forschungsdatenmanagement, Digital Humanities sowie Anwendungen bei Verlagen und anderen Institutionen mit Bedarf an Normdatenintegration.
Technische Integration von VIAF
Moderne Informationsmanagement-Systeme wie die Softwarelösungen von GLOMAS integrieren VIAF zur Verbesserung der Datenqualität und für den automatisierten Abgleich von Normdateneinträgen. Die Anbindung kann über verschiedene Schnittstellen erfolgen:
- SRU/SRW (Search/Retrieve via URL/Web Service): Ermöglicht standardisierte maschinelle Suchanfragen und Datenabruf.
- RDF (Resource Description Framework) / Linked Open Data: VIAF bietet Datensätze als vernetzte Linked Data nach semantischen Standards, sodass sie für Anwendungen im Semantic Web und in der offenen Datenvernetzung verwendbar sind.
- OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting): Exporte und Harvesting großer Normdatenmengen für Import in lokale Systeme oder Forschungsumgebungen.
- APIs und Exportfunktionen: Für den gezielten Import und die Synchronisation mit lokalen Katalog-, Normdaten- oder Managementsystemen.
Diese Schnittstellen ermöglichen individuelle Anpassungen, automatisierte Workflows und die umfassende Integration in bestehende Systemlandschaften.
Das Clustering-Prinzip und seine Herausforderungen
Das Herzstück von VIAF ist das Clustering: Unterschiedliche Normdateneinträge aus den beteiligten Quellen werden durch Matching-Verfahren identifiziert, abgeglichen und zu einem VIAF-Cluster gebündelt. Ein solcher Cluster enthält:
- Die verschiedenen Namens- oder Identitätsformen
- Referenzen auf die jeweils originale Normdatei mit ihren individuellen Identifikatoren
- Zusätzliche Kontextinformationen wie Lebensdaten, Sprachvarianten oder weiterführende Links
Fehler können bei der Zusammenführung entstehen, z. B. durch Homonyme (Namensgleichheiten bei verschiedenen Personen), Dateninkonsistenzen oder mangelnde Abgrenzung zwischen ähnlichen Einträgen. Partnerinstitutionen und externe Nutzer können Korrekturen, Trennungen oder Zusammenführungen anregen, sodass die VIAF-Qualität sukzessive verbessert wird.
Praktische Anwendungsbeispiele im Arbeitsalltag
Im Bibliotheksmanagement und angrenzenden Bereichen unterstützen VIAF-basierte Systeme folgende Aufgaben:
- Migration und Konsolidierung von Personendaten bei Systemwechseln: Dubletten- und Fehlererkennung sowie automatische Anpassung unterschiedlicher Namensformen beim Import in neue Systeme.
- Effiziente Bestandsbereinigung und Katalogpflege: Verknüpfung von bereits vorhandenen Daten mit internationalen Normdateien reduziert Pflegeaufwand und steigert die Datenqualität.
- Datenanreicherung: Integration zusätzlicher Informationen aus VIAF in lokale Datensätze für gezielte Recherche und Verlinkung.
- Mehrsprachige Katalogisierung: Übernahme und Anzeige von Namen und Kontextinformationen in verschiedenen Sprachvarianten.
- Forschungsdatenmanagement oder Digital Humanities: Nutzung von VIAF-URIs für die eindeutige Referenzierung von Autorinnen, Autoren oder Werken über System- und Ländergrenzen hinweg.
Schnittstellen zu anderen Identifikationssystemen
VIAF beschränkt sich nicht auf nationale Normdateien. Es gibt zahlreiche Querverweise zu internationalen Identifikatoren wie ISNI (International Standard Name Identifier), ORCID (Open Researcher and Contributor ID), Wikidata oder WorldCat Identities. Diese Vernetzung bietet Möglichkeiten, Datensätze systemübergreifend und medienunabhängig eindeutig zu referenzieren.
Grenzen und Missverständnisse
- VIAF ist keine eigenständige Normdatei oder Datenbank: VIAF erstellt keine eigenen Normdaten, sondern aggregiert und verlinkt bestehende Einträge aus Partnerdateien.
- Nicht alle Länder oder Institutionen sind vertreten: Datenlücken entstehen, wenn relevante Quellen nicht als Partner angebunden sind.
- Abdeckung der Entitätstypen: Während Personen und Körperschaften umfassend gepflegt werden, befinden sich Werktitel, Veranstaltungen und geografische Namen weiter im Aufbau, und die Abdeckung ist derzeit eingeschränkt.
- VIAF liefert keine Buchinhalte, Abstracts oder Volltexte, sondern ausschließlich Normdaten und deren Verknüpfungen.
- Challenges bei Homonymen oder Varianten: Die automatische Zusammenführung verschiedener Datensätze kann zu Fehlern führen, wenn etwa zwei Personen den gleichen Namen tragen.
- Laufende Qualitätskontrolle: Fehler, Dubletten oder fehlerhafte Zusammenführungen können von Partnerinstitutionen und der Community gemeldet und korrigiert werden.
Lizenzierung und Nutzungshinweise
Alle von VIAF veröffentlichten Daten stehen unter der ODC-By 1.0 Lizenz. Diese Open-Data-Lizenz erlaubt die freie Nutzung, Weitergabe und Nachnutzung der Daten, sofern die Quelle angegeben wird. VIAF unterstützt die Integration in eigene Katalogsysteme, Onlinedienste oder Anwendungen über standardisierte URIs und Linked Data-Prinzipien.
Häufige Fragen zu VIAF
Was unterscheidet VIAF von anderen Normdatenquellen?
VIAF ist kein Ersatz für nationale Normdateiquellen wie die GND oder die Library of Congress Name Authority File, sondern ein Dienst, der diese miteinander aggregiert und verknüpft. Das Besondere ist, dass VIAF verschiedene Schreibweisen und Varianten aus unterschiedlichen Ländern automatisiert zu einem Cluster zusammenführt, inklusive Verweisen auf die Ursprungsquellen. So wird globale Interoperabilität bei Normdaten erreicht.
Wie kann mein Unternehmen oder meine Bibliothek VIAF am effektivsten nutzen?
Am effizientesten nutzen Sie VIAF in Verbindung mit professionellen Bibliotheks- oder Informationsmanagement-Systemen von GLOMAS, die eine direkte Anbindung oder Datenintegration bieten. Aber auch manuelle Recherchen über das VIAF-Webportal sowie der Datenabruf via Schnittstellen (z. B. SRU, RDF, OAI-PMH) stehen zur Verfügung. So profitieren Sie von aktuellen und fehlerbereinigten Normdaten im gesamten Workflow.
Welche konkreten Vorteile bringt VIAF in der Praxis?
Durch die Einbindung von VIAF sparen Sie erhebliche Zeit beim Abgleich von Namensvarianten, vermeiden Fehlerquellen bei Datenmigrationen und verbessern die Datenqualität im Unternehmen. Die internationale Vernetzung ermöglicht kooperationsübergreifende Nutzung, erleichtert die Pflege und macht lokale Bestände anschlussfähig für globale Projekte - beispielsweise bei Digitalisierung, Parlamentsdokumentation oder im Normenmanagement.
Sind die in VIAF enthaltenen Daten frei verfügbar und wie dürfen sie genutzt werden?
Ja, alle VIAF-Daten stehen unter der Open Data Commons Attribution License (ODC-By 1.0) und sind für die freie Nutzung, Weiterverarbeitung und Integration bestimmt, sofern die Quelle korrekt genannt wird. Die Daten sind via Webportal, APIs und verschiedene Exportformate abrufbar und können in eigene Softwareprodukte sowie Linked-Data-Anwendungen integriert werden.
Welche Datentypen werden in VIAF verwaltet?
VIAF bündelt Namen von Personen, Körperschaften, Werken, Veranstaltungen und in zunehmendem Umfang weitere Entitäten wie geografische Namen. Für jeden Cluster stellt VIAF Referenzen zu den Originaleinträgen der beteiligten Normdateien sowie Links zu weiteren Identifikator-Systemen bereit.
Wie aktuell sind die VIAF-Daten und wie erfolgt die Qualitätskontrolle?
Die Datenbestände von VIAF werden regelmäßig mit den Quellnormdateien synchronisiert, sodass Änderungen übertragen werden. Fehler und Korrekturen können von den Partnerinstitutionen und - mitunter - von externen Nutzern vorgeschlagen werden. Die laufende Qualitätssicherung erfolgt durch die beteiligten Bibliotheken und die OCLC.
Gibt es einen Bezug von VIAF zu anderen Identifikator-Systemen wie ISNI, ORCID oder Wikidata?
Ja, VIAF bildet Brücken zu zahlreichen globalen Identifikator-Systemen. Viele VIAF-Datensätze enthalten direkte Verweise (URIs) zu ISNI, ORCID, Wikidata und weiteren Registern. Damit wird die eindeutige Identifikation über verschiedene Plattformen und Länder hinweg deutlich erleichtert und ausbaufähig gemacht.
Wie geht VIAF mit Mehrsprachigkeit und Namensvarianten um?
VIAF-Cluster enthalten Namensformen und Kontextinformationen in allen Sprachen der beteiligten Normdateiquellen. Dadurch können beispielsweise Autoren, Werke oder Körperschaften sowohl in ihrer Originalsprache als auch in Übersetzungen oder Transliterationen eindeutig recherchiert und angezeigt werden.
Kann mein Unternehmen Korrekturen oder Ergänzungen zu VIAF-Daten vorschlagen?
Korrekturvorschläge erfolgen in der Regel über die jeweiligen nationalen Partnerdatenbanken, deren Einträge in VIAF zusammengeführt werden. Dazu können Sie in der Regel Kontakt mit Ihrer zuständigen Nationalbibliothek oder Normdateninstitution aufnehmen. Größere Partnerinstitutionen tauschen Korrekturen regelmäßig mit VIAF aus, um die Datenqualität fortlaufend zu verbessern.
Für welche Anwendungen außerhalb von Bibliotheken ist VIAF relevant?
VIAF wird auch in Bereichen wie Forschungsdatenmanagement, Digital Humanities, Verlagswesen, Archivmanagement und überall dort eingesetzt, wo präzise Personen- oder Werkidentifikation benötigt wird. Durch die Nutzung standardisierter Identifikatoren und Linked Open Data bietet VIAF integrative Vorteile für verschiedenste Branchen.