Sie wurden 2016 im Journal Scientific Data von Mark D. Wilkinson und einem internationalen Team publiziert und adressieren zentrale Herausforderungen des wissenschaftlichen Informationsmanagements.
Das Ziel der FAIR-Prinzipien ist die Optimierung von Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit von Daten und Metadaten über Organisations- und Systemgrenzen hinweg.
FAIR ist nicht an ein bestimmtes Softwaresystem oder einen Anbieter gebunden und schreibt keine konkreten technischen Lösungen vor, sondern definiert allgemeine, flexible Prinzipien. Sie ermöglichen eine vergleichbare Strukturierung von Datenbeständen in Unternehmen, wissenschaftlichen Einrichtungen, Behörden, Bibliotheken und Archiven - unabhängig davon, ob die Daten offen oder nur beschränkt zugänglich sind.
Im Kontext von Open Science ist zu beachten, dass Offenheit („Open“) und Nachnutzbarkeit („Reusable“ im FAIR-Sinn) unterschiedliche Ziele verfolgen: Während Open Data auf uneingeschränkten Zugang abzielt, fordert FAIR lediglich die klare Beschreibung der Zugriffs- und Nutzungsbedingungen, ungeachtet möglicher Zugangsbeschränkungen.
Entwicklung und Hintergrund der FAIR-Prinzipien
Die FAIR-Prinzipien wurden 2016 unter Leitung von Mark D. Wilkinson gemeinsam mit internationalen Fachleuten entwickelt. Sie greifen zentrale Anliegen der Open-Science-Bewegung auf und werden laufend weiterentwickelt - etwa durch Projekte wie FAIRplus, FAIRsFAIR, GO FAIR, CODATA oder nationale Dateninfrastrukturen.
Initiativen wie ELIXIR (Life Sciences), EOSC (European Open Science Cloud), die US-amerikanischen National Institutes of Health (NIH), aber auch Standardisierungsorganisationen wie die Research Data Alliance (RDA) und das World Wide Web Consortium (W3C) gestalten Standards, Empfehlungen und Community-Rahmenwerke mit, um die Umsetzung von FAIR international zu fördern und zu stärken. Zertifikate wie CoreTrustSeal bieten Orientierung für Repositorien, die FAIR-konforme Prozesse dokumentieren wollen.
Die vier FAIR-Prinzipien im Überblick
Die FAIR-Prinzipien bestehen aus vier zentralen Säulen, denen jeweils mehrere Subprinzipien zugeordnet sind. Sie beziehen sich gleichermaßen auf Daten und deren Metadaten und ermöglichen sowohl maschinelle als auch menschliche Verarbeitung.
- Findable (Auffindbar):
- Daten und Metadaten sollten durch weltweit eindeutige und persistent nutzbare Identifikatoren auffindbar sein (z. B. DOIs, Handles, URNs).
- Sie müssen in durchsuchbaren Datenkatalogen oder Repositorien registriert werden (F1).
- Zu jedem Datensatz müssen zugehörige, klar strukturierte Metadaten existieren, damit sowohl Datensatz als auch Kontext auffindbar bleiben (F2, F3).
- Metadaten sollten auch dann auffindbar bleiben, wenn die Daten aus rechtlichen oder anderen Gründen nicht öffentlich zugänglich sind (F4).
- Accessible (Zugänglich):
- Daten und Metadaten sind mit standardisierten Kommunikationsprotokollen abrufbar (A1).
- Diese Protokolle sollten offen, frei und universell umsetzbar sein (A1.1).
- Zugriffsrechte und Authentifizierungsmechanismen sind, falls erforderlich, klar dokumentiert (A1.2).
- Die Metadaten sollen im Sinne dauerhafter Referenz auch dann zugänglich und auffindbar bleiben, wenn eigentliche Daten nicht mehr verfügbar sind (A2).
- Interoperable (Interoperabel):
- Daten und Metadaten sind maschinenlesbar, in nicht-proprietären, standardisierten Formaten verfügbar und mit kontrollierten Vokabularen oder Ontologien beschrieben (I1, I2).
- Die Verwendung von Referenzen oder Verknüpfungen zu anderen, ebenfalls FAIR-konformen Daten (z. B. über Linked Data-Prinzipien) verbessert die Maschinenauswertbarkeit und Integration (I3).
- Reusable (Wiederverwendbar):
- Umfangreiche, präzise und nachvollziehbare Angaben zu Datenherkunft, Erstellungsprozess, Rahmenbedingungen und gegebenenfalls zu Einschränkungen der Nachnutzung sind obligatorisch (R1, R1.2).
- Lizenzen zur Nachnutzung müssen eindeutig, transparent und maschinenlesbar vorliegen, dabei ist keine spezifische „FAIR-Lizenz“ erforderlich (R1.1).
- Die Einhaltung fachspezifischer Standards und Richtlinien stellt sicher, dass der Kontext auch über verschiedene Communities hinweg erhalten bleibt (R1.3).
Ein wesentlicher Unterschied zu klassischen Open-Data-Modellen ist: FAIR legt fest, dass die Art und Weise der Zugänglichmachung und Nutzung transparent beschrieben werden muss, unabhängig davon, ob Daten offen oder geschlossen sind. Ziel ist es, die Möglichkeiten zur maschinellen Verarbeitung - etwa für KI-Anwendungen - ebenso wie zur menschlichen Nachnutzung zu maximieren.
Subprinzipien der FAIR-Prinzipien
Die FAIR-Prinzipien umfassen insgesamt 15 Subprinzipien (F1-F4, A1-A2, I1-I3, R1-R1.3). Eine Übersicht finden Sie in der Originalpublikation von Wilkinson et al. (2016).
Abgrenzung: FAIR-Prinzipien, technische Standards und Open Data
FAIR ist kein technologiegebundener Standard und schreibt keine bestimmten Formate oder Systeme vor. Die Prinzipien dienen als Zielkriterien und werden international durch Empfehlungen und Good Practices konkretisiert.
Die Umsetzung kann z. B. mithilfe von Repositorien, Metadatenkatalogen, Forschungsinformationssystemen, Parlamentsdokumentationssystemen oder Bibliotheksmanagement-Software erfolgen.
Ein wichtiger Unterschied zu Open Data ist die Zielsetzung: Open Data bedeutet, dass Daten grundsätzlich frei verfügbar sind und in aller Regel unter Lizenzbedingungen mit wenigen Einschränkungen (wie Namensnennung) genutzt werden dürfen.
FAIR hingegen verlangt nicht, dass Daten zwangsläufig frei zugänglich sein müssen. Vielmehr werden die Bedingungen für Auffindbarkeit, Zugang und Wiederverwendbarkeit für Mensch und Maschine klar beschrieben und dokumentiert.
Ein FAIR-konformer Datensatz kann also auch Zugangsbeschränkungen oder Nutzungsauflagen (z. B. aus Datenschutz-, Patent- oder Urheberrechtsgründen) unterliegen. Umgekehrt ist nicht jede Open-Data-Publikation automatisch FAIR, wenn etwa strukturierte Metadaten oder maschinenlesbare Formate fehlen.
Die FAIR-Prinzipien finden zunehmend auch jenseits der Wissenschaft und im Kontext weiterer digitaler Ressourcen wie Software und Workflows Anwendung.
Praktische Umsetzung der FAIR-Prinzipien mit Softwarelösungen
Unternehmen, Forschungseinrichtungen, Behörden oder Bibliotheken können die FAIR-Prinzipien durch passende Informationsmanagement-Systeme unterstützen. Software für Bibliotheksmanagement, Forschungsdokumentation, Parlamentsdokumentation und Normenmanagement wie die Produkte von GLOMAS bieten dazu vielfältige Funktionen.
Zu den wichtigsten unterstützenden Funktionalitäten zählen:
- Vergabe und Verwaltung persistenter Identifikatoren: Verwaltung von DOIs, Handles oder URNs für langfristige Referenzierbarkeit.
- Einhaltung und Pflege von Metadatenstandards: Einsatz internationaler Standards wie Dublin Core, DataCite, schema.org; strukturierte, maschinenlesbare Metadaten.
- Speicherung in offenen, maschinenlesbaren Formaten: Unterstützung von Formaten wie XML, RDF, CSV oder JSON zur Förderung der Interoperabilität; insbesondere maschinenlesbare Wissensrepräsentationen wie Linked Data sind für KI-Anwendungen essenziell.
- Klare Dokumentation von Rechten, Herkunft und Kontext: Verwaltung von Lizenzangaben und umfassender Provenienz, die maschinenlesbar beschrieben werden, ohne dass es spezifische (FAIR-)Lizenzen gibt.
- Bereitstellung offener, standardisierter Schnittstellen: Implementierung von Protokollen wie OAI-PMH für den Datenaustausch zwischen Plattformen; Nutzung gängiger APIs zur Integration in bestehende IT-Infrastrukturen.
Praktische Schritte umfassen die Entwicklung und Anwendung von Datenmanagementplänen, um FAIR-Prinzipien bereits bei der Konzeption von Projekten oder Prozessen mitzudenken.
Die Herausforderungen liegen oft in der kontinuierlichen Metadatenpflege, der Auswahl und Implementierung kompatibler Standards, der Berücksichtigung fachspezifischer Besonderheiten (zum Beispiel personenbezogene Daten oder disziplinspezifische Vokabulare) und der Schulung von Personal.
Das FAIR-Ökosystem: Rollen und Anwendungsbereiche
Eine erfolgreiche Umsetzung der FAIR-Prinzipien erfordert die Zusammenarbeit verschiedener Akteure:
- Datenproduzenten: z. B. Forschende, Unternehmen oder Projektteams, die Daten generieren und strukturieren.
- Datenkonsumenten: Nutzer, die Daten abrufen, analysieren und weiterverarbeiten.
- Informationsmanager und Datenkuratoren: Verantwortliche für Metadatenmanagement und Datenqualitätskontrolle.
- System- und Plattformanbieter: Hersteller von Softwarelösungen.
- Forschungsförderorganisationen: Gestaltung und Kontrolle von Anforderungen, etwa durch die Integration von FAIR-Prinzipien in Förderbedingungen oder Richtlinien.
- Standardisierungsorganisationen und Fachcommunities: Entwicklung und Pflege offener Standards, Vokabulare, Referenzmodelle und Zertifizierungen.
- Infrastruktur-Betreiber: Repositorien, Datenportale, nationale und internationale Forschungsdatenzentren.
Einbindung in internationale Initiativen wie GO FAIR, EOSC, CODATA oder ELIXIR, aber auch Weiterentwicklungen wie die CARE-Prinzipien für indigene Daten oder der Einsatz von National Data Services, stärken das FAIR-Ökosystem. Best-Practice-Beispiele, Schulungsmaterialien und Zertifikate sind wertvolle Ressourcen.
Vorteile und Nutzen der FAIR-Prinzipien
Die konsequente Anwendung der FAIR-Prinzipien bietet Organisationen vielfältigen Mehrwert:
- Verbesserte Auffindbarkeit: Persistente Identifikatoren und gut strukturierte Metadaten erleichtern die gezielte Suche nach relevanten Daten.
- Effiziente Zusammenarbeit: Austausch und Integration von Daten über Abteilungs-, Instituts- oder Systemgrenzen hinweg werden unterstützt.
- Langfristige Nachnutzbarkeit: Klare Dokumentation zu Entstehung, Kontext, Provenienz und Rechte macht Daten über die ursprüngliche Nutzung hinaus rezipierbar.
- Reduzierte Redundanz: Standardisierte Ablagen und Schnittstellen helfen, Mehrfachspeicherungen und Widersprüche zu vermeiden.
- Erhöhte Transparenz und Nachvollziehbarkeit: Vollständige Nachweisketten fördern das Vertrauen in Daten und ermöglichen Audits und Reviews.
- Förderung von Innovation: FAIR-konforme, maschinenlesbare Daten und Metadaten bilden die Grundlage für neue Analysen, KI-Anwendungen und Forschungsfragen.
- Rechtssicherheit: Eindeutige Lizenzen und nachvollziehbare Nutzungsbedingungen reduzieren Unsicherheiten beim Datenmanagement.
- Disziplinspezifische Anschlussfähigkeit: Einhaltung einschlägiger Standards ermöglicht den sicheren Transfer zwischen verschiedenen Fachbereichen.
Häufige Fragen zu FAIR-Prinzipien
Was ist der Unterschied zwischen FAIR und Open Data?
FAIR beschreibt Prinzipien für Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit - dabei ist nicht vorgeschrieben, dass Daten frei zugänglich sein müssen. Open Data steht für Daten mit offenem Zugang, meist unter wenigen Bedingungen. Daten können FAIR sein, ohne Open Data zu sein, und umgekehrt. Offenheit und FAIRness schließen sich nicht aus, adressieren aber unterschiedliche Anforderungen.
Gelten die FAIR-Prinzipien nur für wissenschaftliche Projekte?
Ursprünglich wurden die FAIR-Prinzipien im Forschungsumfeld entwickelt, sie bieten heute aber in vielen Bereichen Mehrwert - von Unternehmen über Behörden bis hin zu Bibliotheken, Archiven und der Verwaltung. Sie sind überall dort nützlich, wo Daten strukturiert vorgehalten, geteilt oder weiterverwertet werden.
Wie kann ich feststellen, ob meine Daten FAIR-konform sind?
Mit Assessment-Tools wie FAIR Evaluator, F-UJI oder FAIRassist kann die FAIRness von Daten und Metadaten überprüft werden. Zertifikate wie CoreTrustSeal geben Repositorien zusätzliche Orientierung. Datenmanagementpläne, Leitfäden, Checklisten und Beratung helfen bei Anpassung und Optimierung bestehender Prozesse.
Welche Rolle spielen Metadaten bei FAIR?
Metadaten sind der Grundstein aller FAIR-Prinzipien. Sie beschreiben Inhalt, Entstehung, Kontext und Rechte eines Datensatzes, sichern die langfristige Auffindbarkeit, ermöglichen die maschinelle Verarbeitung und machen die Nachnutzung nachvollziehbar.
Welche Systeme unterstützen bei der Umsetzung von FAIR-Prinzipien?
Unterstützung bieten unter anderem Forschungsinformationssysteme, Metadatenkataloge, Datenrepositorien, Bibliotheksmanagement-Software, Parlamentsdokumentationssysteme oder spezialisierte Lösungen zur Normenverwaltung. Entscheidend ist die Fähigkeit der Systeme, Standards zu implementieren, Schnittstellen anzubieten und Metadaten wie Daten gemeinsam zu verwalten.
Worin bestehen die größten Herausforderungen bei der FAIR-Implementierung?
Typische Herausforderungen sind der kontinuierliche Pflegeaufwand für Metadaten, die Einigung auf Formate und Vokabulare insbesondere in fachspezifischen Communities, technische Integration bestehender Systeme sowie die Sensibilisierung und Schulung von Mitarbeitenden. Zusätzlich sind Datenschutz, geistiges Eigentum und vertrauliche Informationen zu beachten.
Ist FAIR nur für Daten oder auch für Software relevant?
FAIR wird zunehmend auch auf Software, wissenschaftliche Workflows, Protokolle und weitere digitale Ressourcen übertragen. Auch hier stehen Auffindbarkeit, Zugang, Interoperabilität und Wiederverwendbarkeit im Fokus, um den wissenschaftlichen Austausch zu stärken.
Wie können FAIR-Prinzipien die maschinelle Nachnutzung fördern?
Durch maschinenlesbare Identifikatoren, strukturierte Metadaten und standardisierte Schnittstellen unterstützen FAIR-Prinzipien automatisierte Auswertung, KI-Anwendungen sowie die Integration in komplexe Informationssysteme.
Wo finde ich weitere Schulungsmaterialien oder Best-Practice-Beispiele zu FAIR?
Hilfreiche Materialien und Beispiele bieten die Plattformen GO FAIR, Research Data Alliance, FAIRsharing.org sowie nationale Infrastrukturen und Servicezentren. Diese Ressourcen unterstützen bei der Einführung und Qualitätssicherung von FAIR-Praktiken.
Wo kann ich die Original-Definition der FAIR-Prinzipien nachlesen?
Die Originalpublikation von Wilkinson et al. aus dem Jahr 2016 wurde im Journal Scientific Data veröffentlicht. Alle Subprinzipien und weiterführende Informationen finden Sie unter https://www.nature.com/articles/sdata201618.