CERIF

CERIF steht für „Common European Research Information Format“. Es handelt sich um einen von euroCRIS entwickelten, europaweit anerkannten Standard zur strukturierten Erfassung, Verwaltung und zum Austausch von Forschungsinformationen.

Produkt:
Forschungsdokumentation

Der Entwicklungs- und Anwendungsschwerpunkt liegt deutlich in Europa. Für Organisationen aller Größen, die forschungsrelevante Daten effizient strukturieren, veröffentlichen und austauschen möchten, bietet CERIF eine anpassungsfähige und nachhaltige Grundlage.

Historischer Hintergrund und Entwicklung

CERIF wurde in den frühen 1990er Jahren im Auftrag der Europäischen Kommission entwickelt, um die Interoperabilität und Integration von Forschungsinformationen über Ländergrenzen hinweg zu erleichtern. Seit 2002 betreut euroCRIS als internationale, gemeinnützige Organisation die Weiterentwicklung des Standards. Das Modell wurde über verschiedene Versionen – aktuell Version 1.6 – kontinuierlich erweitert, um zusätzliche Entitätstypen, komplexe Relationen, Multilingualität sowie zeitliche Gültigkeit von Daten abzubilden.

CERIF ist auch durch die Aufnahme zentraler Terminologie in die Norm ISO 5127 (Wörterbuch des Informations- und Dokumentationswesens) begrifflich international verankert.

Was ist CERIF?

CERIF ist ein relationales, semantisch reiches Datenmodell, das die wichtigsten Kategorien wissenschaftlicher Information in standardisierter und strukturierter Form abbildet. Zentrale Kategorien sind sogenannte Core Entities, darunter Projekte, Publikationen, Personen, Organisationseinheiten (OrgUnits), Fördermittel, Infrastrukturen, Patente und mehr.

Eine besondere Stärke liegt in der expliziten Modellierung von Relationen: Flexible Linking Entities (Beziehungsobjekte) verbinden Core Entities und präzisieren die Art und Dauer der Beziehungen. So lassen sich zum Beispiel Mitarbeitende temporär Projekten zuordnen oder Publikationen mit mehreren Förderungen verknüpfen. Klassifikationen und kontrollierte Vokabulare ermöglichen zudem die Einbindung eigener organisationaler Taxonomien und internationaler Thesauri.

Wichtige Modelleigenschaften sind die Unterstützung von Multilingualität, die Abbildung zeitbezogener Gültigkeiten von Relationen („temporal validity“) und die Möglichkeit, externe persistente Identifikatoren technisch einzubinden.

Zentrale Konzepte und Begriffe in CERIF

  • Core Entities: Hauptobjekte wie Project, Publication, Person, OrgUnit, Funding, Facility.
  • Linking Entities (Relations): Vermitteln Beziehungen zwischen Core Entities, z.B. Person_Project, Publication_Funding. Sie enthalten Attribute wie Rolle, Zeitdauer, Klassifikationen.
  • Klassifikationen/Semantic Layer: Ermöglichen die Verwendung strukturierter Vokabulare, z.B. Projektarten, Fachgebiete, Publikationstypen, Positionsarten.
  • Multilingualität: Inhalte, Bezeichnungen und Beschreibungen können in mehreren Sprachen gepflegt werden.
  • Temporale Gültigkeit: Relationen und Attribute lassen sich mit Anfangs- und Enddatum versehen, sodass Änderungen über die Zeit nachvollziehbar bleiben.
  • Persistente Identifikatoren: Die Integration von IDs wie ORCID (Personen), DOI (Publikationen) oder ISNI (Organisationen) ist möglich, aber im Standard nicht verpflichtend und muss von den implementierenden Systemen jeweils technisch abgebildet werden.

Technische Grundlagen: Datenmodell, Austauschformate und Werkzeuge

CERIF definiert das Datenmodell, aber keine eigene Anwendungslogik oder API. Der wichtigste Austauschstandard ist CERIF-XML, ein maschinenlesbares, versioniertes XML-Schema zur standardkonformen Übertragung von Forschungsdaten. Die Versionierung des Schemas sorgt für Konsistenz und klare Migrationspfade.

Eine CERIF-RDF-Spezifikation wurde von euroCRIS vorgeschlagen, hat derzeit aber nur begrenzte offizielle Unterstützung und eingeschränkte Anwendung in der Praxis. Offizielle REST-APIs sind kein Bestandteil des CERIF-Standards; die Anbindung an bestehende Systeme erfolgt meist über XML-basierte Exports/Imports oder durch proprietäre Schnittstellen.

Hilfsmittel und Open-Source-Referenzimplementierungen sind verfügbar, etwa für Schema-Validierung, Datenkonvertierung oder Mapping (zum Beispiel CERIF-XML-Konverter, Mapping-Tools sowie das euroCRIS Directory of Research Information Systems – DRIS).

CERIF in der Praxis: Einsatz und Integration

In Europa wird CERIF als Datenstandard von zahlreichen Forschungsinformationssystemen (FIS) unterstützt. Systeme wie Pure, Converis oder (in Teilen und abhängig vom Setup) HISinOne-RES sind in der Lage, Daten CERIF-konform zu modellieren oder zu exportieren. Die tatsächliche Tiefe der CERIF-Unterstützung variiert jedoch, häufig werden nur Teilausschnitte des Modells abgedeckt oder durch proprietäre Erweiterungen ergänzt.

Der Standard findet breite Anwendung unter Hochschulen, Forschungseinrichtungen, Forschungsförderorganisationen und zunehmend auch Ministerien und Verbänden – insbesondere überall dort, wo Interoperabilität, Vergleichbarkeit und Nachverfolgbarkeit von Forschungsleistungen gefragt sind.

In Deutschland orientieren sich die Vorgaben des Kerndatensatz Forschung (KDSF) an CERIF, nehmen aber Vereinfachungen und Anpassungen für nationale Berichtspflichten vor. Der KDSF wird von vielen Fördereinrichtungen und Landesministerien bei der Standardisierung des Forschungsmonitorings gefordert.

International nutzen Länder wie Finnland, Norwegen und die Niederlande CERIF oder davon abgeleitete Modelle für nationale Forschungsberichterstattung und Vernetzung.

CERIF und andere Standards

CERIF grenzt sich von anderen, teils international verbreiteten Formaten ab (z.B. CASRAI, FRIS, CRediT). Während CERIF ein tiefes, relationales Datenmodell mit Fokus auf Beziehungen und zeitlicher Gültigkeit bietet, verfolgen andere Standards oft mehr auf Austauschformate fokussierte oder rollenbasierte Ansätze. Harmonisierung und Mapping zwischen diesen Standards sind Gegenstand laufender Projekte und Arbeitsgruppen.

Vorteile von CERIF für Ihr Forschungsinformationssystem

  • Standardisierte Datenstrukturen: CERIF schafft eine einheitliche Struktur zur Abbildung von Projekten, Organisationseinheiten, Personen, Publikationen, Patenten und Fördermitteln.
  • Interoperabilität: CERIF ermöglicht den institutionen- und länderübergreifenden Austausch von Forschungsinformationen, etwa mit Fördermittelgebern oder Partnern. Initiativen wie OpenAIRE oder nationale Forschungsdateninfrastrukturen empfehlen oder unterstützen CERIF teilweise.
  • Transparenz und Berichtsfähigkeit: Sie können Forschungsleistungen und Projektverläufe standardisiert dokumentieren und flexibel auswerten – ein Vorteil bei steigenden Berichtspflichten.
  • Flexibilität und Anpassbarkeit: Individuelle Klassifikationen, Unterstützung für Multilingualität, temporale Gültigkeiten und wiederverwendbare Strukturen machen CERIF vielseitig und zukunftsfähig.
  • Unterstützung von FAIR und Open Science: Die Modularität und Offenheit von CERIF erleichtert die Umsetzung der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) und die Integration in Open-Science-Infrastrukturen.

Herausforderungen und Grenzen bei der CERIF-Implementierung

  • Modellkomplexität: Das umfassende Datenmodell erfordert ein präzises Mapping lokaler Strukturen auf CERIF und kann zur Herausforderung bei der Einführung und Pflege werden.
  • Implementierungsaufwand: Migration existierender Daten, Mapping-Prozesse und die Anpassung vorhandener Workflows verlangen personelle und technische Ressourcen.
  • Systemintegration: Proprietäre Erweiterungen der Anbieter können die Konsistenz und Austauschbarkeit von CERIF-Daten einschränken.
  • Normative Offenheit: Persistente Identifikatoren werden im Modell zwar vorgesehen, ihre konkrete Nutzung und Verknüpfung ist jedoch nicht normativ geregelt und variiert von System zu System.
  • Schulungsbedarf: Das Verständnis für das Datenmodell und die Modellierungsprinzipien ist essenziell für nachhaltigen Betrieb und effektive Nutzung.

Best Practices für die Nutzung von CERIF

  • Qualitätsmanagement: Entwickeln Sie klare Richtlinien für die Datenpflege und setzen Sie regelmäßige Qualitätsprüfungen und Validierungen ein.
  • Effiziente Modellierung: Nutzen Sie die Stärken des relationalen Modells, indem Sie Beziehungen, temporale Gültigkeit und Klassifikationsmechanismen konsequent anwenden.
  • Geeignete Schnittstellen und Tools: Implementieren Sie, wann immer möglich, standardisierte CERIF-XML-Schnittstellen und prüfen Sie den Einsatz von Konvertierungs- und Validierungstools aus der CERIF-Community.
  • Mapping-Strategien: Legen Sie frühzeitig fest, wie lokale Begriffe, Klassifikationen und Strukturen auf CERIF abgebildet werden. Halten Sie Mappings und Konventionen dokumentiert vor.
  • Multilingualität umsetzen: Nutzen Sie die Sprachen-Unterstützung des Modells, um internationale Berichtspflichten und Mehrsprachigkeit zu gewährleisten.
  • Einbindung externer Identifikatoren: Integrieren Sie, soweit möglich, persistente Identifikatoren (z.B. ORCID, DOI, ISNI), um die Interoperabilität zu verbessern.
  • Community & Weiterbildung: Beteiligen Sie sich an der CERIF-Community, besuchen Sie Veranstaltungen wie euroCRIS-Mitgliederversammlungen, und fördern Sie kontinuierliche Schulungen Ihres Teams.
  • Systempflege: Überprüfen Sie System- und Schnittstellenkompatibilität regelmäßig hinsichtlich neuer CERIF-Versionen und setzen Sie aktuelle Sicherheitsstandards um.

Häufige Fragen zu CERIF

Was unterscheidet CERIF von einem Forschungsinformationssystem?

CERIF ist ein standardisiertes Datenmodell zur Beschreibung und Austauschbarkeit von Forschungsinformationen. Ein Forschungsinformationssystem (FIS) ist eine Softwarelösung, die mithilfe von CERIF Daten erfasst, analysiert und nutzerfreundlich bereitstellt. CERIF gibt die Struktur vor, das FIS setzt diese praktisch um.

Muss jedes Forschungsinformationssystem CERIF unterstützen?

Die Unterstützung von CERIF ist nicht verpflichtend, gewinnt aber an Bedeutung – insbesondere bei nationalen und internationalen Berichts-, Austausch- und Förderprozessen. Sie profitieren von CERIF-Kompatibilität durch höhere Interoperabilität und verbesserte Reportingmöglichkeiten.

Für wen ist CERIF relevant?

CERIF ist besonders relevant für Hochschulen, Forschungseinrichtungen, Förderorganisationen, Ministerien, Bibliotheken und Unternehmen, die Forschungsdaten strukturiert verwalten und teilen müssen. Die Nutzung nimmt europaweit durch steigende Berichtspflichten stetig zu.

Wie funktioniert Import und Export von CERIF-Daten?

Der Datenaustausch erfolgt vor allem über CERIF-XML. Mappingarbeiten und individuelle Anpassungen sind in der Praxis jedoch nötig, um Systemunterschiede und lokale Erweiterungen zu berücksichtigen. Tools zur Validierung und zum Konvertieren unterstützen bei der Datenübertragung.

Welche Herausforderungen treten bei der Migration auf CERIF auf?

Typische Herausforderungen sind Mapping von lokalen Strukturen auf das CERIF-Modell, Konsolidierung und Bereinigung von Altdaten, Anpassung von Schnittstellen sowie die Berücksichtigung von proprietären Erweiterungen. Pilotmigrationen, Beratung und Werkzeuge können den Prozess vereinfachen.

Welche Rolle spielen persistente Identifikatoren in CERIF?

CERIF ermöglicht die Nutzung von persistenten Identifikatoren (z.B. ORCID, DOI, ROR, ISNI) für Objekte, Organisationen oder Personen. Die konkrete Integration hängt vom jeweiligen FIS ab und sollte bei Systemeinführung sorgfältig geplant werden.

Welche deutschen Besonderheiten gibt es bei CERIF?

Der Kerndatensatz Forschung (KDSF) ist an CERIF angelehnt und wird in Deutschland als Berichtsstandard eingesetzt. Er orientiert sich an den Prinzipien von CERIF, nimmt aber eigene Definitionen und Vereinfachungen vor.

Wie unterstützt CERIF die FAIR-Prinzipien und Open Science?

CERIF erleichtert die Einhaltung der FAIR-Prinzipien (Auffindbarkeit, Zugänglichkeit, Interoperabilität, Wiederverwendbarkeit) durch strukturierte Daten, Unterstützung von Identifikatoren und Schnittstellen zu Repositorien und Forschungsdiensten.

Wie kann ich eigene Klassifikationen in CERIF einbinden?

Sie können eigene Klassifikationssysteme, Taxonomien oder Thesauri in den Semantic Layer von CERIF integrieren. Dies geschieht über konfigurierbare Klassifikationsentitäten und entsprechende Relationen.

Wie unterstützt CERIF die Mehrsprachigkeit?

CERIF erlaubt die Speicherung von Inhalten, Titeln, Namen und Beschreibungen in mehreren Sprachen. Damit können Sie Daten mehrsprachig ausgeben und Berichtspflichten international erfüllen.

Welche Tools oder Open-Source-Lösungen stehen für CERIF zur Verfügung?

Es gibt verschiedene Open-Source-Tools und Referenzimplementierungen für CERIF-XML-Validierung, Datenkonvertierung und Mapping, sowie Werkzeuge aus der euroCRIS-Community. Einige sind direkt über die euroCRIS-Website verfügbar.

Gibt es internationale Initiativen und Austauschprogramme rund um CERIF?

Initiativen wie das euroCRIS Directory of Research Information Systems (DRIS), regelmäßige euroCRIS-Veranstaltungen und internationale Arbeitsgruppen fördern den Austausch zwischen Anwendern und Entwicklern. In mehreren europäischen Ländern existieren nationale Forschungsberichtssysteme, die CERIF oder davon abgeleitete Modelle verwenden.

Inhaltsverzeichnis