DataCite

DataCite ist eine internationale, gemeinnützige Organisation mit Sitz in Deutschland (eingetragener Verein, DataCite e.V., Dresden) und agiert als eine von mehreren von der International DOI Foundation (IDF) akkreditierten DOI-Registrierungsagenturen.

Produkt:
Bibliotheksmanagement

DataCite ermöglicht Forscherinnen und Forschern, Bibliotheken, Forschungsinstituten, Repositorien, Verlagen und anderen Einrichtungen die Vergabe von Digital Object Identifiers (DOIs) für vielfältige wissenschaftlich relevante digitale Objekte wie Forschungsdaten, Software, Preprints, Publikationen und Sammlungen.

Die Vergabe der DOIs erfolgt nicht direkt durch DataCite, sondern über DataCite-Mitglieder oder Konsortien, die als registrierte Stellen fungieren und vergabeberechtigt sind. Diese Mitgliedsinstitutionen können die DOI-Anmeldung auch an weitere Einrichtungen delegieren. 

DataCite gehört zu den wichtigsten Akteuren im Bereich der dauerhaften Identifikation und Auffindbarkeit wissenschaftlicher Ergebnisse und sorgt durch ein breites Serviceangebot für die weltweite Zugänglichkeit, Sichtbarkeit und Nachweisbarkeit von Forschungsleistungen.

Zusammenspiel mit der International DOI Foundation und anderen Registrierungsagenturen

Das DOI-System wird von der International DOI Foundation (IDF) bereitgestellt und verwaltet. Die IDF akkreditiert Registrierungsagenturen wie DataCite oder Crossref, die jeweils auf unterschiedliche Inhalte und Communitys fokussiert sind. 

Während DataCite insbesondere für Forschungsdaten, Software, Preprints sowie eine Vielzahl wissenschaftlicher Objekttypen zuständig ist, liegt der Schwerpunkt von Crossref auf Zeitschriftenartikeln, Büchern, Konferenzbeiträgen und zunehmend auch auf Datensätzen. 

Die DOI-Registrierungsagenturen verwenden globale technische und organisatorische Standards der IDF, grenzen sich aber im Hinblick auf Policies, Metadatenanforderungen und Zielgruppen voneinander ab.

Technische Grundlagen und Funktionsweise

Das Kernelement von DataCite ist der DOI, der global eindeutig und dauerhaft ein digitales Objekt adressiert. DOIs nutzen die Infrastruktur des sogenannten Handle-Systems und werden über den DOI-Resolver der IDF (https://doi.org/) aufgerufen. Dieser Resolver gewährleistet, dass der DOI stets zum aktuellen Speicherort des Objekts weiterleitet. 

Die dauerhafte Auffindbarkeit und Persistenz hängen jedoch wesentlich von der beständigen Pflege der hinterlegten Metadaten und Ziel-URLs durch die datenhaltende Institution ab. DataCite stellt die technische Infrastruktur und die Verwaltungsprozesse bereit, archiviert aber keine Inhalte selbst.

Zur strukturierten Beschreibung der identifizierten Objekte dient das DataCite Metadata Schema. Es ist eines von mehreren etablierten Metadatenschemata und bildet mit Pflicht- und optionalen Feldern eine breite Palette wissenschaftlicher Objekttypen ab - darunter Forschungsdaten, Software, Preprints, audiovisuelle Medien und Lehrmaterialien. Neben DataCite existieren weitere Metadatenschemata (z.B. von Crossref für Verlagsinhalte).

DataCite unterstützt die Integration von Persistent Identifiers (PIDs) wie ORCID (für Autorenidentifikation) oder ROR (Research Organization Registry für Einrichtungen) zur weiteren Vernetzung und verbesserten Nachvollziehbarkeit.

Zu den verfügbaren Schnittstellen und APIs zählen die moderne REST API, die etablierte (aber als legacy deklarierte) MDS API sowie geplante Entwicklungen wie eine GraphQL API. Die APIs ermöglichen den Datenaustausch und die DOI-Registrierung durch automatisierte Workflows. OAI-PMH wird von DataCite aktuell nicht mehr aktiv gefördert.

Historische Entwicklung, Governance und Community

DataCite wurde 2009 gegründet, um die internationale Sichtbarkeit und Nachweisbarkeit von Forschungsdaten zu stärken. 

Heute ist DataCite eine zentrale Infrastruktur für die DOI-Vergabe und ein wichtiger Impulsgeber im Forschungsdatenmanagement. Die Organisation operiert als eingetragener Verein und wird von ihren Mitgliedern getragen, darunter führende Forschungseinrichtungen, Bibliotheken, Verlage sowie nationale und internationale Konsortien. 

Über Arbeitsgruppen und Taskforces können Mitglieder aktiv an der Weiterentwicklung von Services, Qualitätsstandards und Metadatenschemata mitwirken. Die jährliche Mitgliederversammlung bietet ein Forum für Austausch, Abstimmung und Strategieentwicklung.

DataCite ist eng mit nationalen und internationalen Forschungsinfrastrukturen wie NFDI (Deutschland), EOSC (Europa), NIH (USA) und weiteren Initiativen verknüpft.

Relevanz im modernen Informationsmanagement

Durch die Integration von DataCite-DOIs und standardisierten Metadaten können wissenschaftliche Objekte eindeutig, dauerhaft und unabhängig vom Speicherort identifiziert und zitiert werden. Die zugehörigen APIs ermöglichen eine automatisierte Vergabe, Pflege und Aktualisierung der DOIs und Metadaten direkt aus den Fachanwendungen. 

Auch für Verlage, Förderorganisationen und öffentliche Einrichtungen spielen DOIs nach DataCite-Standard eine zunehmend wichtige Rolle.

DataCite spielt zudem eine tragende Rolle bei der Zitation wissenschaftlicher Software und unterstützt so den internationalen Trend zur Anerkennung von Software als primäre wissenschaftliche Leistung.

DataCite, Open Science und die FAIR-Prinzipien

DataCite engagiert sich für Open Science und unterstützt die Umsetzung der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable). 

Der DOI als persistenter Identifikator bildet die Grundlage für die Auffindbarkeit wissenschaftlicher Objekte. Die Metadaten und Schnittstellen von DataCite fördern die Interoperabilität und Wiederverwendbarkeit von Forschungsdaten. 

Es ist jedoch zu beachten, dass ein DOI allein keine Zugänglichkeit garantiert, sondern lediglich die Identifizierbarkeit und dauerhafte Referenzierung ermöglicht. Die tatsächliche Zugänglichkeit hängt von den Zugriffsregelungen und Lizenzen der datenhaltenden Einrichtung ab.

DataCite engagiert sich darüber hinaus in Initiativen wie „Make Data Count“, um Nutzungsmetriken und Zitationen für Forschungsdaten transparent zu machen, und unterstützt damit nachhaltige Datenpublikation und -auswertung.

Vorteile von DataCite im digitalen Informationsmanagement

Der Einsatz von DataCite und der zugehörigen Services im digitalen Informationsmanagement bietet zahlreiche Vorteile:

  • Eindeutige und dauerhafte Identifikation: Jeder DOI ist weltweit einmalig und persistiert unabhängig vom Speicherort, solange die hinterlegte Ziel-URL gepflegt wird.
  • Steigerung wissenschaftlicher Sichtbarkeit und Nachvollziehbarkeit: DataCite-DOIs sind international anerkannt und erleichtern Zitation, Wiederverwendung und Referenzierung.
  • Umfassende und standardisierte Metadaten: Das DataCite Metadata Schema erlaubt eine detaillierte Beschreibung vielfältiger Objekttypen. Die Integration von ORCID- und ROR-PIDs stärkt die Nachvollziehbarkeit und Verknüpfbarkeit von Forschungsleistungen.
  • Automatisierte Integration: Die umfassenden APIs (REST API, MDS API) erlauben die Anbindung an Repositorien, Forschungsinformationssysteme und Bibliotheksmanagement-Lösungen. Gängige Open-Source-Systeme wie DSpace oder Invenio bieten entsprechende Schnittstellen.
  • Support für Open Science Policies: DataCite-Services unterstützen die Umsetzung von Open-Science- und Open-Data-Initiativen durch standardisierte Identifikatoren und Metrikdienste.
  • Nachhaltige Qualitätssicherung: Die DOI-registrierenden Institutionen sind verpflichtet, Metadaten und Ziel-URLs aktuell zu halten und gewährleisten so die dauerhafte Referenzierbarkeit.
  • Breite Objekttypen-Abdeckung: Unterstützung unter anderem für Forschungsdaten, Software, Preprints, institutionelle Publikationen, audiovisuelle Medien, Poster und Lehrmaterialien.

Praxiseinsatz und Best Practices

DataCite-DOIs werden in der Praxis über Mitglieder, Konsortien oder auf delegiertem Weg vergeben. Voraussetzung ist immer eine Member- oder Consortium-Mitgliedschaft; Einzelpersonen oder beliebige Einrichtungen können keine DOIs unabhängig oder ohne Mitgliedsschaft registrieren. Mitgliedsorganisationen können die DOI-Vergabe an weitere Partner/Hochschulen delegieren, behalten aber die Kontroll- und Pflegeverantwortung.

Die wichtigsten Best Practices rund um die Anwendung von DataCite:

  • Umfassende Metadatenpflege: Füllen Sie alle Pflicht- und möglichst viele optionale Felder aus - auch für Software und dynamische Datensätze.
  • Relevanz der Objekte sicherstellen: Vergaben Sie DOIs für alle wissenschaftlich oder gesellschaftlich relevanten Inhalte, unabhängig von deren kommerziellem oder nicht kommerziellem Ursprung, gemäß den DataCite-Richtlinien.
  • Dokumentation der Abläufe: Legen Sie interne Prozesse für DOI-Registrierung und Metadatenpflege fest und schulen Sie Ihr Personal gezielt.
  • Regelmäßige Qualitätskontrollen: Überwachen Sie die Aktualität aller Metadaten und Ziel-URLs kontinuierlich.
  • Automatisierung der Workflows: Nutzen Sie die bereitgestellten APIs, um Fehler zu minimieren und Ressourcen zu sparen.
  • Verknüpfung mit anderen Persistent Identifiers: Ergänzen Sie Objekte um ORCID iDs (Autoren), ROR-IDs (Institutionen) und FundRef (Förderinformationen), um die Nachvollziehbarkeit und Vernetzung zu erhöhen.

Schnittstellen, Tools und Services

DataCite bietet offene und moderne Schnittstellen, darunter:

  • REST API: Für DOI-Vergabe, Suche und Metadatenpflege.
  • MDS API: Legacy-Schnittstelle für die maschinelle DOI-Registrierung.
  • GraphQL API: Künftige, leistungsstarke Schnittstelle für Datenabfragen (in Vorbereitung).
  • Commons: Plattform für Recherche, Identitätsmanagement, Vernetzung von Personen, Organisationen und Ressourcen, Routing zu Zuordnungen und Informationen über DOIs.
  • Fabrica: Portal zur Verwaltung und DOI-Vergabe sowie Metadatenpflege durch Mitglieder.
  • Event Data: Erfasst und analysiert Ereignisse im Kontext von DOIs wie Zitationen, Verwendungen oder Erwähnungen, und trägt zum Aufbau des citation graph bei.
  • PID Graph: Ein wachsendes Netzwerk, das verschiedene PIDs (DOIs, ORCID iDs, ROR-IDs usw.) interdisziplinär verknüpft und damit die Vernetzung und Tracking von Forschungsaktivitäten und -beziehungen ermöglicht.
  • Make Data Count: Initiative zur Bereitstellung von Datennutzungs- und Zitationsmetriken.

Mitgliedschaft, Infrastruktur und Qualitätsstandards

Die Mitgliedschaft bei DataCite steht Forschungseinrichtungen, Repositorien, Bibliotheken, Verlagen und nationalen Dateninfrastrukturen offen. Es existieren verschiedene Modelle: Einzelmitgliedschaft, Konsortialbeteiligung sowie geteilte Mitgliedschaft mit Delegationsmöglichkeit. Konsortien ermöglichen insbesondere kleineren Institutionen Zugang zur DOI-Vergabe.

DataCite verpflichtet alle Mitglieder zur Einhaltung definierter Qualitätsstandards, Sicherstellung der Datenintegrität und Compliance mit internationalen Datenschutz- und Zugriffsrichtlinien. Die Wartung und Aktualisierung der Ziel-URLs und Metadaten verbleibt stets in der Verantwortung der Mitgliedsorganisation.

Statistisch betreut DataCite derzeit mehrere Millionen DOIs, tausende Mitglieder und Konsortien in allen Teilen der Welt. Die Serviceangebote werden kontinuierlich weiterentwickelt und bereitgestellt.

Rechtliche Anforderungen und internationale Aspekte

Für die eigenständige DOI-Vergabe müssen Organisationen rechtliche, technische und organisatorische Voraussetzungen erfüllen. Dazu zählen verlässliche Datenhaltungssysteme, klare Verantwortlichkeiten und die Beachtung geltender Datenschutz- und Datenhoheitsregeln. 

Bei internationalen Datensätzen müssen verschiedene rechtliche Rahmenbedingungen (wie etwa Datenschutzverordnungen und Datenübertragungsgesetze) beachtet werden. DataCite gibt dazu regelmäßig Empfehlungen und unterstützt mit Schulungen, Supportangeboten und jährlichen Community Days.

Häufige Fragen zu DataCite

Was ist ein DOI und warum ist er für Forschungsdaten wichtig?

Ein DOI (Digital Object Identifier) ist ein weltweit eindeutiger, persistenter Identifikator für digitale Objekte. Er garantiert deren dauerhafte Identifizierbarkeit und ermöglicht die zuverlässige Zitation und Nachverfolgung, unabhängig vom aktuellen Speicherort. Ein DOI selbst ist per Definition persistent - DataCite und andere Agenturen sorgen für dessen technische Infrastruktur und Verwaltung.

Wer kann DOIs über DataCite registrieren?

Nur Organisationen, die als Mitglieder, Konsortien oder im Rahmen einer Delegation von einem Mitglied agieren, können DOIs über DataCite registrieren. Ein eigenständiger Zugang ist an die Mitgliedschaft gebunden. Einzelpersonen können keine DOIs direkt vergeben.

Welche Inhalte sind für die Vergabe von DataCite-DOIs geeignet?

DataCite unterstützt DOIs für alle wissenschaftlich und gesellschaftlich relevanten digitalen Objekte, darunter Forschungsdaten, Software, wissenschaftliche Publikationen, Preprints, Sammlungen, Poster, Lehrmittel, audiovisuelle Materialien und mehr.

Wie funktioniert die Aktualisierung der Ziel-URL eines DOIs?

Wenn sich der Speicherort eines Objekts ändert, aktualisiert die datenhaltende Institution die Ziel-URL im DataCite-System. Der DOI bleibt unverändert und verweist dauerhaft auf den jeweils aktuellen Speicherort, solange die Metadaten gepflegt werden.

Welche Schnittstellen und Tools bietet DataCite für DOIs und Metadaten?

DataCite liefert offene Schnittstellen wie die moderne REST API (für Registrierung, Pflege und Abfrage), die MDS API (legacy), Commons (Recherche und Identitätsmanagement), das Verwaltungsportal Fabrica sowie Event Data zur Erfassung von Zitationen und anderen Ereignissen im PID-Kontext.

Welche Kosten entstehen bei der DOI-Vergabe über DataCite?

Die Kostenstruktur für die DOI-Vergabe richtet sich nach dem jeweiligen Mitglied, Konsortium oder nationalen Rahmenbedingungen. Es empfiehlt sich, die Konditionen individuell zu prüfen oder beim zuständigen Konsortium zu erfragen.

Welche Metadaten müssen bei der DOI-Vergabe an DataCite übermittelt werden?

Pflichtfelder sind unter anderem Titel, Autoren/Urheber (idealerweise mit ORCID iD), Veröffentlichungsjahr, Objekttyp und Ziel-URL. Weitere optionale Felder ermöglichen eine verbesserte Auffindbarkeit, Kontextualisierung und Zitation.

Wie fördert DataCite die FAIR-Prinzipien und Open Science?

DataCite trägt zur Auffindbarkeit und Interoperabilität von wissenschaftlichen Daten durch die Vergabe von DOIs, standardisierten Metadaten und offenen APIs bei. Durch die Integration weiterer persistenter Identifikatoren fördert DataCite die Transparenz und Nachvollziehbarkeit von Forschung und deren Vernetzung im globalen Wissenschaftssystem.

Welche Rolle spielt DataCite bei der Software-Zitation?

Das DataCite Metadata Schema bietet umfangreiche Felder speziell für die Beschreibung, Versionierung und Zitation wissenschaftlicher Software. Die DOI-Vergabe für Software wird von vielen Journals, Repositorien und Fördereinrichtungen empfohlen und zunehmend vorausgesetzt.

Wie integriert man DataCite-DOIs in bestehende Informationssysteme?

DataCite-DOIs und Metadaten können über Schnittstellen wie REST API, MDS API und Commons in informationsführende Systeme eingebunden werden. Viele gängige Forschungs- und Bibliotheksmanagement-Systeme unterstützen die Integration ab Werk oder per Plug-in.

Wie grenzt sich DataCite gegenüber anderen DOI-Registrierungsagenturen ab?

DataCite ist besonders auf Forschungsdaten, Software, Preprints und institutionelle Publikationen fokussiert, überschneidet sich aber teilweise mit Agenturen wie Crossref. Auch Crossref bietet DOIs für Datensätze und Nicht-Journal-Inhalte an. Die Policy, die Metadatenmodelle und Services unterscheiden sich je nach Agentur.

Welche Rolle spielt DataCite im internationalen Kontext?

DataCite trägt zur globalen Forschungsinfrastruktur bei, ist eng an Initiativen wie EOSC, NFDI und Make Data Count angebunden und vernetzt dauerhaft Millionen von Forschungsobjekten, Institutionen und Personen weltweit. Die Offenheit der Systeme und Metadatenstandards fördert die Zusammenarbeit auf internationaler Ebene.

Welche Schulungs- und Community-Angebote stellt DataCite bereit?

DataCite bietet regelmäßige Schulungsangebote, Webinare, Support-Services, Community Days und Dokumentationen an, um Mitgliedern und Interessierten den Wissenstransfer und die effiziente Nutzung aller Services zu erleichtern.

Wie steht es um die Langzeitverfügbarkeit - ist ein DOI gleichbedeutend mit dauerhafter Datenarchivierung?

Ein DOI sichert die dauerhafte Identifizierbarkeit eines Objekts, ersetzt aber keine Archivierung des Inhalts. Die tatsächliche Verfügbarkeit (Zugriff und Datenbestand) hängt von der Pflege und dem Commitment der datenhaltenden Einrichtung ab. DataCite unterstützt die Community bei der Entwicklung nachhaltiger Digitalisierungs- und Archivierungsstrategien.

Inhaltsverzeichnis