GRID wurde von Digital Science - einem Unternehmen der Holtzbrinck Publishing Group - entwickelt und zwischen 2015 und Ende 2021 aktiv gepflegt. Ziel war es, Universitäten, Forschungsinstitute, Laboratorien und wissenschaftliche Organisationen präzise, standardisiert und international eindeutig mit einer GRID-ID auszuzeichnen.
Obwohl die aktive Weiterentwicklung des Datenbestands 2021 eingestellt wurde, bleibt GRID als Open Data erhalten. Die Daten, Dokumentationen und Mappings sind dauerhaft über das GRID-GitHub-Archiv verfügbar und bilden weiterhin eine wichtige Referenz für bestehende und historische Informationsmanagement-Systeme.
Neue Anwendungen und Integrationen nutzen heute vorrangig die Nachfolgedatenbank Research Organization Registry (ROR), während GRID vor allem für den Bestandserhalt und Migrationsszenarien relevant bleibt.
Entstehung, Entwicklung und Projektende
GRID entstand als Antwort auf die Herausforderung, Forschungseinrichtungen weltweit eindeutig identifizierbar zu machen und eine Basis für Verknüpfungen in bibliothekarischen sowie forschungsnahen Systemen zu schaffen. Die zentrale Pflege und Entwicklung erfolgte durch Digital Science. Von 2015 bis Dezember 2021 wurde GRID kontinuierlich ausgebaut, inklusive Aliasnamen, Standorte, Beziehungen zwischen Organisationen und Historien wie Fusionen oder Umbenennungen.
Das Projekt wurde mit dem finalen Datenstand im Dezember 2021 abgeschlossen, da mit der Research Organization Registry (ROR) ein von der Community getragenes Nachfolgeprojekt bereitsteht. ROR übernimmt die dauerhafte Identifikation und Zuordnung wissenschaftlicher Organisationen und ist in Zusammenarbeit mit internationalen Partnern wie DataCite und Crossref entstanden. Die GRID-Daten bleiben als Open Data (CC0) öffentlich nutzbar, das finale Release wurde auf GitHub archiviert.
Wichtige Milestones:
- 2015: Erstes öffentliches GRID-Release
- 2016-2021: Erweiterungen von Einträgen, Aliasnamen und Beziehungen
- Dezember 2021: Veröffentlichung des finalen Datenpakets und Einstellung der aktiven Pflege
- Seit 2022: Migration und Mapping der GRID-Daten zu ROR, Bereitstellung statischer Snapshots
Technische Details, Format und Zugriffswege
GRID-Datensätze stehen als offene Daten unter der Creative Commons CC0-Lizenz kostenfrei zur Verfügung. Die Daten werden in maschinenlesbaren Standardformaten wie CSV und JSON veröffentlicht, einsehbar im finalen GRID-GitHub-Repository. Der API-Livezugang von GRID wurde zeitgleich mit der Einstellung der Weiterentwicklung im Dezember 2021 abgeschaltet.
Eine GRID-ID ist ein persistent vergebener Bezeichner, der nie wieder neu besetzt wird und im Format grid.xxxxx.x (wobei x jeweils für Zahlen oder Buchstaben stehen kann) aufgebaut ist; Beispiel: grid.12345.1 oder grid.0ab12.c. Die letzte Komponente einer GRID-ID kann ein Buchstabe oder eine Zahl sein und dient der Unterscheidung, nicht als Prüfziffer.
Mappings von GRID zu ROR werden federführend durch das ROR-Projekt bereitgestellt. Umfangreiche Aliaslisten und Namensvariationen ermöglichen eine präzise Berücksichtigung von nationalen, regionalen und sprachlichen Unterschieden bei der Recherche und Datenpflege.
Methodik und Datenpflege
Die Pflege und Erweiterung des GRID-Datenbestands erfolgte zentral durch das Team von Digital Science, basierend auf öffentlichen Quellen, Community-Vorschlägen und automatisierten Datenvergleichen. Neue Organisationen konnten vorgeschlagen, bestehende Einträge korrigiert oder Duplikate entfernt werden. Historische Veränderungen (beispielsweise Fusionen oder Namenswechsel) wurden als separate Relationen in GRID modelliert. Diese Methode gewährleistet die Nachvollziehbarkeit aller Veränderungen und bietet einen hohen Grad an Transparenz.
Abdeckung und Limitationen
GRID erreicht eine hohe Abdeckung global relevanter Universitäten, Forschungseinrichtungen und wissenschaftlicher Organisationen mit besonderem Schwerpunkt auf Europa, Nordamerika und großen Wissenschaftsnationen in Asien.
Bestimmte Regionen und kleinere oder nicht-akademische Forschungseinheiten können unterrepräsentiert sein. Das Datenmodell bildet standardmäßig Hauptstandorte, Aliasnamen und übergeordnete Beziehungen ab, ist aber in der Granularität bei Tochtergesellschaften, Instituteinheiten oder Universitätskliniken gelegentlich eingeschränkt.
Fusionen und Namensänderungen werden in GRID dokumentiert, jedoch sind sehr detaillierte institutionelle Strukturen oder temporäre Kollaborationen nicht in jedem Fall berücksichtigt.
Anwendung und Einbettung in Forschungsinformationssysteme
GRID-IDs werden genutzt, um Datenbanken, Forschungsportale, Publikationsverzeichnisse und institutionelle Repositorien mit einer eindeutigen, stabilen Organisationsreferenz zu versehen. Wissenschaftsverlage, fördernde Einrichtungen, Open Science-Portale und Dienste wie Dimensions, Crossref, OpenAlex und Projektverzeichnisse setzen GRID zur Vereinheitlichung von Affiliationsdaten, zur Dublettenprüfung und zur Institutionenanalyse ein.
Konkret bedeutet dies beispielsweise:
- Automatisierte Zuordnung von Publikationen zu Einrichtungen in Forschungsportalen
- Anreicherung und Verknüpfung von Autorenprofilen über die Angabe einer exakten Organisation
- Institutionelle Performance-Analysen und Berichtswesen
- Abbildung und Nachverfolgung von geografischen und historischen Organisationsbezügen
GRID im Kontext von Informationsmanagement und Forschungsmanagement
GRID unterstützt die Harmonisierung von Stammdaten über nationale Grenzen hinweg und erleichtert typische Use Cases wie Bestandsmigration, Altbestandsbereinigung, Erweiterung bestehender Normdatensysteme und Zusammenführung von Quellen aus heterogenen Systemen - ein zentrales Anliegen moderner Informationsmanagement-Strategien.
Migration von GRID zu ROR und Mappings
Seit Abschluss der GRID-Weiterentwicklung ist die Migration auf ROR als neuen Standard etabliert. ROR nutzt die letzten GRID-Daten als Basis und entwickelt sie weiter. Mapping-Tabellen, die von ROR gepflegt und bereitgestellt werden, ermöglichen die Überführung historischer GRID-IDs in aktuelle ROR-IDs. Diese Mappings sind entscheidend, um Datenkonsistenz und -nachnutzbarkeit zu sichern, insbesondere bei der Integration in bestehende Softwarelandschaften oder Forschungsdatenbanken.
Technisch erfolgt die Migration durch die Einbindung der jeweils aktuellen Mapping-Dateien in Datenimporte und Abgleiche. Automatisierte Schnittstellen, soweit vorhanden, können CSV- und JSON-Formate nutzen. Eine vollautomatische, bidirektionale Konvertierung aller Organisationskennungen existiert jedoch nicht; insbesondere zwischen GRID, ROR, ISNI, Ringgold oder VIAF liegen teilweise Mapping-Tabellen, aber keine echte Datensynchronisation vor.
Integration und Bedeutung im Bibliotheksmanagement
Die Nutzung von GRID-IDs in Bibliotheksmanagement- und Forschungsinformationssystemen ermöglichte die exakte Verknüpfung von Publikationen, Projekten, Forschungsdaten und Institutionen. Dies verbessert die Qualität der Metadatenerfassung und unterstützt differenzierte Recherche- und Analyseprozesse. Noch heute bleiben GRID-IDs als Referenz und für die Nachnutzung historischer Bestände bedeutsam, insbesondere im Rahmen von Datenmigrationen oder bei der Pflege von Langzeitarchiven.
Mit dem Fokus auf ROR für alles Neuentwicklung empfiehlt es sich weiterhin, Mapping-Tabellen zur Übertragung bestehender GRID-Einträge zu nutzen. Gerade im internationalen Publikationsmanagement, im Normdatenabgleich und bei Interoperabilitätsprojekten bieten GRID und ROR einen bedeutenden gemeinsamen Grundstock.
Praktische Hinweise zur Nutzung von GRID-IDs und Migration
- Verwenden Sie für Ihre Anwendungen stets das finale GRID-Release, da keine weiteren Aktualisierungen erfolgen.
- Planen Sie die Migration laufender Systeme auf ROR frühzeitig und binden Sie die aktuellen Mapping-Tabellen in Ihre Prozesse ein.
- Berücksichtigen Sie die parallele Nutzung von GRID-, ROR-, ISNI- und anderen Identifikatoren, um die Datenqualität in lokalen und internationalen Anwendungen zu steigern.
- Importieren Sie GRID-Daten bei Bedarf im CSV- oder JSON-Format, automatisierte Importe unterstützen eine effiziente Datenintegration.
- Schulen Sie Ihr Team gezielt im Umgang mit Organisationskennungen, um Fehler im Metadatenmanagement zu vermeiden.
- Überprüfen Sie regelmäßig Ihren Datenbestand auf Dubletten und Inkonsistenzen.
- Nutzen Sie die Namensvarianten in GRID für mehrsprachige und regionale Suchszenarien.
Herausforderungen und Fehlerquellen bei der Arbeit mit GRID
- Alte, nicht aktualisierte GRID-Daten können zu Fehlreferenzen führen. Prüfen Sie Alternativen und setzen Sie für Neuprojekte auf ROR.
- Die Abgrenzung zwischen verschiedenen Identifikatorsystemen wie GRID, ROR, ISNI, Ringgold, VIAF oder Wikidata erfordert genaue Planung.
- Die Migration von GRID zu anderen Systemen ist komplex und muss manuell oder durch Mappings gepflegt werden - eine vollautomatische Konvertierung existiert nicht.
- Dezentrale Datenpflege kann widersprüchliche oder doppelte Einträge verursachen.
- Bei Neuentwicklungen empfiehlt sich der direkte Einsatz von ROR, wobei GRID für Altbestände und Mappings weiter eine wichtige Rolle spielen kann.
Vergleich: GRID und weitere Organisationenkennzeichen
Übersicht zu Anwendungsbeispielen
- Forschungsportale: GRID-IDs dienen dem Matching und der Zusammenführung institutioneller Metadaten beim Import wissenschaftlicher Publikationen.
- Repositorien: Institutionen werden exakter zugeordnet, was die Verwaltung von Sammlungen, Digitalisaten und Forschungsdaten erleichtert.
- Publikationsanalysen: Automatisierte Berichte über Publikationsleistung und institutionelle Forschungsaktivitäten nutzen GRID als Basis für Vergleich und Aggregation.
- Förder- und Antragssysteme: Eindeutige Organisationskennungen helfen, Einreichungen und Mittelvergabe eindeutig zuordnen zu können.
- Wissenschaftliche Suchdienste: GRID erleichtert die Dublettenprüfung und verbessert Suchergebnisse bei institutioneller Recherche.
Werkzeuge und Softwareunterstützung
Eine Vielzahl von freien und kommerziellen Softwareprodukten ermöglicht die Verarbeitung und Integration von GRID und ROR:
- Forschungsinformationssysteme
- Datenplattformen wie OpenAlex
- Bibliotheken und Tools für Python, R oder Java, die CSV/JSON-Importe, Mapping und Abfrage erlauben
- Direktintegration in Services wie Crossref, DataCite, ORCID und OpenAIRE
GRID/ROR in internationalen Forschungsinfrastrukturen
GRID und seine Nachfolger spielen in zentralen Forschungsinfrastrukturen eine Schlüsselrolle:
- Crossref nutzt GRID/ROR zur Institutionenerkennung in Metadaten und Publikationen.
- DataCite setzt ROR-IDs bei Forschungsdatenveröffentlichungen ein.
- ORCID integriert Organisationskennungen zur besseren Verknüpfung von Autoren und Einrichtungen.
- OpenAIRE verwendet GRID- und ROR-Daten für Förder- und Projektdaten.
Persistenz und Zitierfähigkeit von GRID
Jede GRID-ID ist persistierend und kann dauerhaft als Referenz genutzt werden. Die einzelnen Einträge sind über stabile URLs im GRID-Verzeichnis auffindbar. Es empfiehlt sich bei Zitation oder Datenverarbeitung immer auf die exakte GRID-ID samt Datenstandsangabe zu verweisen.
Lessons Learned: Übergang von GRID zu ROR
Die Entwicklung von GRID und der Übergang zu ROR zeigen:
- Offene, standardisierte Identifikatoren fördern Interoperabilität und verhindern Datensilos.
- Eine offene Lizenzierung (CC0) ermöglicht nachhaltige Nachnutzbarkeit.
- Der Community-Fokus von ROR erhöht Aktualität und Vielfalt im internationalen Datenbestand.
- Nachhaltige Mappings und Versionierung gewähren Bestandsschutz bestehender Daten und Investitionen
Häufige Fragen zur Global Research Identifier Database (GRID)
Was ist eine GRID-ID, und wie ist sie aufgebaut?
Eine GRID-ID ist eine weltweit eindeutige Kennung für Forschungseinrichtungen. Sie besteht aus dem Präfix „grid.“, gefolgt von einer Zahlen- oder Buchstabenkombination, beispielsweise grid.12345.1 oder grid.0ab12.c. Es gibt keine Prüfziffer.
Wer verantwortete GRID, und warum wurde das Projekt eingestellt?
GRID wurde von Digital Science, einem Unternehmen der Holtzbrinck Publishing Group, betrieben. Die Einstellung zum Dezember 2021 erfolgte zugunsten der von der Community gesteuerten Nachfolgerin ROR, die offener und nachhaltiger fortentwickelt wird.
Wie darf ich GRID-Daten verwenden?
GRID-Daten sind als Open Data unter der CC0-Lizenz veröffentlicht und können frei, ohne Einschränkungen und auch kommerziell weiterverwendet werden - unter Einhaltung der geltenden Datenschutzvorschriften.
In welchen Formaten kann ich GRID-Daten herunterladen?
Die final veröffentlichten GRID-Daten stehen im CSV- und JSON-Format im öffentlichen GitHub-Archiv von Digital Science zur Verfügung.
Was mache ich mit bestehenden GRID-IDs in meinen Systemen?
Nutzen Sie die von ROR bereitgestellten Mapping-Tabellen, um bestehende GRID-IDs auf aktuelle ROR-IDs zu übertragen. Belassen Sie GRID-IDs als Referenz in Ihren Datenbanken, wenn dies für Langzeitarchivierung, historische Analysen und Rückverfolgbarkeit erforderlich ist.
Wie verhalten sich GRID und andere Organisationenkennungen wie ROR, ISNI, Ringgold und VIAF?
GRID bietet offene Referenz-IDs für Forschungseinrichtungen. ROR bildet als Community-Standard die Weiterentwicklung von GRID. ISNI, Ringgold oder VIAF decken darüber hinaus weitere Organisationstypen oder Personen ab und können ergänzend genutzt werden. Teilweise bestehen Mapping-Tabellen, aber keine vollständige Synchronisation oder technische Integration.
Welche Bedeutung hat GRID heute noch im Informationsmanagement?
Auch wenn keine Weiterentwicklung mehr erfolgt, ist GRID als stabile Referenz für den Bestandsschutz, Migrationsstrategien und für die Historisierung in Bibliotheksmanagement- und Forschungsinformationssystemen weiterhin wichtig. Neue Projekte sollten jedoch vorzugsweise ROR nutzen.
Gibt es nach 2021 noch Communityunterstützung oder Pflege für GRID?
Die Entwicklung und Pflege der Datensätze ist abgeschlossen. Dennoch stellen ROR, OpenAlex und weitere Plattformen Mapping-Tabellen und historische Snapshots bereit. Die Community betreut Archivrepositories zur Sicherung der Weiterverwendbarkeit.
Gibt es rechtliche Einschränkungen bei der Nutzung von GRID-Daten trotz CC0?
GRID-Daten sind grundsätzlich frei von Urheberrechten im Sinne der CC0-Lizenz. Dennoch sollten Sie bei der Verarbeitung personenbezogener oder sensibler Organisationsdaten stets die jeweiligen Datenschutz- und Schutzrechtsbestimmungen beachten.
Wie persistent und zitierfähig sind GRID-IDs?
GRID-IDs sind dauerhaft und ändern sich nicht. Für eine zuverlässige Zitierung geben Sie bitte immer die konkrete GRID-ID und idealerweise den Stand des GRID-Datensatzes (z. B. Dezember 2021) an.