Wikidata

Wikidata ist eine offene, strukturierte Wissensdatenbank, die darauf spezialisiert ist, maschinenlesbare und standardisierte Daten zu einer Vielzahl von Themen bereitzustellen.

Produkt:
Bibliotheksmanagement

Seit 2012 als internationales Projekt der Wikimedia Foundation gestartet, wird Wikidata von Wikimedia Deutschland maßgeblich mitentwickelt und von einer internationalen Community betreut und weiter verbessert. Wikidata dient als universelle Datenquelle für zahlreiche Wikimedia-Projekte - unter anderem Wikipedia, Wikimedia Commons und Wikivoyage - und ist auch in externen Informationssystemen weit verbreitet.

Die Plattform hält Daten zu Personen, Organisationen, Orten, Werken, Ereignissen und weiteren Entitäten bereit und hat das Ziel, Daten weltweit strukturiert und in mehreren Sprachen zugänglich zu machen. Im Gegensatz zu Enzyklopädien oder klassischen Textsammlungen arbeitet Wikidata mit maschinenlesbaren Einträgen, sogenannten Items. Neben strukturierten Fakten speichert Wikidata zudem Labels, Beschreibungen und Aliasse als Freitextelemente für die menschliche Lesbarkeit.

Jedes Item besteht aus einzelnen Aussagen („Statements“), die aus einer Eigenschaft („Property“) und einem Wert („Value“) gebildet werden. Einträge erhalten eine eindeutige Identifikationsnummer, die Q-Nummer. Eigenschaften werden mit sogenannten P-Nummern ausgezeichnet. Aussagen lassen sich mit Qualifiern ergänzen und können - sofern vorhanden - auf Quellen („References“) verweisen.

Durch diese klare Strukturierung können sowohl Menschen als auch Softwareanwendungen Daten einfach lesen, analysieren und miteinander verknüpfen.

Zentrale Begriffe und Aufbau von Wikidata

Für die effektive Nutzung von Wikidata ist das Verständnis der zentralen Begriffe wichtig:

  • Item (Eintrag): Eindeutig identifizierter Datensatz mit einer Q-Nummer. Beschreibt einen konkreten Begriff oder Gegenstand, zum Beispiel eine Person, ein Werk oder einen Ort.
  • Property (Eigenschaft): Attribut, das durch eine P-Nummer gekennzeichnet ist und bestimmte Merkmale von Items beschreibt, wie Geburtsdatum, Autor oder ISBN.
  • Statement (Aussage): Grundeinheit der Information; besteht aus einer Property und einem Wert, beispielsweise „Geburtsdatum: 1975“.
  • Value (Wert): Konkreter Inhalt einer Aussage, etwa ein Datum, eine andere Q-Nummer oder ein Textstring.
  • Qualifier: Ergänzende Angaben wie Zeiträume oder Umstände, die eine Aussage präzisieren.
  • Reference (Quelle): Verweis auf den Ursprung oder Nachweis einer Aussage. Quellenangaben sind für viele hochwertige Daten wünschenswert, aber nicht bei allen Daten vorhanden.
  • Sitelink: Verknüpfung eines Wikidata-Items mit einem Artikel in einem anderen Wikimedia-Projekt, z. B. mit Wikipedia auf Deutsch, Englisch oder weiteren Sprachen.

Viele Angaben in Wikidata können durch Referenzen abgestützt werden, allerdings sind bei Massenimporten oder älteren Datensätzen Quellen oft nur lückenhaft oder fehlen ganz. Die Community empfiehlt Quellenangaben und setzt sie vor allem bei kontroversen oder wissenschaftlich relevanten Aussagen voraus.

Ein weiteres zentrales Konzept ist die Hierarchiebildung über „Instanz von“ (P31): Über diese Property werden Items bestimmten Klassen zugeordnet, was die Typisierung und Datenmodellierung erleichtert (z. B. Item X ist Instanz von Person oder wissenschaftlichem Werk).

Das Datenmodell von Wikidata

Wikidata basiert auf einem vereinfachten, flexiblen Datenmodell, das sogenannten Tripel: Subjekt - Prädikat - Objekt. Das Subjekt entspricht dem Item (beispielsweise eine Person), das Prädikat der Property (wie das Geburtsdatum), das Objekt dem Wert (z. B. ein Datum oder eine andere Instanz). So lassen sich komplexe Netzwerke von Entitäten und deren Beziehungen modellieren.

Im Unterschied zu klassischen relationalen Datenbanken erlaubt Wikidata die Mehrfachzuweisung von Eigenschaften und die Speicherung unterschiedlicher Quellen und Qualifier zu einzelnen Aussagen.

Historische Entwicklung und Meilensteine von Wikidata

Wikidata wurde im Oktober 2012 offiziell gestartet. Zu den wichtigsten Meilensteinen gehören die Einbindung von Sitelinks als zentrale Brücke zu Wikimedia-Projekten (2013), die Integration externer Normdatenkennungen (ab 2014), das breite Engagement von Kultureinrichtungen (GLAM) und die Einführung des Wikidata Query Service (SPARQL-Endpunkt) für komplexe Datenabfragen (2015). Seitdem wächst Wikidata rasant - sowohl im Umfang der gespeicherten Items als auch in der Zahl der unterstützten Sprachen und vernetzten Anwendungen.

Technische Schnittstellen und Werkzeuge

Wikidata bietet verschiedene Möglichkeiten zur Einbindung in eigene Systeme:

  • MediaWiki-API: Hauptschnittstelle für Les- und Schreibzugriffe sowie für Abfragen.
  • Wikidata Query Service (SPARQL): Für komplexe, semantische Datenabfragen; unterstützt Analysen und Datenexport.
  • OpenRefine: Open-Source-Tool für Datenbereinigung, Abgleich und Datenimport; besonders hilfreich für das Mapping eigener Bestände auf Wikidata.
  • Mix’n’Match: Webwerkzeug für die Zuordnung und das Matching externer Identifikatoren (z. B. von Bibliothekskatalogen, Authority Files) zu Wikidata-Items.
  • Wikibase: Die Open-Source-Software hinter Wikidata; sie kann von Dritten verwendet werden, um eigene Wissensdatenbanken nach Wikidata-Prinzipien aufzubauen.
  • Weitere Plugins: Spezielle Schnittstellen bestehen für viele Informationsmanagementsysteme (z. B. Koha, Alma, VuFind), um Wikidata zu integrieren.

Zu beachten ist: Das OAI-PMH-Protokoll wird von Wikidata selbst nicht angeboten, kann aber über Drittanbieter-Schnittstellen genutzt werden.

Beispiele für die Nutzung von Wikidata innerhalb von Wikimedia-Projekten

Wikipedia-Artikel nutzen Wikidata für Infoboxen, Statistikangaben und strukturierte Hintergrunddaten. Wikimedia Commons bezieht Metadaten zu Künstlern, Orten oder Lizenzen. Wikivoyage bindet geografische Koordinaten oder Sehenswürdigkeiten automatisiert über Wikidata ein. Diese zentrale Rolle steigert die Konsistenz und Aktualität über verschiedene Projekte hinweg.

Rolle von Wikidata im Informationsmanagement

Für Bibliotheken, Forschungseinrichtungen, Parlamente oder Unternehmen, die auf moderne Informationsmanagementsysteme setzen, bietet Wikidata vielseitige Vorteile. Metadaten zu Autoren, Organisationen, Werken, Normdaten, Gesetzgebungsverfahren und weiteren Entitäten können zentral gepflegt und flexibel genutzt werden.

Die Integration von Wikidata fördert die eindeutige Identifikation von Personen, Themen oder Werken, unterstützt die effiziente Pflege und Verlinkung und bietet Zugang zu internationalen, mehrsprachigen Datenstandards. Mit der Verknüpfung externer Identifier wie GND, VIAF, ISNI, Library of Congress und ORCID gewinnen Systeme für Bibliotheksmanagement, Forschungsinformationssysteme, Parlamentsdokumentation, Normdatenmanagement und Datenanreicherung zusätzliche Qualität und Tiefe.

Vielfältige Relationen und die Mehrsprachigkeit ermöglichen es, Kataloge und Rechercheportale global anschlussfähig aufzubauen und eigene Bestände mit offen lizenzierten Daten sinnvoll anzureichern. Auch im Bereich Open Science und FAIR Data wächst die Nutzung von Wikidata als Referenzquelle und Datenhub.

Vorteile der Nutzung von Wikidata

  • Zentralisierte, aktuelle Wissensbasis: Durch eine international gepflegte Plattform können Daten aus unterschiedlichen Bereichen zentral abgerufen werden. Die laufende Wartung bleibt dennoch erforderlich.
  • Eindeutige Identifikatoren und standardisierte Properties: Die Q- und P-Nummern erleichtern die Verknüpfung und Zuordnung, auch systemübergreifend.
  • Flexible Datenaktualisierung: Über APIs, Mapping-Tools und Plugins lassen sich Änderungen automatisiert oder halbautomatisch nachvollziehen. Die Erstintegration und fortlaufende Qualitätssicherung erfordern je nach Anwendung einen gewissen Aufwand.
  • Mehrsprachigkeit: Wikidata unterstützt Dutzende Sprachen mit Labels und Beschreibungen, was mehrsprachige Kataloge und Suchportale ermöglicht.
  • Erweiterte Recherche: Strukturierte Daten und vielfältige Relationen eröffnen neue Möglichkeiten für Empfehlungen, Analysen und Sammlungen.
  • Unterstützung von Open Science und Linked Data: Wikidata steht unter der möglichst offenen CC0-Lizenz, erlaubt den freien (auch kommerziellen) Zugang und ist zentrales Bindeglied des Semantic Web.
  • Förderung der Zusammenarbeit: Offene, kollaborativ gepflegte Daten fördern die Vernetzung zwischen Sektoren, Ländern und Institutionen, zum Beispiel im GLAM-Bereich.
  • Qualitätssicherung und Transparenz: Durch Referenzen und Community-Governance werden Datenlaufend überprüft, wobei in der Praxis Unterschiedlichkeiten in der Verlässlichkeit bestehen.

Diese Eigenschaften machen Wikidata zu einem wichtigen Instrument für das digitale Informationsmanagement in verschiedensten Branchen.

Herausforderungen und Besonderheiten bei Wikidata

Mehrere Aspekte sind beim Umgang mit Wikidata zu beachten:

  • Strukturvielfalt: Wikidata besitzt ein eigenes Datenmodell und eine Ontologie, die sich von Bibliotheksnormdaten (wie MARC oder GND) unterscheidet. Das Mapping kann daher aufwendig sein.
  • Datenqualität und Vandalismus: Da grundsätzlich jeder beisteuern kann, gibt es gelegentlich Vandalismus, fehlerhafte Massenbearbeitungen oder Inkonsistenzen. Die Community überwacht Änderungen mit Hilfe von QS-Tools, Bots und manuellen Prüfungen.
  • Referenzen und Nachvollziehbarkeit: Nicht alle Aussagen sind belegt; Quellen werden vor allem für kritische oder wissenschaftlich relevante Angaben gefordert.
  • Lizenz und Datennutzung: Öffentlich unter CC0 stehende Wikidata-Inhalte dürfen weiterverarbeitet werden. Wurden jedoch Daten aus externen, eingeschränkt lizenzierten Quellen importiert (was gegen die Regeln verstößt), können Rechte Dritter verletzt sein. Prüfen Sie bei der Nutzung und Weiterverwendung stets die Herkunft der Daten.
  • Vollständigkeit und Diversität: Die Abdeckung einzelner Fachgebiete und Regionen ist unterschiedlich detailliert. Eigene Recherchen und ergänzende Datenpflege sind ratsam.
  • Technische Integration: Die Wahl und Implementierung passender Schnittstellen (APIs, Mapping-Tools) variiert je nach System. Automatisierungsgrad und Pflegeaufwand hängen von der lokalen IT-Infrastruktur ab.
  • Datenschutz und Ethik: Bei personenbezogenen Daten gelten Grundsätze der Datenminimierung und Datenschutzgesetze. Für lebende Personen sind besonders sensible Angaben nur in zulässigem Rahmen eingepflegt, für Verstorbene gelten gelockerte Regeln.
  • Mehrsprachigkeit und Übersetzungsprozesse: Die Pflege mehrsprachiger Daten verlangt solide Übersetzungen und laufende Qualitätssicherung.
  • Governance- und Moderationsprozesse: Die Wikidata-Community trifft Entscheidungen zu neuen Properties oder Problemfällen im Konsensverfahren, über Diskussionsseiten oder interne Abstimmungsmechanismen.

Zu den externen Identifiern, die häufig in Wikidata eingebettet sind, zählen GND (Gemeinsame Normdatei), VIAF (Virtual International Authority File), ISNI (International Standard Name Identifier), Library of Congress Control Number und ORCID (Open Researcher and Contributor ID).

Wikibase als Grundlage für eigene Wissensdatenbanken

Wikibase ist die Open-Source-Software hinter Wikidata. Sie erlaubt es Bibliotheken, Forschungseinrichtungen, Unternehmen oder Gedächtnisinstitutionen, eigene strukturierte Wissensdatenbanken im Wikidata-Stil zu betreiben - etwa für interne Forschungsdaten, Sammlungsmanagement oder branchenspezifische Knowledge Hubs.

Typische Qualitätsprobleme und deren Handhabung

Häufige Herausforderungen sind Vandalismus, Dubletten, unvollständige Daten, veraltete Einträge und Massenimporte ohne ausreichende Kontrolle. Die Community begegnet diesen Problemen durch Meldeprozesse, Monitoring-Werkzeuge (z. B. Recent Changes, Filter), Qualitätssicherungsprojekte und gezielte Moderation durch Fachanwender.

Zukunftsperspektiven von Wikidata

In den kommenden Jahren fokussiert Wikidata die Ausweitung auf neue Bereiche, die Qualitätssicherung durch bessere Werkzeuge, die Steigerung der Datenvielfalt und die noch stärkere Automatisierung von Datenpflege und Übersetzungen. Die Rolle im Semantic Web, für Open Science und als zuverlässiger Referenzpunkt für globale Informationsflüsse wird weiter wachsen.

Rechtliche Hinweise und Governance

Die transparente Mitwirkung an Wikidata und die gemeinsame Entscheidungsfindung werden durch Community-Richtlinien, rollenbasierte Rechtevergabe und offene Diskussionsprozesse gewährleistet. Massenbearbeitungen (etwa mit Bots) sind ausdrücklich genehmigungspflichtig und werden gesondert reguliert und kontrolliert.

Beim Umgang mit personenbezogenen Daten ist auf Datenschutz und Datenminimierung zu achten. Für die Weiterverwendung von Daten aus Wikidata gilt: Es dürfen keine urheberrechtlich geschützten oder nicht-kompatiblen Inhalte importiert oder verbreitet werden.

Häufige Fragen zu Wikidata

Was ist der Unterschied zwischen Wikidata und Wikipedia?

Wikipedia stellt Wissen in Artikeln und Fließtexten bereit. Wikidata repräsentiert Fakten, Relationen und Identifikatoren in strukturierter, maschinen- und menschenlesbarer Form. Wikidata dient als vernetztes Hintergrundsystem, während Wikipedia vor allem für menschliches Lesen vorgesehen ist.

Kann ich Wikidata-Daten uneingeschränkt nutzen?

Originäre Inhalte von Wikidata stehen unter der CC0-Lizenz und können frei - sowohl kommerziell als auch nicht-kommerziell - verwendet werden. Es besteht jedoch ein Risiko, dass vereinzelt Informationen aus externen, nicht kompatibel lizenzierten Quellen übernommen wurden. Prüfen Sie bei sensiblen Fällen die Herkunft der Daten.

Wie kann ich Wikidata in mein Informationsmanagementsystem einbinden?

Viele moderne Informationssysteme bieten Integrationsmöglichkeiten über die MediaWiki-API, den Wikidata Query Service (SPARQL), Plugins oder Mapping-Tools wie OpenRefine. Prüfen Sie die technischen Optionen Ihrer Software. Auch GLOMAS kann passende Anbindungen konfigurieren.

Enthält Wikidata alle für mein Fachgebiet relevanten Informationen?

Wikidata wächst stetig und deckt viele Bereiche ab. Dennoch können Informationen in einzelnen Fächern, Regionen oder Sachgebieten lückenhaft sein. Eigene Ergänzungen durch qualifizierte Nutzer sind ausdrücklich erwünscht und verbessern die Datenqualität.

Wie wird die Qualität der Wikidata-Daten gesichert?

Die Qualität wird durch Community-Prüfungen, Quellenverweise, Diskussions- und Meldeprozesse, sowie durch spezielle Qualitätssicherungs-Tools unterstützt. Definitive Gewähr für vollständige Richtigkeit besteht nicht; regelmäßige Kontrollen werden empfohlen.

Wer kann wie zu Wikidata beitragen?

Grundsätzlich kann jede Person Einträge pflegen, ändern oder neu anlegen, darunter auch Bibliotheken, Forschungseinrichtungen und Unternehmen. Für Massenbearbeitungen mit automatisierten Tools (Bots) sind gesonderte Genehmigungen („Bot Flags“) erforderlich.

Wie funktioniert Mehrsprachigkeit in Wikidata?

Jedes Item kann Labels, Beschreibungen und Aliasse in zahlreichen Sprachen beinhalten. Das unterstützt die Nutzung in mehrsprachigen Anwendungen, Katalogen und Portalen und fördert die internationale Zusammenarbeit.

Welche API-Schnittstellen bietet Wikidata?

Die wichtigsten Schnittstellen sind die MediaWiki-API für Datenaustausch und der SPARQL-basierte Wikidata Query Service für komplexe Abfragen. Über diese APIs können Daten exportiert, analysiert und verknüpft werden.

Was ist das Wikidata-Datenmodell?

Das Datenmodell orientiert sich am Prinzip der Tripel (Subjekt - Prädikat - Objekt) und eignet sich ideal für Verknüpfungen im Semantic Web. Das Modell erlaubt Mehrfachzuweisungen, Quellen und Qualifier je Aussage und unterscheidet sich so von klassischen relationalen Datenbanken.

Was ist die Rolle von Wikidata im Semantic Web?

Wikidata ist ein zentrales Element im Netzwerk von Linked Open Data. Seine offenen Struktur und standardisierten Identifikatoren ermöglichen es, Daten systemübergreifend für Forschung, Statistik und Innovation zu verknüpfen.

Was ist Wikibase und wie kann ich sie nutzen?

Wikibase ist die frei verfügbare Software hinter Wikidata. Sie können Wikibase für eigene Projekte - etwa für branchenspezifische Wissensdatenbanken - einsetzen und nach Bedarf lokal oder im Web betreiben.

Welche Herausforderungen gibt es bei der Nutzung von Wikidata?

Zu typischen Problemen zählen Dateninkonsistenzen, fehlende Quellen, Vandalismus, technische Hürden bei der Integration und eine unterschiedliche Dichte an Fachinformationen je Bereich. Die aktive Mitarbeit qualifizierter Fachleute ist wichtig, um diese Herausforderungen zu meistern.

Inhaltsverzeichnis