Digital resources in the Social Sciences and Humanities OpenEdition Our platforms OpenEdition Books OpenEdition Journals Hypotheses Calenda Libraries OpenEdition Freemium Follow us

Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025

Als Stefaan Verhulst auf der Bühne stand und von einem drohenden „data winter“ sprach, war es im Saal plötzlich still. Die Vorstellung, dass offene Daten bald Mangelware sein könnten, ließ viele aufhorchen. Auf der ENDORSE 2025 wurde klar: Die Zukunft gehört nicht nur offenen, sondern kuratierten, AI-ready Daten – und das betrifft auch die Geisteswissenschaften.

Logo Endorse

Am 8. und 9. Oktober 2025 brachte die dritte Ausgabe der European Data Conference on Reference Data and Semantics (ENDORSE) in Brüssel Fachleute aus öffentlichen Institutionen, Forschungseinrichtungen und der Industrie zusammen, um Themen rund um semantische Interoperabilität und Wissensmanagement zu diskutieren. Im Mittelpunkt stand in diesem Jahr die Frage, wie Künstliche Intelligenz die Landschaft von Referenzdaten und Semantik verändert, insbesondere vor dem Hintergrund des neuen Artificial Intelligence Acts.

Ein Höhepunkt der Konferenz war die Keynote von Stefaan Verhulst (Mitbegründer von The GovLab, USA, und The DataTank, Belgien) zum Thema „The Future of Data Stewardship“. Verhulst warnte vor einem sich abzeichnenden „data winter“, da der Zugang zu Daten aus staatlichen Institutionen, Plattformen und Forschungseinrichtungen zunehmend eingeschränkt werde. Grund dafür sei eine wachsende „AI anxiety“, also die Befürchtung, dass Daten für das Training von Sprachmodellen verwendet werden, ohne dass die Daten-Community eine faire Gegenleistung erhält. Dies führt aktuell zu einem deutlichen Rückgang offener Datenzugänge.

Die Diskussion machte deutlich, dass sich das Verständnis von Data Stewardship im Wandel befindet: Weg vom bloßen Bereitstellen offener Datensätze, hin zur Kuratierung von AI-ready Daten, die durch Verlinkungen und reichhaltige Annotationen auf spezifische Nutzungsbedürfnisse zugeschnitten sind. Data Stewards sollten künftig die Zugangsbedingungen klar definieren und als Vermittlungspersonen zwischen Datenanbietenden und -nutzenden agieren. Dieses Konzept wurde im vorgeschlagenen FAIR-R [ˈfɛrər] Rahmen („FAIR and Ready for AI“) zusammengefasst.

Während viele der Sessions rechtliche Daten und semantische Schemata aus dem Justizbereich und der EU-Sphäre behandelten, zeigte eine eigene Session zu Kulturdaten, dass die zugrunde liegenden Fragen und Methoden der Konferenz für die Geisteswissenschaften gleichermaßen relevant sind. In diesem Zusammenhang stellten Thora Hagen und Andreas Witt (Leibniz-Institut für Deutsche Sprache und NFDI-Konsortium Text+) das DataGEMS-Projekt vor, eine von der European Open Science Cloud geförderte Dateninfrastrukturinitiative. Anhand des Use Case historische Enzyklopädien zeigten sie auf, wie sich kulturell relevante Textkorpora durch semantische Verknüpfung erschließen lassen. Durch die Anbindung der Enzyklopädieeinträge an Wikidata wurde sichtbar, wie sich thematische Interessen und Schwerpunkte im Laufe des 19. Jahrhunderts verschoben haben.

Logos und Graphik: eosc und DataGeMS

Viele der in der Keynote angesprochenen Themen, etwa der Aufruf zu nutzungszentriertem Datenmanagement, die Entwicklung anwendungsspezifischer Pilotprojekte und der Übergang von isolierten Datensätzen zu Wissensgraphen, gehören zu den zentralen Anliegen von DataGEMS. Das Projekt zeigt, wie durch semantische Verknüpfung und interdisziplinäre Interoperabilität Daten unterschiedlichster Art in vernetzte, abfragbare Wissensräume transformiert werden können. Die Plattform wird von Beginn an stark durch spezifische Use Cases und deren Interessen geprägt und trägt somit aktiv zur Umsetzung der FAIR-R-Vision bei.

Insgesamt wurde deutlich, dass verlinkte Datenstrukturen wie Wissensgraphen, große Sprachmodelle und Wissensmanagement zunehmend ineinandergreifen – und das nicht nur in der Forschung. Der intensive Austausch zwischen den Disziplinen, wie er zum Beispiel in den bis zur letzten Minute gefüllten Q&A-Slots nach den Vorträgen stattfand, unterstrich das große Interesse und den Bedarf an gemeinsamer Weiterentwicklung in diesem Feld. Einer nächsten Ausgabe der Konferenz darf daher mit großen Erwartungen entgegengesehen werden.


OpenEdition schlägt Ihnen vor, diesen Beitrag wie folgt zu zitieren:
Thora Hagen (17. Oktober 2025). Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025. Text+ Blog. Abgerufen am 3. April 2026 von https://doi.org/10.58079/14z7f


Das könnte dich auch interessieren …

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

This site uses Akismet to reduce spam. Learn how your comment data is processed.