doi:10.58079/14z7f

Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025

von Thora Hagen · 17/10/2025

Als Stefaan Verhulst auf der Bühne stand und von einem drohenden „data winter“ sprach, war es im Saal plötzlich still. Die Vorstellung, dass offene Daten bald Mangelware sein könnten, ließ viele aufhorchen. Auf der ENDORSE 2025 wurde klar: Die Zukunft gehört nicht nur offenen, sondern kuratierten, AI-ready Daten – und das betrifft auch die Geisteswissenschaften.

Am 8. und 9. Oktober 2025 brachte die dritte Ausgabe der European Data Conference on Reference Data and Semantics (ENDORSE) in Brüssel Fachleute aus öffentlichen Institutionen, Forschungseinrichtungen und der Industrie zusammen, um Themen rund um semantische Interoperabilität und Wissensmanagement zu diskutieren. Im Mittelpunkt stand in diesem Jahr die Frage, wie Künstliche Intelligenz die Landschaft von Referenzdaten und Semantik verändert, insbesondere vor dem Hintergrund des neuen Artificial Intelligence Acts.

Ein Höhepunkt der Konferenz war die Keynote von Stefaan Verhulst (Mitbegründer von The GovLab, USA, und The DataTank, Belgien) zum Thema „The Future of Data Stewardship“. Verhulst warnte vor einem sich abzeichnenden „data winter“, da der Zugang zu Daten aus staatlichen Institutionen, Plattformen und Forschungseinrichtungen zunehmend eingeschränkt werde. Grund dafür sei eine wachsende „AI anxiety“, also die Befürchtung, dass Daten für das Training von Sprachmodellen verwendet werden, ohne dass die Daten-Community eine faire Gegenleistung erhält. Dies führt aktuell zu einem deutlichen Rückgang offener Datenzugänge.

Die Diskussion machte deutlich, dass sich das Verständnis von Data Stewardship im Wandel befindet: Weg vom bloßen Bereitstellen offener Datensätze, hin zur Kuratierung von AI-ready Daten, die durch Verlinkungen und reichhaltige Annotationen auf spezifische Nutzungsbedürfnisse zugeschnitten sind. Data Stewards sollten künftig die Zugangsbedingungen klar definieren und als Vermittlungspersonen zwischen Datenanbietenden und -nutzenden agieren. Dieses Konzept wurde im vorgeschlagenen FAIR-R [ˈfɛrər] Rahmen („FAIR and Ready for AI“) zusammengefasst.

Während viele der Sessions rechtliche Daten und semantische Schemata aus dem Justizbereich und der EU-Sphäre behandelten, zeigte eine eigene Session zu Kulturdaten, dass die zugrunde liegenden Fragen und Methoden der Konferenz für die Geisteswissenschaften gleichermaßen relevant sind. In diesem Zusammenhang stellten Thora Hagen und Andreas Witt (Leibniz-Institut für Deutsche Sprache und NFDI-Konsortium Text+) das DataGEMS-Projekt vor, eine von der European Open Science Cloud geförderte Dateninfrastrukturinitiative. Anhand des Use Case historische Enzyklopädien zeigten sie auf, wie sich kulturell relevante Textkorpora durch semantische Verknüpfung erschließen lassen. Durch die Anbindung der Enzyklopädieeinträge an Wikidata wurde sichtbar, wie sich thematische Interessen und Schwerpunkte im Laufe des 19. Jahrhunderts verschoben haben.

Viele der in der Keynote angesprochenen Themen, etwa der Aufruf zu nutzungszentriertem Datenmanagement, die Entwicklung anwendungsspezifischer Pilotprojekte und der Übergang von isolierten Datensätzen zu Wissensgraphen, gehören zu den zentralen Anliegen von DataGEMS. Das Projekt zeigt, wie durch semantische Verknüpfung und interdisziplinäre Interoperabilität Daten unterschiedlichster Art in vernetzte, abfragbare Wissensräume transformiert werden können. Die Plattform wird von Beginn an stark durch spezifische Use Cases und deren Interessen geprägt und trägt somit aktiv zur Umsetzung der FAIR-R-Vision bei.

Insgesamt wurde deutlich, dass verlinkte Datenstrukturen wie Wissensgraphen, große Sprachmodelle und Wissensmanagement zunehmend ineinandergreifen – und das nicht nur in der Forschung. Der intensive Austausch zwischen den Disziplinen, wie er zum Beispiel in den bis zur letzten Minute gefüllten Q&A-Slots nach den Vorträgen stattfand, unterstrich das große Interesse und den Bedarf an gemeinsamer Weiterentwicklung in diesem Feld. Einer nächsten Ausgabe der Konferenz darf daher mit großen Erwartungen entgegengesehen werden.

OpenEdition schlägt Ihnen vor, diesen Beitrag wie folgt zu zitieren:
Thora Hagen (17. Oktober 2025). Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025. Text+ Blog. Abgerufen am 3. April 2026 von https://doi.org/10.58079/14z7f

Schlagwörter: data winter DataGEMS FAIR KI Knowledge Graph Künstliche Intelligenz kuratierte Daten Lexikalische Ressourcen semantische Verknüpfung Wissensgraphen

Schreibe einen Kommentar Antworten abbrechen

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Ohne Titel 30/03/2026
Die Humanities@NFDI veranstalten diese Woche Donnerstag wieder ihre gemeinsame offene FDM-Sprechstunde. Kolleg:innen aus Text+, NFDI4Culture, NFDI4Memory und NFDI4Objects bieten Online-Beratung für Studierende, Forschende oder Mitarbeitende zu allen Fragen rund um das Forschungsdatenmanagement. --> Einfach ohne Anmeldung vorbeischauen: https://events.gwdg.de/category/320/
Ohne Titel 17/03/2026
📬 Text+ Newsletter – März 2026Der neue Text+ Newsletter ist da! Darin finden Sie Neuigkeiten aus der Text+-Community, Einblicke in aktuelle Projekte sowie Hinweise auf kommende Veranstaltungen.🔗 Zum Newsletter: https://text-plus.org/aktuelles/aktuelle-infos/posts/newsletter_06/💌 Möchten Sie den Text+ Newsletter künftig direkt per E-Mail erhalten? Schreiben Sie uns einfach an [email protected].#TextPlus #NFDI
Ohne Titel 16/03/2026
🎥 Kurzfilm: DARIAH-DE Perspektiven auf eine geisteswissenschaftliche Forschungsinfrastruktur im Kontext von KIDer Film zeigt, wie Forschende und Infrastrukturen mit KI große Mengen an Forschungsdaten erschließen – und warum Infrastrukturen weiterhin zentral bleiben.Entstanden beim DARIAH Annual Event 2025 in Göttingen.▶️ Link zum Video bei Youtube https://www.youtube.com/watch?v=ySTzNyDNBFo&list=PL6zl2jMV03I_RyYB4cyhdhdVjUAG8Mzc_ ℹ️ Mehr Informationen: https://de.dariah.eu/ #DigitalHumanities #KI #Forschungsinfrastruktur #DARIAH-DE

Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025

Das könnte dich auch interessieren …

Schreibe einen Kommentar Antworten abbrechen

Suche

Blogroll

Text+ auf Mastodon

Von Open Data zu AI-Ready Data: Einblicke von der ENDORSE 2025

Das könnte dich auch interessieren …

Text+ Plenary 2024: Call for Posters

Christian Mair im Gespräch mit Eva Pfanzelter und Marlene Huber

Partner-Parade #07: Die Eberhard Karls Universität Tübingen: Linguistische Dateninfrastruktur für die Forschung

Schreibe einen Kommentar Antworten abbrechen

Suche

Blogroll

Schlagwörter

Text+ auf Mastodon