{"id":14027,"date":"2025-09-15T14:07:48","date_gmt":"2025-09-15T12:07:48","guid":{"rendered":"https:\/\/textplus.hypotheses.org\/?p=14027"},"modified":"2025-09-15T14:19:37","modified_gmt":"2025-09-15T12:19:37","slug":"nachhaltigkeit-digitaler-infrastrukturen-foerdern-erfahrung-aus-dem-computational-literary-studies-infrastructure-cls-infra-projekt","status":"publish","type":"post","link":"https:\/\/textplus.hypotheses.org\/14027","title":{"rendered":"Nachhaltigkeit digitaler Infrastrukturen f\u00f6rdern \u2013 Erfahrung aus dem Computational Literary Studies Infrastructure (CLS INFRA) Projekt"},"content":{"rendered":"\n<p class=\"has-background\" style=\"background-color:#f1f1f1\"><strong>Junge Forschung@Text+<\/strong> Im Programm des Plenary 2025 war erneut ein Slot f\u00fcr junge Forschende reserviert. Aus den Einreichungen auf den Call for Posters wurden vier herausragende Projekte eingeladen. Die Forschenden erhielten ein Reisekostenstipendium sowie die Gelegenheit, ihr Projekt im Plenum zu pr\u00e4sentieren und in der Postersession zu diskutieren. Die Teilnehmenden des Text+ Plenary erhielten somit einen wertvollen Einblick, mit welchen Themen und methodischen Ans\u00e4tzen sich der wissenschaftliche Nachwuchs aktuell besch\u00e4ftigt.<br><br>Passend zum Tagungsmotto 2025 (<em>Connecting Infrastructures \u2013 Verbindungen zwischen europ\u00e4ischen Forschungsinfrastrukturen<\/em>) lieferte <a href=\"https:\/\/orcid.org\/0009-0002-2752-4966\">Vera Yakupova<\/a> vom Trinity College Dublin einen Beitrag aus der Perspektive der Infrastrukturentwicklung.<\/p>\n\n\n\n<p><\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><a href=\"https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen.jpg\"><img loading=\"lazy\" decoding=\"async\" width=\"354\" height=\"500\" src=\"https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen-354x500.jpg\" alt=\"Poster von Vera Yakupova zum Thema &quot;Nachhaltigkeit digitaler Infrastrukturen: CLS Infra Erfahrung&quot;\" class=\"wp-image-14062\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen-354x500.jpg 354w, https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen-212x300.jpg 212w, https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen-106x150.jpg 106w, https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen-768x1086.jpg 768w\" sizes=\"auto, (max-width: 354px) 100vw, 354px\" \/><\/a><\/figure>\n<\/div>\n\n\n<div class=\"wp-block-file aligncenter\"><a id=\"wp-block-file--media-e1f5d8d5-6132-43f8-84a5-5d282350cb90\" href=\"https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen.pdf\">Poster von Vera Yakupova: Nachhaltigkeit digitaler Infrastrukturen<\/a><a href=\"https:\/\/textplus.hypotheses.org\/files\/2025\/09\/Vera-Yakupova_Nachhaltigkeit-digitaler-Infrastrukturen.pdf\" class=\"wp-block-file__button wp-element-button\" download aria-describedby=\"wp-block-file--media-e1f5d8d5-6132-43f8-84a5-5d282350cb90\">Herunterladen<\/a><\/div>\n\n\n\n<p><\/p>\n\n\n\n<p>Die meisten Forschungsprojekte werden nur f\u00fcr eine gewisse Zeit gef\u00f6rdert. Am Ende der F\u00f6rderzeit stellt sich dann die Frage: \u201eWas passiert nun?\u201c. Damit die Arbeit aus einem befristet gef\u00f6rderten Forschungsprojekt nicht verloren geht, ist ein Fokus auf die Nachhaltigkeit einer Forschungsinfrastruktur unumg\u00e4nglich. CLS INFRA (<a href=\"https:\/\/clsinfra.io\/\">Computational Literary Studies Infrastructure<\/a>, deutsch: eine Infrastruktur f\u00fcr die computergest\u00fctzte Literaturwissenschaft) ist ein 4-j\u00e4hriges europaweites Projekt, das dazu beitr\u00e4gt, eine gemeinsame Ressource aus hochwertigen Daten, Tools und fachlichem Wissen zu entwickeln, um neue Ans\u00e4tze zur Erforschung von Literatur im digitalen Zeitalter zu unterst\u00fctzen. Das Projekt hat 13 Partnerinstitutionen und wird von EU Horizon 2020 (<a href=\"https:\/\/cordis.europa.eu\/project\/id\/101004984\/results\">Agreement No 101004984<\/a>) gef\u00f6rdert. Da sich das Projekt August 2025 dem Ende zuneigte, haben Prof. Dr. Jennifer Edmond (Trinity College Dublin) und ich gemeinsam Teilnehmer*innen des Projekts befragt, um ihre Erfahrungen mit und Einsch\u00e4tzungen zu den Voraussetzungen f\u00fcr Nachhaltigkeit in CLS-Infrastrukturen teilen zu k\u00f6nnen, um einen Ausblick auf die Zukunft des Forschungsbereichs CLS insgesamt zu skizzieren und ihr im Projekt angeeignetes Wissen f\u00fcr zuk\u00fcnftige Infrastrukturprojekte, besonders in den CLS, festzuhalten. Die Befragung wurde durch eine Literaturrecherche zu den in den Interviews angesprochenen Themen unterst\u00fctzt. Der daraus entstandene Bericht \u2013 die <em>Strategic Roadmap<\/em> \u2013 erl\u00e4utert, wie sich die CLS in Zukunft entwickeln k\u00f6nnten, und bietet gleichzeitig Empfehlungen f\u00fcr andere Infrastrukturprojekte. Dieser Blogpost fasst die wichtigsten Herausforderungen und Perspektiven, die wir den Gespr\u00e4chen und der Literatur entnehmen konnten, zusammen. Der <a href=\"https:\/\/doi.org\/10.5281\/zenodo.16842551\">gesamte Bericht<\/a> kann auf Zenodo abgerufen werden.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Herausforderung f\u00fcr Nachhaltigkeit: Fragmentierung<\/strong><\/h2>\n\n\n\n<p>Das digitale Umfeld, wie Hosting Plattformen und unterschiedliche Betriebssysteme, ver\u00e4ndert sich rasch und tr\u00e4gt somit zu einer Diskontinuit\u00e4t von Daten, Werkzeugen und Software-Funktionalit\u00e4t bei, was die Forschung und Outputs der CLS fragmentiert. Daten und Tools finden h\u00e4ufig kein nachhaltiges Zuhause, da viele Hosting-Plattformen sich sehr dynamisch entwickeln. Ohne eine tragf\u00e4hige infrastrukturelle F\u00f6rderung bleibt ihre Pflege meist dem Engagement einzelner Personen oder Institutionen \u00fcberlassen. Hinzu kommt, dass zahlreiche Ressourcen nur eingeschr\u00e4nkt zug\u00e4nglich sind, was ihre Auffindbarkeit und Nachnutzbarkeit erschwert. Uneinheitliche, oft mehrsprachige Metadaten und unterschiedlich formatierte Daten verhindern dar\u00fcber hinaus eine konsistente Erschlie\u00dfung und behindern die Integration in gr\u00f6\u00dfere Forschungs\u00f6kosysteme. Diese technischen und organisatorischen Schwierigkeiten werden durch die Heterogenit\u00e4t der Community versch\u00e4rft, die bislang \u00fcber keine verbindlichen Standards oder gemeinsamen Workflows verf\u00fcgt. Insgesamt hemmt diese Fragmentierung die Zusammenarbeit, die Reproduzierbarkeit wissenschaftlicher Ergebnisse sowie die Sichtbarkeit und Zug\u00e4nglichkeit der Forschungsressourcen und -methoden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Entwicklungen in digitalen Literaturwissenschaften, die zu einer nachhaltigen Infrastruktur beitragen&nbsp;<\/strong><\/h2>\n\n\n\n<p>Die von uns befragten Personen aus dem <a href=\"https:\/\/clsinfra.io\/\">CLS INFRA<\/a> Projekt sprachen folgende Aspekte an, die aus ihrer Sicht zu einer nachhaltigen Pflege des Forschungsfeldes CLS&nbsp; beitragen w\u00fcrden:&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Gemeinsame Workflows: <\/strong>Unabh\u00e4ngig davon, ob die forschende Person einen eher technischen oder literarwissenschaftlichen Hintergrund hat, Arbeitsprozesse und die Anwendung digitaler Werkzeuge und Methoden sollen f\u00fcr alle Beteiligten verst\u00e4ndlich geschildert werden.<\/li>\n\n\n\n<li><strong>Versionierbare und zitierbare Korpora (Living Corpora): <\/strong>Sogenannte Living Corpora beschreiben Korpora an literarischen Werken, die st\u00e4ndig aktualisiert werden k\u00f6nnen. Die M\u00f6glichkeit, Korpora fortlaufend zu aktualisieren, tr\u00e4gt dazu bei, dass diese nicht veralten oder umfassender gestaltet und angepasst werden k\u00f6nnen. Dabei muss eine Dokumentation der Aktualisierungen erfolgen, in der die Versionen klar markiert ist.<\/li>\n\n\n\n<li><strong>Annotationen: <\/strong>Diese bieten Kontext und sind wichtig, um Textdaten transparent in CLS-Infrastrukturen zu integrieren.<\/li>\n\n\n\n<li><strong>Vereinheitlichte und klare Metadaten:<\/strong> Die Erfassung von Metadaten und ihre Umwandlung in RDF (Resource Description Framework)&nbsp; kann Korpora besser auffindbar machen. Eine RDF-Metadaten-Konvertierung kann f\u00fcr die Registrierung und Verkn\u00fcpfung von Korpora mit Basis-Metadaten eine wichtige Grundlage f\u00fcr sp\u00e4tere, anspruchsvollere Erweiterungen bilden.<\/li>\n<\/ul>\n\n\n\n<p>Nur durch solche Grundlagen wird Forschung nachvollziehbar und reproduzierbar. Die Argumente der an dem Projekt CLS INFRA Beteiligten fassen wir so zusammen, dass Nachhaltigkeit nicht durch Tool-Listen entsteht, sondern durch <em>integrierte, dokumentierte und gepflegte<\/em> Infrastruktur. Jedoch sollten die CLS auch bereit sein, sich schnell an die technologischen Entwicklungen anzupassen, um von diesen bereichert zu werden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Technologische Zukunft: LOD &amp; LLMs<\/strong><\/h2>\n\n\n\n<p>CLS werden sich mit den jetzigen und zuk\u00fcnftigen technologischen Entwicklungen ver\u00e4ndern, k\u00f6nnen dabei aber ebenso von ihnen profitieren:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Linked Open Data (LOD)<\/strong> erm\u00f6glicht die semantische Verkn\u00fcpfung von Texten, Bibliografien und Forschungsdaten \u2013 \u00fcber Projekte und Disziplinen hinweg.<\/li>\n\n\n\n<li><strong>Large Language Models (LLMs)<\/strong> k\u00f6nnen Annotationen skalieren und neue Formen literaturwissenschaftlicher Analyse er\u00f6ffnen \u2013 vorausgesetzt, sie werden transparent, ethisch, mit Integrit\u00e4t und mit literaturwissenschaftlicher Sorgfalt integriert.<\/li>\n<\/ol>\n\n\n\n<p>Diese technologischen Entwicklungen m\u00fcssen Teil <em>nutzbarer, dokumentierter und sinnvoll eingebetteter Arbeitsumgebungen<\/em> sein. Richtig genutzt, k\u00f6nnen LOD und LLMs aus verstreuten Insell\u00f6sungen ein zusammenh\u00e4ngendes Forschungs\u00f6kosystem erschaffen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Strukturelle Fragen: Wer spricht f\u00fcr das Feld?<\/strong><\/h2>\n\n\n\n<p>Ein entscheidender Punkt der Strategic Roadmap betrifft die <strong>strukturelle Verankerung<\/strong> der CLS-Community. Dies betrifft die folgenden aufkommende Fragen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Wer <em>repr\u00e4sentiert<\/em> das Feld?<\/li>\n\n\n\n<li>Wer spricht mit F\u00f6rderinstitutionen, mit \u00d6ffentlichkeit, mit anderen Disziplinen?<\/li>\n\n\n\n<li>Wie l\u00e4sst sich eine globale \u201eCommunity of Practice\u201c aufbauen?<\/li>\n<\/ul>\n\n\n\n<p>Die Roadmap empfiehlt, diese Fragen nicht dem Zufall zu \u00fcberlassen, sondern gezielt <strong>Strukturen, Kommunikationsrollen und gemeinsame Zielbilder<\/strong> zu etablieren.<\/p>\n\n\n\n<p>Eine aktive Community kann die Infrastruktur aufrechterhalten und ausbauen. H\u00e4ufig fehlt jedoch in der Projektf\u00f6rderung der Raum, um gemeinsame Workflows aufzubauen, sodass Infrastrukturen oft nicht genug auf die tats\u00e4chlichen Bed\u00fcrfnisse der Community abgestimmt sind. Gerade bei interdisziplin\u00e4ren Vorhaben, in denen Informatik und Literaturwissenschaften zusammentreffen, ist eine Vereinheitlichung besonders anspruchsvoll: dies betrifft besonders Literaturwissenschaftler*innen, die sich im Umgang mit technischen Methoden unsicher f\u00fchlen, und Informatiker*innen, die keine oder wenig Erfahrung mit literaturwissenschaftlichen Analysen haben, aber interdisziplin\u00e4r arbeiten wollen. Deshalb braucht es Personen, die wahrnehmbar f\u00fcr das Forschungsfeld sprechen sowie Vermittler*innen, die zwischen den Disziplinen \u00fcbersetzen und Br\u00fccken schlagen k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Fazit und Text+&nbsp;<\/strong><\/h2>\n\n\n\n<p>Die <em><a href=\"https:\/\/doi.org\/10.5281\/zenodo.16842551\">CLS INFRA Strategic Roadmap<\/a><\/em> zeigt, dass nachhaltige CLS-Infrastrukturen folgende Merkmale aufweisen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>vernetzbare Daten &amp; Tools<\/li>\n\n\n\n<li>verl\u00e4ssliche Standards &amp; Versionierung<\/li>\n\n\n\n<li>klare Rollen &amp; Kommunikationsstrukturen<\/li>\n\n\n\n<li>strategische Offenheit f\u00fcr neue Technologien<\/li>\n<\/ul>\n\n\n\n<p>Die Roadmap liefert Ans\u00e4tze, welche Aspekte unterst\u00fctzt werden sollten, um Infrastrukturen technologisch und organisatorisch nachhaltig zu verankern. Dies ist ein Ziel, das Text+ ebenfalls f\u00fcr die langfristige Sicherung und Nachnutzbarkeit von Daten verfolgt. Ebenso steht Text+ vor der Aufgabe, hochwertige Daten mit klaren Standards, einheitlichen Metadaten und Annotationen zug\u00e4nglich zu machen. Daher liegt die Frage nahe, wie es dabei mit der Nachhaltigkeit aussieht &#8211; werden die Vorschl\u00e4ge der Roadmap bereits ber\u00fccksichtigt?<\/p>\n\n\n\n<p>Text+ richtet sich aus unserer Sicht nach den Vorschl\u00e4gen der Roadmap, da es \u00fcber Organisationsstrukturen mit klaren Zust\u00e4ndigkeiten durch das <a href=\"https:\/\/text-plus.org\/ueber-uns\/arbeitsbereiche\/infrastructure-operations\/\">Infrastruktur\/Operations<\/a>-Team sowie \u00fcber ein offenes Betriebsmodell, das langfristige Verf\u00fcgbarkeit und Wartung sichert, verf\u00fcgt. Ressourcen aus den Datendom\u00e4nen, um die sich Text+ k\u00fcmmert (<a href=\"https:\/\/text-plus.org\/ueber-uns\/arbeitsbereiche\/collections\/\">Collections<\/a>, <a href=\"https:\/\/text-plus.org\/ueber-uns\/arbeitsbereiche\/lexikalische-ressourcen\/\">Lexikalische Ressourcen<\/a> und <a href=\"http:\/\/text-plus.org\/ueber-uns\/arbeitsbereiche\/editionen\/\">Editionen<\/a>), werden in einer zentralen <a href=\"https:\/\/registry.text-plus.org\/default\/landing\">Registry<\/a> verzeichnet. Text+ integriert Linking durch Normdaten wie GND und f\u00f6rdert Metadatenharmonisierung, da es die Interoperabilit\u00e4t \u00fcber klare Standards fordert. Das Konsortium orientiert sich ebenfalls an Open Access und den FAIR-Prinzipien, verfolgt eine nachhaltige Archivierungsstrategie, offene Governance ohne Gewinnorientierung und einen inklusiven Zugang zu den Ressourcen f\u00fcr die Forschungsgemeinschaft.\u00a0<\/p>\n\n\n\n<p>Mit der Entwicklung von semantischen Zug\u00e4ngen (LOD, RDF) \u00fcber die Registry sowie der <a href=\"https:\/\/text-plus.org\/en\/daten-dienste\/llm-service\/\">Integration von LLM-basierten Services<\/a> (beispielsweise via GWDG) greift Text+ zudem die technologischen Zukunftsthemen auf, die in der Roadmap als Chancen f\u00fcr nachhaltige, reproduzierbare Forschung benannt werden. Text+ nutzt LOD, damit sprach- und textbasierte Forschungsdaten besser auffindbar und interoperabel sind. Durch die Anreicherung und Vernetzung von Ressourcen mit kontrollierten Vokabularen und Normdaten k\u00f6nnen Daten aus unterschiedlichen Repositorien semantisch verkn\u00fcpft und \u00fcber standardisierte Schnittstellen wie die <a href=\"https:\/\/text-plus.org\/daten-dienste\/daten\/#f%C3%B6derierte-inhaltssuche\">Federated Content Search (FCS)<\/a> gemeinsam durchsucht werden. So entstehen offene Wissensnetze, in denen Texte, Metadaten und Forschungsergebnisse in Beziehung gesetzt werden. Forschende der an dem Konsortium beteiligten Institutionen k\u00f6nnen \u00fcber die <a href=\"https:\/\/gwdg.de\/\">GWDG <\/a>Open-Source-Modelle wie LLaMA nutzen, um Text- und Sprachdaten aus den Repositorien zu analysieren. Datensicherheit, Transparenz und ethische Standards werden unter anderem dadurch sichergestellt, dass die Modelle auf eigenen Servern laufen. Damit greift Text+ die Empfehlungen der <em><a href=\"https:\/\/doi.org\/10.5281\/zenodo.16842551\">CLS INFRA Strategic Roadmap<\/a><\/em>&nbsp; in der Praxis auf, um die Daten in der Infrastruktur nachhaltig zu verkn\u00fcpfen und durch Innovation zug\u00e4nglich zu machen.&nbsp;<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<p><strong>Die komplette Roadmap:<\/strong> Yakupova, V., &amp; Edmond, J. (2025). CLS INFRA D1.2 Strategic Roadmap for Computational Literary Studies. Zenodo. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.15411438\">DOI: 10.5281\/zenodo.15411438<\/a><\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Junge Forschung@Text+: Ein Beitrag aus der Perspektive der Infrastrukturentwicklung<\/p>\n","protected":false},"author":87186,"featured_media":14393,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_license":"NONE","publish_to_discourse":"","publish_post_category":"","wpdc_auto_publish_overridden":"","wpdc_topic_tags":"","wpdc_pin_topic":"","wpdc_pin_until":"","discourse_post_id":"","discourse_permalink":"","wpdc_publishing_response":"","wpdc_publishing_error":"","footnotes":""},"categories":[1586,571,470],"tags":[847,130,837,534,149,105,1580],"ppma_author":[1889],"class_list":["post-14027","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-vera-yakupova","category-veranstaltung","category-veroffentlichungen","tag-computational-literary-studies","tag-forschungsdateninfrastruktur","tag-junge-forschung","tag-literaturwissenschaft","tag-poster","tag-textplusplenary","tag-trinity-college-dublin"],"authors":[{"term_id":1889,"user_id":87186,"is_guest":0,"slug":"verayakupova","display_name":"Vera Yakupova","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/398dafa0f9b16e479399448b50a9dc1317c764f24536edd0a52bb6c1ccac0955?s=96&d=blank&r=g","1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/14027","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/users\/87186"}],"replies":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/comments?post=14027"}],"version-history":[{"count":9,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/14027\/revisions"}],"predecessor-version":[{"id":14390,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/14027\/revisions\/14390"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/media\/14393"}],"wp:attachment":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/media?parent=14027"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/categories?post=14027"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/tags?post=14027"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/ppma_author?post=14027"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}