{"id":4815,"date":"2023-05-02T10:05:20","date_gmt":"2023-05-02T08:05:20","guid":{"rendered":"https:\/\/textplus.hypotheses.org\/?p=4815"},"modified":"2023-07-21T14:01:48","modified_gmt":"2023-07-21T12:01:48","slug":"ressourcen-reigen-5-soldatenbriefe-integration-von-forschungsdaten-aus-einem-promotionsprojekt","status":"publish","type":"post","link":"https:\/\/textplus.hypotheses.org\/4815","title":{"rendered":"Ressourcen-Reigen, #5: Soldatenbriefe. Integration von Forschungsdaten aus einem Promotionsprojekt"},"content":{"rendered":"\n<p><strong>Autoren: Marius Hug, Marko Neumann<\/strong><\/p>\n\n\n\n<p>\u00bbGott lob und dang ich bin in keinne Schlacht zugekomen wir sint imer hinder nachmarschirt.\u00ab Mit diesen Worten wendet sich der in Frankreich stationierte einfache Soldat Michael Eimgartner vor rund 150 Jahren an seine Eltern in der Heimat (<a href=\"https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe\/blob\/main\/data\/letter-169.xml\">Soldatenbrief Nr. 169<\/a>). Briefe aus dem Krieg sind nicht nur aus inhaltlichen Gr\u00fcnden f\u00fcr die Forschung von gro\u00dfem Interesse, auch sprachlich gesehen handelt es sich um wertvolle Zeugnisse, die uns Einblicke in die Alltagsschriftlichkeit verschiedener historischer Schreiber:innen geben k\u00f6nnen. Die Herausforderungen, die es bei dieser Art von Quellen zu bew\u00e4ltigen gilt, sollen im Blog-Beitrag thematisiert werden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Ausgangslage<\/strong><\/h2>\n\n\n\n<p>In seiner 2019 im Heidelberger Universit\u00e4tsverlag Winter erschienenen Promotionsschrift &#8220;Soldatenbriefe des 18. und 19. Jahrhunderts. <a href=\"https:\/\/www.winter-verlag.de\/de\/detail\/978-3-8253-4642-3\/Neumann_Soldatenbriefe\/\">Untersuchungen zu Syntax und Textstruktur in der Alltagsschriftlichkeit unterschiedlicher milit\u00e4rischer Dienstgrade<\/a>&#8221; arbeitet Marko Neumann sprachliche Gemeinsamkeiten und Unterschiede zwischen einfachen Soldaten, Unteroffizieren und Offizieren heraus. Die textliche Grundlage der Arbeit bildet ein Korpus von 170 Briefen, die aus verschiedenen Archiven des deutschsprachigen Raums stammen und die f\u00fcr die Zwecke der Untersuchung buchstaben- und zeichengetreu transkribiert wurden. Die Transkripte werden vom Verlag kostenfrei zum Download bereitgestellt.<sup><a href=\"#footnote_1_4815\" id=\"identifier_1_4815\" class=\"footnote-link footnote-identifier-link\" title=\"https:\/\/www.winter-verlag.de\/de\/detail\/978-3-8253-4642-3\/Neumann_Soldatenbriefe\/\">1<\/a><\/sup><\/p>\n\n\n\n<p>Die als PDF bereitgestellten Daten sind jedoch aufgrund des Formats und wegen lizenzrechtlicher Beschr\u00e4nkungen durch den Verlag nicht so nachnutzbar, wie es w\u00fcnschenswert w\u00e4re. Genau auf diesen Umstand macht die Text+ User Story &#8220;<a href=\"https:\/\/www.text-plus.org\/en\/research-data\/user-story-508\/\">Soldiers\u2019 letters of the 18th and 19th centuries: From the PDF edition to reusable, interoperable research data<\/a>&#8221; aufmerksam.<\/p>\n\n\n\n<p>Nachnutzbarkeit der Forschungsdaten w\u00e4re gegeben, wenn die Daten<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>in einem quelloffenen maschinen- und menschenlesbaren Format vorl\u00e4gen,<\/li>\n\n\n\n<li>mit Metadaten versehen w\u00e4ren und<\/li>\n\n\n\n<li>in einem Repositorium unter einer m\u00f6glichst offenen Lizenz bereitgestellt w\u00fcrden.<\/li>\n<\/ul>\n\n\n\n<p>Mit einer Integration der Daten in das <a href=\"https:\/\/www.deutschestextarchiv.de\/\">Deutsche Textarchiv<\/a> (DTA)<sup><a href=\"#footnote_2_4815\" id=\"identifier_2_4815\" class=\"footnote-link footnote-identifier-link\" title=\"Marius Hug\/Susanne Haaf: Ressourcen-Reigen, #3: DTA@NFDI. Historische, deutschsprachige Texte und ihr &bdquo;place to be&ldquo;, in: Text+ Blog, 17.01.2023, https:\/\/textplus.hypotheses.org\/3220.\">2<\/a><\/sup><a href=\"https:\/\/www.deutschestextarchiv.de\/\"> an der<\/a> <a href=\"https:\/\/www.bbaw.de\/\">Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)<\/a> w\u00e4re diese Nachnutzbarkeit gew\u00e4hrleistet. Im Folgenden soll der Workflow von der \u00dcbernahme der Daten \u00fcber die Bereitstellung im DTA bis zur dadurch m\u00f6glich gewordenen Korpusanalyse in der Infrastruktur des <a href=\"https:\/\/www.bbaw.de\/forschung\/zentren\/zentrum-sprache\">Zentrums Sprache<\/a> an der BBAW exemplarisch beschrieben werden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Daten\u00fcbernahme<\/strong><\/h2>\n\n\n\n<p>In das DTA k\u00f6nnen Daten integriert werden, die analog zum <a href=\"https:\/\/www.deutschestextarchiv.de\/doku\/basisformat\/\">Basisformat des Deutschen Textarchivs (DTABf)<\/a> \u2013 einem echten Subset des TEI P5-Standards, des de-facto-Standards zur Auszeichnung geisteswissenschaftlicher Texte \u2013 kodiert sind. Die Soldatenbriefe wurden als docx-Datei \u00fcbergeben. Die tabellarische Datei enthielt Eintr\u00e4ge f\u00fcr insgesamt 170 Briefe. Zudem wurden die den Briefen zugeh\u00f6rigen Metadaten \u00fcbergeben, wobei es sich um eine Tabelle mit sieben Spalten handelte, ebenfalls eine docx-Datei. Die Kurations- und Transformationsaufgaben bestanden demnach darin, aus getrennten Daten und Metadaten \u2013 die jeweils als Tabelle in einem MS Wordformat \u00fcbergeben werden \u2013, valide TEI-Daten analog zum DTABf zu generieren.<sup><a href=\"#footnote_3_4815\" id=\"identifier_3_4815\" class=\"footnote-link footnote-identifier-link\" title=\"Da f&uuml;r die Transkriptionen keine Faksimiles &uuml;bergeben wurden, haben wir es hier mit einer reinen Bereitstellung von textuellen Daten zu tun.\">3<\/a><\/sup><\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Dateningest<\/strong><\/h2>\n\n\n\n<p>Der erste Schritt im Rahmen des Dateningests bestand darin, eine Korpusbeschreibung nach vorgefertigtem Schema zu erstellen. Dieser Metadatensatz, der perspektivisch \u00fcber ein Onlineformular angelegt werden soll, dient mehreren Zwecken:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Aufnahme der Ressource in die DTA-Infrastruktur, die Textsammlung wird dadurch im Rahmen der Korpus\u00fcbersicht des DTA ver\u00f6ffentlicht<\/li>\n\n\n\n<li>semi-automatisches Anlegen einer Landingpage f\u00fcr das Textkorpus <\/li>\n\n\n\n<li>Grundlage f\u00fcr die Integration der Datensammlung in die NFDI-Infrastruktur<\/li>\n<\/ul>\n\n\n\n<p>F\u00fcr die weiteren (gegebenenfalls auch kollaborativen) Arbeiten an den (Meta-)Daten wurde ein eigenes Korpus-Repository angelegt. Nach erfolgter Aufnahme der Daten stehen demnach folgende Instanzen zur Verf\u00fcgung:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Korpus-Repository (s. Abb. 1)<\/li>\n\n\n\n<li>Korpusbeschreibung (YML-Datensatz) (s. Abb. 2)<\/li>\n\n\n\n<li>Visualisierung der Korpora\/Korpus\u00fcbersicht (s. Abb. 3)<\/li>\n\n\n\n<li>Landingpage (DTA)<\/li>\n<\/ul>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1214\" height=\"802\" src=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11.png\" alt=\"Screenshot des Korpus-Repository des Corpus Soldatenbriefe (1745-1872) auf github\" class=\"wp-image-4866\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11.png 1214w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11-300x198.png 300w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11-500x330.png 500w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11-150x99.png 150w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb11-768x507.png 768w\" sizes=\"auto, (max-width: 1214px) 100vw, 1214px\" \/><figcaption class=\"wp-element-caption\">Abb 1.: Korpus-Repository auf github<\/figcaption><\/figure>\n<\/div>\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1208\" height=\"858\" src=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21.png\" alt=\"Screenshot der Metadaten des Corpus Soldatenbriefe des 18. und 19. Jahrhunderts\" class=\"wp-image-4871\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21.png 1208w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21-300x213.png 300w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21-500x355.png 500w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21-150x107.png 150w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb21-768x545.png 768w\" sizes=\"auto, (max-width: 1208px) 100vw, 1208px\" \/><figcaption class=\"wp-element-caption\">Abb 2.: Metadaten zur Beschreibung der Soldatenbrief-Sammlung<\/figcaption><\/figure>\n<\/div>\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"373\" height=\"500\" src=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb31-373x500.png\" alt=\"Screenshot der Korpusbeschreibung &quot;Soldatenbriefe des 18. und 19. Jahrhunderts&quot; mit Tags zu Sprache, Format, Faksimiles, Transkription und weiteren sowie Beschreibung und Link zum Datensatz\" class=\"wp-image-4885\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb31-373x500.png 373w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb31-224x300.png 224w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb31-112x150.png 112w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb31.png 469w\" sizes=\"auto, (max-width: 373px) 100vw, 373px\" \/><figcaption class=\"wp-element-caption\">Abb 3.: DTA-Korpusbeschreibung auf Grundlage der Metadaten<\/figcaption><\/figure>\n<\/div>\n\n\n<h2 class=\"wp-block-heading\"><strong>Kuration, Transformation und Integration<\/strong><\/h2>\n\n\n\n<p>Um das erw\u00fcnschte DTA-Zielformat zu erreichen, mussten einerseits Daten und zugeh\u00f6rige Metadaten zusammengef\u00fchrt werden, andererseits die Word-Dokumente nach <a href=\"https:\/\/tei-c.org\/guidelines\/p5\/\">TEI P5<\/a>\/<a href=\"https:\/\/www.deutschestextarchiv.de\/doku\/basisformat\/\">DTABf<\/a> transformiert werden. Der im Kontext von <a href=\"https:\/\/www.text-plus.org\/\">Text+<\/a> verwendete Workflow soll gut skalieren. Das hei\u00dft, es sollte keinen gro\u00dfen Unterschied machen, ob wir hier 20 oder 2.000 Briefe kuratieren. Dieses Ziel wird erreicht durch die zun\u00e4chst getrennte Bearbeitung von Daten und Metadaten, die anschlie\u00dfend skriptbasiert zusammengef\u00fchrt werden.<\/p>\n\n\n\n<p>Zun\u00e4chst wurde die Metadatendatei gesichtet und in ein maschinenlesbares Format (z. B. csv) konvertiert. Im Rahmen der anschlie\u00dfenden Met<span style=\"color:#000000\" class=\"tadv-color\">adatenkuration wurden die Eintr\u00e4ge gegebenenfalls korrigiert und vorhandene L\u00fccken geschlossen. Wenn nicht vorhanden, aber praktikabel umsetzbar,<a> <\/a>wurden die zu bearbeitenden Daten mit etablierten Normdatens\u00e4tzen abgeglichen. So k\u00f6nnen beispiels<\/span>weise f\u00fcr Personen die <a href=\"https:\/\/www.dnb.de\/DE\/Professionell\/Standardisierung\/GND\/gnd_node.html\">GND<\/a>-Nummern aus der <a href=\"https:\/\/www.dnb.de\/DE\/Home\/home_node.html\">Deutschen Nationalbibliothek<\/a> \u00fcbernommen werden, wodurch die Voraussetzung geschaffen wird, die Textsammlung per Linked Open Data mit anderen, weiteren Datens\u00e4tzen zu verkn\u00fcpfen.<sup><a href=\"#footnote_4_4815\" id=\"identifier_4_4815\" class=\"footnote-link footnote-identifier-link\" title=\"Im konkreten Fall der Soldatenbriefe bringt das beschriebene Vorgehen insofern keinen Mehrwert, als es sehr unwahrscheinlich ist, dass die namentlich genannten Soldaten einen Eintrag in der DNB besitzen. Und da es sich bei den Briefen wiederum in vielen F&auml;llen vermutlich um die einzigen textuellen Zeugnisse der jeweiligen Personen handelt, w&auml;re auch ein Neuantrag in der DNB kaum angezeigt.\">4<\/a><\/sup><\/p>\n\n\n\n<p>Die Transformation erfolgte skriptbasiert: Die Einzelbriefe wurden ausgeschnitten und erhalten einen sogenannten TEI-Header, der alle Metadaten enth\u00e4lt.<\/p>\n\n\n\n<p>Die Bereitstellung der (Meta-)Daten erfolgte als TEI P5\/DTABf-konforme XML-Dateien unter der Lizenz CC BY-SA 4.0 im <a href=\"https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe\">Korpus-Repository<\/a> auf github. Damit war die Nachnutzbarkeit der Daten als Forschungsdaten gesichert. Diese wurde noch maximiert, da die f\u00fcr die Kuration\/Transkription verwendeten <a href=\"https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe\/tree\/main\/scripts\">Skripte<\/a> sowie eine umfangreiche <a href=\"https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe\/wiki\/Soldatenbriefe\">Dokumentation<\/a> ebenfalls ver\u00f6ffentlicht wurden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Korpusanalyse<\/strong><\/h2>\n\n\n\n<p>\u00bbGott lob und dang ich bin in keinne Schlacht zugekomen wir sint imer hinder nachmarschirt.\u00ab F\u00fcr (menschliche) Leserinnen und Leser stellt diese Aussage keine allzu gro\u00dfe Herausforderung dar: Der Soldat \u00e4u\u00dfert seine Erleichterung dar\u00fcber, dass er nicht k\u00e4mpfen musste, sondern sich in zweiter Reihe aufhalten konnte. Daf\u00fcr dankt er Gott. F\u00fcr einen not-reading-Ansatz sieht die Sache aber ganz anders aus. Hier haben wir es nicht nur mit historisch validen Schreibweisen wie \u00bbmarschiren\u00ab statt \u00bbmarschieren\u00ab zu tun, sondern es gibt offenkundig auch bspw. dem Bildungsgrad des Schreibers oder seiner regionalen Herkunft geschuldete Alternativschreibungen wie \u00bbhinder\u00ab statt \u00bbhinter\u00ab. F\u00fcr eine Korpussuche stellt diese Textgattung demnach eine besondere Herausforderung dar.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1120\" height=\"845\" src=\"https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu.png\" alt=\"\" class=\"wp-image-5241\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu.png 1120w, https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu-300x226.png 300w, https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu-500x377.png 500w, https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu-150x113.png 150w, https:\/\/textplus.hypotheses.org\/files\/2023\/05\/soldatenbriefe-abb4_neu-768x579.png 768w\" sizes=\"auto, (max-width: 1120px) 100vw, 1120px\" \/><figcaption class=\"wp-element-caption\">Abb. 4: DWDS-Trefferansicht auf der Suche nach Gott. Hier Treffer 17 in der Detailansicht<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Das DTA bringt hier eine langj\u00e4hrige Expertise im Umgang mit historischen Schreibweisen mit. Die Voraussetzung der in Zusammenarbeit mit dem Akademienvorhaben <a href=\"https:\/\/www.dwds.de\/\">Digitales W\u00f6rterbuch der deutschen Sprache (DWDS)<\/a> im <a href=\"https:\/\/www.bbaw.de\/forschung\/zentren\/zentrum-sprache\">Zentrum Sprache<\/a> der BBAW angebotenen Korpussuche ist eine linguistische Aufbereitung aller Texte. Diese erm\u00f6glicht einerseits die Abbildung historischer Schreibweisen auf aktuelle Rechtschreibnormen, was die Voraussetzung daf\u00fcr ist, dass eine Suche nach \u00bbmarschiren\u00ab auch \u00bbnachmarschirt\u00ab findet.<sup><a href=\"#footnote_5_4815\" id=\"identifier_5_4815\" class=\"footnote-link footnote-identifier-link\" title=\"Die durch die Kooperation mit dem DWDS generierten Derivatformate werden in die DTA-Infrastruktur bzw. in das github-repository mit aufgenommen: https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe.\">5<\/a><\/sup> Andererseits wird aber auch die Einbindung von Thesauri in die <a href=\"https:\/\/www.dwds.de\/r\/?q=&amp;corpus=soldatenbriefe\">Korpussuche<\/a> erm\u00f6glicht. So findet eine Suche nach \u00bbKrankenhaus|germanet\u00ab<sup><a href=\"#footnote_6_4815\" id=\"identifier_6_4815\" class=\"footnote-link footnote-identifier-link\" title=\"https:\/\/www.dwds.de\/r\/?q=Krankenhaus%7Cgermanet&amp;corpus=soldatenbriefe&amp;date-start=1745&amp;date-end=1872&amp;format=full&amp;sort=date_desc&amp;limit=10\">6<\/a><\/sup> bspw. auch lazaret, Lazareth, Spital, Sbital, Spiethal, Spietahl, Hospital, etc.<\/p>\n\n\n\n<p>Eine Korpusanalyse nach typischen Wortverbindungen (Kollokationen) im zeitlichen Verlauf wird mittels <a href=\"https:\/\/kaskade.dwds.de\/dstar\/soldatenbriefe\/diacollo\/\">DiaCollo<\/a> erm\u00f6glicht. Abb. 5 zeigt Kollokationen zu \u201eMutter\u201c im Jahr 1860. F\u00fcr die Visualisierung der Ergebnisse gilt: Je dunkler das Orange, desto st\u00e4rker die Kollokation.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"933\" height=\"740\" src=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51.png\" alt=\"Screenshot einer Korpusanalyse mit DiaCollo zum Wort &quot;Mutter&quot;, das eine Gruppe verschiedene orangenr Kreise zeigt mit den Worten Vater, lieb, Gru\u00df, Liebe, geliebt, teuer, Geschwister, gr\u00fc\u00dfen, verdienen, gut.\" class=\"wp-image-4920\" srcset=\"https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51.png 933w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51-300x238.png 300w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51-500x397.png 500w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51-150x119.png 150w, https:\/\/textplus.hypotheses.org\/files\/2023\/04\/abb51-768x609.png 768w\" sizes=\"auto, (max-width: 933px) 100vw, 933px\" \/><figcaption class=\"wp-element-caption\">Abb. 5: Korpusanalyse mit DiaCollo. Wortumfeld zu \u201eMutter\u201c im Soldatenbriefkorpus im Jahr 1860<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Au\u00dferdem garantiert die Zusammenarbeit mit dem <a href=\"https:\/\/www.dwds.de\/\">DWDS<\/a> durch die Integration der Ressourcen in das Metakorpus \u201eHistorische Korpora\u201c (dtaxl) auch eine <a href=\"https:\/\/www.dwds.de\/r\/?q=&amp;corpus=dtaxl\">korpus\u00fcbergreifende Suche<\/a>. Diese k\u00f6nnte man bspw. f\u00fcr die Validierung der These nutzen, dass das Thema \u201eWetter\u201c bzw. \u201eKlima\u201c f\u00fcr die Textsorte \u201eSoldatenbrief\u201c \u00fcberdurchschnittlich relevant ist. Ein Vergleich des Soldatenbrief-Korpus mit dem gesamten Metakorpus \u201eHistorische Texte\u201c liefert folgendes Ergebnis von Treffern zum Thema Wetter.<sup><a href=\"#footnote_7_4815\" id=\"identifier_7_4815\" class=\"footnote-link footnote-identifier-link\" title=\"Abgefragt wurde der Begriff &quot;Wetter&quot; unter Einbindung des Thesaurus &quot;germanet&quot;. Dadurch wird &quot;Wetter&quot; automatisch auf rund 60 Begriffe expandiert, darunter Begriffe wie Fr&uuml;hlingssonne, Glatteis, Herbstwetter, Hitzewelle, Schei&szlig;wetter usw.\">7<\/a><\/sup><\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>Korpus<\/td><td>Anzahl der Treffer<\/td><td>Token<\/td><td>Quotient<\/td><\/tr><tr><td>Soldatenbriefe<\/td><td>35<\/td><td>96023<\/td><td>0.0003645<\/td><\/tr><tr><td>DTAXL (ohne Soldatenbriefe)<\/td><td>401858<\/td><td>1491409110<\/td><td>0.0002694<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Fazit\/Ausblick<\/strong><\/h2>\n\n\n\n<p>Der Beitrag hat gezeigt, wie die Integration von Ressourcen in die Infrastruktur des Zentrums Sprache an der BBAW durch die Bereitstellung der Daten im <a href=\"https:\/\/www.deutschestextarchiv.de\/\">DTA<\/a> und die M\u00f6glichkeit der Korpussuche und -analyse im <a href=\"https:\/\/www.dwds.de\/\">DWDS<\/a> die Nachnutzbarkeit von Forschungsdaten nachhaltig verbessert. Dar\u00fcber hinaus wird die Sichtbarkeit der digitalen Ressource durch die perspektivische Einbindung in Nachweissysteme von <a href=\"https:\/\/www.text-plus.org\/\">Text+<\/a> noch vergr\u00f6\u00dfert.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<p>FAKTENBOX<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>Projekttitel<\/td><td>Soldatenbriefe (1745\u20131872)<\/td><\/tr><tr><td>Affiliation \/ Partner<\/td><td>Justus-Liebig-Universit\u00e4t Gie\u00dfen: Institut f\u00fcr Germanistik, Historische Sprachwissenschaft; Zentrum Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW): Deutsches Textarchiv (DTA), Digitales W\u00f6rterbuch der deutschen Sprache (DWDS), Zentrum f\u00fcr digitale Lexikographie der deutschen Sprache (ZDL)<\/td><\/tr><tr><td>Projekttyp<\/td><td>Textkorpus<\/td><\/tr><tr><td>Task Area in Text+<\/td><td>Collections<\/td><\/tr><tr><td>Materialgrundlage<\/td><td>Handschriften<\/td><\/tr><tr><td>Textsorten<\/td><td>Gebrauchsliteratur: Briefe<\/td><\/tr><tr><td>Disziplin(en)<\/td><td>Historische Sprachwissenschaft, Geschichtswissenschaften u.a.<\/td><\/tr><tr><td>Zeitraum<\/td><td>18. und 19. Jh.<\/td><\/tr><tr><td>Sprachen<\/td><td>Deutsch<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Referenzen<\/strong><\/h2>\n\n\n\n<p>Neumann, Marko: Soldatenbriefe des 18. und 19. Jahrhunderts. Untersuchungen zu Syntax und Textstruktur in der Alltagsschriftlichkeit unterschiedlicher milit\u00e4rischer Dienstgrade. Heidelberg 2019.<\/p>\n\n\n\n<p>Neumann, Marko\/Hug, Marius: Forschungsdatenmanagement in den Geisteswissenschaften am Beispiel von \u201eSoldatenbriefen aus dem 18. und 19. Jahrhundert\u201c. Vortrag im Rahmen des Workshops \u201eForschungsdatenmanagement in den Geistes- und Sozialwissenschaften\u201c. TU Braunschweig, 21.03.2023.<\/p>\n\n\n\n<p>Haaf, Susanne\/Boenig, Matthias\/Hug, Marius: Das Deutsche Textarchiv gestern und heute. In: Bender, M.\/Jacob, K. (Hrsg.): Digitales Forschen. Daten \u2013 Werkzeuge \u2013 Methoden (= Mitteilungen des Deutschen Germanistenverbandes, Bd. 69, Nr. 2). Paderborn u.a. 2022, S. 127\u2013134.<\/p>\n\n\n\n<p>Boenig, Matthias\/Hug, Marius\/Sendler, Simon: Workflow zur Integration von Textdaten aus der Community in bestehende Infrastrukturen, 2021. <a href=\"https:\/\/doi.org\/10.14618\/ids-pub-10497\">https:\/\/doi.org\/10.14618\/ids-pub-10497<\/a>.<\/p>\n\n\n\n<p>Soldatenbriefe (1745\u20131872): <a href=\"https:\/\/www.dwds.de\/d\/korpora\/soldatenbriefe\">https:\/\/www.dwds.de\/d\/korpora\/soldatenbriefe<\/a><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-background\" style=\"background-color:#f1f1f1\"><strong>Zitiervorschlag <\/strong><br>Marius Hug\/Marko Neumann: Ressourcen-Reigen, #5: Soldatenbriefe. Integration von Forschungsdaten aus einem Promotionsprojekt, in: Text+ Blog, 25.04.2023, <a href=\"https:\/\/textplus.hypotheses.org\/4815\">https:\/\/textplus.hypotheses.org\/4815<\/a>.<\/p>\n\n\n\n<p class=\"has-small-font-size\">Beitragsbild: Preu\u00dfische Feldpost, 1866, gemeinfrei, via <a href=\"https:\/\/de.wikipedia.org\/wiki\/Datei:Preu%C3%9Fische_Feldpost_1866_(IZ_46-444).jpg\">Wikipedia<\/a>. <\/p>\n<ol class=\"footnotes\"><li id=\"footnote_1_4815\" class=\"footnote\"><a href=\"https:\/\/www.winter-verlag.de\/de\/detail\/978-3-8253-4642-3\/Neumann_Soldatenbriefe\/\">https:\/\/www.winter-verlag.de\/de\/detail\/978-3-8253-4642-3\/Neumann_Soldatenbriefe\/<\/a><span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_1_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_2_4815\" class=\"footnote\">Marius Hug\/Susanne Haaf: Ressourcen-Reigen, #3: DTA@NFDI. Historische, deutschsprachige Texte und ihr \u201eplace to be\u201c, in: Text+ Blog, 17.01.2023, <a href=\"https:\/\/textplus.hypotheses.org\/3220\">https:\/\/textplus.hypotheses.org\/3220<\/a>.<span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_2_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_3_4815\" class=\"footnote\">Da f\u00fcr die Transkriptionen keine Faksimiles \u00fcbergeben wurden, haben wir es hier mit einer reinen Bereitstellung von textuellen Daten zu tun.<span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_3_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_4_4815\" class=\"footnote\">Im konkreten Fall der Soldatenbriefe bringt das beschriebene Vorgehen insofern keinen Mehrwert, als es sehr unwahrscheinlich ist, dass die namentlich genannten Soldaten einen Eintrag in der DNB besitzen. Und da es sich bei den Briefen wiederum in vielen F\u00e4llen vermutlich um die einzigen textuellen Zeugnisse der jeweiligen Personen handelt, w\u00e4re auch ein Neuantrag in der DNB kaum angezeigt.<span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_4_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_5_4815\" class=\"footnote\">Die durch die Kooperation mit dem DWDS generierten Derivatformate werden in die DTA-Infrastruktur bzw. in das github-repository mit aufgenommen: <a href=\"https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe.)\">https:\/\/github.com\/deutschestextarchiv\/soldatenbriefe.<\/a> <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_5_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_6_4815\" class=\"footnote\">https:\/\/www.dwds.de\/r\/?q=Krankenhaus%7Cgermanet&amp;corpus=soldatenbriefe&amp;date-start=1745&amp;date-end=1872&amp;format=full&amp;sort=date_desc&amp;limit=10 <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_6_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_7_4815\" class=\"footnote\">Abgefragt wurde der Begriff &#8220;Wetter&#8221; unter Einbindung des Thesaurus &#8220;germanet&#8221;. Dadurch wird &#8220;Wetter&#8221; automatisch auf rund 60 Begriffe expandiert, darunter Begriffe wie Fr\u00fchlingssonne, Glatteis, Herbstwetter, Hitzewelle, Schei\u00dfwetter usw.<span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_7_4815\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><\/ol>","protected":false},"excerpt":{"rendered":"<p>Autoren: Marius Hug, Marko Neumann<br \/>\nIn dem auf Text- und Sprachdaten fokussierten NFDI-Konsortium Text+ ist das Deutsche Textarchiv (DTA) als Archiv f\u00fcr historische, deutschsprachige Texte der Datendom\u00e4ne \u201eSammlungen\u201c zugeordnet. In diesem Blogpost wird das neue DTA-Korpus Soldatenbriefe (1745\u20131872) vorgestellt. Es handelt sich dabei um Forschungsdaten aus einem Promotionsprojekt, die in die DTA-Infrastruktur integriert wurden und dort zur Nachnutzung bereit gestellt werden.<\/p>\n","protected":false},"author":49533,"featured_media":4954,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_license":"","publish_to_discourse":"","publish_post_category":"","wpdc_auto_publish_overridden":"","wpdc_topic_tags":"","wpdc_pin_topic":"","wpdc_pin_until":"","discourse_post_id":"","discourse_permalink":"","wpdc_publishing_response":"","wpdc_publishing_error":"","footnotes":""},"categories":[6,649,659],"tags":[255,381,256,260,389,69,65,566,384],"ppma_author":[1813],"class_list":["post-4815","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-collections","category-marius-hug","category-marko-neumann","tag-bbaw","tag-collections","tag-dta","tag-dwds","tag-historische-texte","tag-reihe","tag-ressourcen-reigen","tag-soldatenbriefe","tag-zentrum-sprache"],"authors":[{"term_id":1813,"user_id":49533,"is_guest":0,"slug":"textplusmitglied","display_name":"Text+ Mitglied","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/23eb61e4f9c16bebe47ac6acfe443efe852d6bdbfa4c63607ace26ace53ce9b8?s=96&d=blank&r=g","1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/4815","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/users\/49533"}],"replies":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/comments?post=4815"}],"version-history":[{"count":9,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/4815\/revisions"}],"predecessor-version":[{"id":6269,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/posts\/4815\/revisions\/6269"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/media\/4954"}],"wp:attachment":[{"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/media?parent=4815"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/categories?post=4815"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/tags?post=4815"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/textplus.hypotheses.org\/wp-json\/wp\/v2\/ppma_author?post=4815"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}