Projects by MEPHisto Jena
Bei der Bearbeitung von historischen Fragestellungen mit digitalen Tools waren die von historisch... more Bei der Bearbeitung von historischen Fragestellungen mit digitalen Tools waren die von historischen Forschungsprojekten entwickelte Programme bisher sehr spezialisiert. Die Software wurde genau auf die historische Fragestellung angepasst und wurde von einem Informatiker nur für den Zweck der Beantwortung einer spezifischen historischen Fragestellung gebaut. Viele Historiker kennen sich wenig bis gar nicht mit der Programmierung aus. Daher können sie selbst oft nicht den Code ihrer benutzten Software an ihre neuen Bedürfnisse und Fragen anpassen.
In früheren Blog-Beiträgen haben wir bereits über unsere automatische Auswertung mit Hilfe von An... more In früheren Blog-Beiträgen haben wir bereits über unsere automatische Auswertung mit Hilfe von Antlr, einem Parsergenerator für strukturierten Text, und einer darauf basierenden Grammatik vorgestellt.1 Trotz der generellen Strukturiertheit der vatikanischen Supplikenregister stoßen wir immer wieder auf Probleme, wenn im gedruckten RG von der im Grunde normierten Struktur der Register abgewichen wird. In dem vorliegenden Blog-Beitrag wollen wir auf die unterschiedlichen Gründe für diese Abweichungen eingehen und vorstellen, wie wir damit umgehen.
In diesem Blog-Beitrag , zum Ende der Weihnachtszeit (Heilige Drei Könige), dreht sich alles um ... more In diesem Blog-Beitrag , zum Ende der Weihnachtszeit (Heilige Drei Könige), dreht sich alles um die heiligste Zeit des Christentums – die Ankunft Christi, auch Weihnachten genannt. Obwohl die Weihnachtstage auch im Spätmittelalter Feiertage waren, ruhte die Arbeit an der römischen Kurie nicht. Deswegen stellen wir in unserem weihnachtlichen Blog-Beitrag einige Auszüge von Suppliken aus dem dritten Band des Repertorium Germanicum vor, die zwischen dem 24. und 26. Dezember an der Kurie eingegangen sind oder von kurialen Schreibern bearbeitet wurden.
Neben Personen sind die am häufigsten im Repertorium Germanicum vorkommenden Entitäten geographis... more Neben Personen sind die am häufigsten im Repertorium Germanicum vorkommenden Entitäten geographischer Art. Dörfer, Städte und Orte, an denen Klöster oder Stiftskirchen liegen, werden genannt, da ein Großteil der Regesten die Bewerbungen von Klerikern um Pfründen in kirchlichen Orten in diesen Institutionen behandeln. Für eine netzwerkanalytische oder statistische Auswertung unserer Daten ist es unerlässlich herauszufinden, an welchen Stellen die angegebenen Orte liegen. Eine manuelle Lokalisierung jedes einzelnen Ortes würde aber unverhältnismäßig viel Aufwand bedeuten. Deswegen haben wir ein Tool entwickelt, welches Geo-Koordinaten für die Orte abfragt und überprüft. Im folgenden Blog-Beitrag wollen wir unser Vorgehen bei der semi-automatischen Lokalisierung von Orten vorstellen.
In diesem Blog-Beitrag geht es um die Verbindung von Forschung und Lehre im Bereich der Digital H... more In diesem Blog-Beitrag geht es um die Verbindung von Forschung und Lehre im Bereich der Digital Humanities. In der universitären Lehre sind die Digital Humanities oftmals nicht Teil des regulären universitären Curriculums. Im Folgenden werden die notwendigen Voraussetzungen für Studierende und Lehrende anhand unserer eigenen Lehre dargestellt. Dabei versteht sich dieser Beitrag auch als ein Ideengeber dafür, wie eine interdisziplinäre Lehre im Bereich der Digital Humanities aussehen kann.
In dem Beitrag wird ein neues Verfahren vorgestellt, die Karrierewege von mittelalterlichen Juris... more In dem Beitrag wird ein neues Verfahren vorgestellt, die Karrierewege von mittelalterlichen Juristen zu analysieren. Die sog. Pfründenitinerare sind keine Itinerare im landläufigen Sinne. Aufgelistet werden nicht Reisestationen, sondern Wirkungsorte der gelehrten Juristen, sprich: jene kirchlichen Institutionen, in denen für sie Pfründenbesitz nachgewiesen ist. In dem Modell werden also jene Orte, an denen ein Kleriker bepfründet war, in der chronologischen Reihenfolge des Pfründenerwerbs miteinander verbunden. Die so entstehenden Netzwerke können visualisiert und mit netzwerkanalytischen Methoden weiter untersucht werden.
In unserem letzten Beitrag haben Clemens Beck und Georg Zwilling bereits auf die Notwendigkeit ei... more In unserem letzten Beitrag haben Clemens Beck und Georg Zwilling bereits auf die Notwendigkeit einer Grammatik für die (semi-) automatische Auswertung des Repertorium Germanicums hingewiesen. Dieser Beitrag soll nun anhand etwas konkreterer Beispiele verdeutlichen, welche Schritte vollzogen werden müssen, um aus verschiedenen gleichartigen Sublemmas der Regesten eine allgemeingültige Grammatik entwickeln zu können.
In diesem Blog-Beitrag geht es um Annaten, deren Zahlungen ein häufiger Vorgang im Repertorium Ge... more In diesem Blog-Beitrag geht es um Annaten, deren Zahlungen ein häufiger Vorgang im Repertorium Germanicum (RG) sind. Im Folgenden werden einige Ergebnisse unserer Studie vorgestellt sowie Methoden zur Datenerfassung und Auswertung mithilfe der Netzwerkanalyse.

Wiederholt sind wir auf unserem Blog auf unsere Ansätze zur (semi-) automatischen Data Extraction... more Wiederholt sind wir auf unserem Blog auf unsere Ansätze zur (semi-) automatischen Data Extraction aus dem Repertorium Germanicum (RG) eingegangen. Je tiefer wir das RG erschließen wollten, desto mehr hatte sich der ursprünglich eingeschlagene Weg, über regular expressions den Inhalt der Lemmata zu erschließen, als problematisch für komplexere Auswertungen erwiesen.1 Stattdessen wurde ein digitales Werkzeug benötigt, das in der Lage war und ist, die charakteristische Struktur eines jeden Regestentyps eindeutig zu identifizieren. Dafür benutzen wir nach einer entsprechenden Recherche und Vergleich von Tools ANTLR (ANother Tool for Language Recognition)2. Zur Auswertung der Regesten des RG haben wir desweiteren eine Grammatik entwickelt. Eine Grammatik im informatischen Sinne bildet dabei alle Optionen ab, in der ein bestimmter Regestentyp ausgeformt sein kann. In diesem Beitrag wollen wir das Programm, dessen Wirkungsweise und den Aufbau unserer Grammatik näher vorstellen.
In den letzten Blog-Beiträgen haben wir uns mit den Problemen und Potentialen des von uns entwick... more In den letzten Blog-Beiträgen haben wir uns mit den Problemen und Potentialen des von uns entwickelten RG-Parsers1 und den Herausforderungen bei der Identifikation von mittelalterlichen Namen beschäftigt2 sowie unseren Erkenntnissen zum Wandel von Namen im Mittelalter beschäftigt3. Neben Personen sind die zweithäufigsten nicht ausgezeichnete Entitäten im Repertorium Germanicum die Ortschaften. Dieser Blog-Beitrag befasst sich daher mit der Identifikation von Städten, Gemeinden, Kommunen und Dörfern.
In unserem letzten Blogbeitrag1
schrieb Jan Engelhardt über die Schwierigkeit einer
gemeinsamen S... more In unserem letzten Blogbeitrag1
schrieb Jan Engelhardt über die Schwierigkeit einer
gemeinsamen Sprache zwischen Geschichte und Informatik am Beispiel der Komplexität
mittelalterlicher Namen. Der Natur der Sache entsprechend kam dabei die Antwort auf die
eigentliche Frage „Aber wie war es denn jetzt genau?“ etwas zu kurz. Einen kleiner Überblick
zu unseren bisherigen Erkenntnissen über mittelalterliche Namen im RG und allgemein wollen
wir in den folgenden Zeilen geben.
Auf der Suche nach einer gemeinsamen Sprache zwischen exakten und nicht exakten
Wissenschaften.
Dieser Blog-Beitrag beschäftigt sich mit den Problemen und Potentialen eines Parser, der den stru... more Dieser Blog-Beitrag beschäftigt sich mit den Problemen und Potentialen eines Parser, der den strukturierten Text des Repertorium.Germanicums parst.
Ein Überblick über die Anreicherung der historischen Quellen mit digitalen Methoden und über erst... more Ein Überblick über die Anreicherung der historischen Quellen mit digitalen Methoden und über erste Ergebnisse unseres Projekts Core-H.
Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/M... more Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/Modells, Explanations and Processes in the historical sciences) ist eine interdisziplinäre Arbeitsgruppe an der Friedrich-Schiller-Universität Jena. Sie besteht vor allem aus Informatikern (Schwerpunkt KI-Forschung) und Historikern (Schwerpunkt Mittelalter). Core-H (Collaborative Open Research Environment for the Humanities) ist das erste Forschungsprojekt der Arbeitsgruppe MEPHisto, indem die Anforderungen an die Forschungsumgebung für geschichtswissenschaftliche Themenstellungen konkretisiert und einzelne Funktionalitäten prototypisch implementiert werden. In regelmäßigen Beiträgen stellen wir unsere Forschungsarbeit im Bereich Digital Humanities vor.
Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/M... more Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/Modells, Explanations and Processes in the historical sciences) ist eine interdisziplinäre Arbeitsgruppe an der Friedrich-Schiller-Universität Jena. Sie besteht vor allem aus Informatikern (Schwerpunkt KI-Forschung) und Historikern (Schwerpunkt Mittelalter). Core-H (Collaborative Open Research Environment for the Humanities) ist das erste Forschungsprojekt der Arbeitsgruppe MEPHisto, indem die Anforderungen an die Forschungsumgebung für geschichtswissenschaftliche Themenstellungen konkretisiert und einzelne Funktionalitäten prototypisch implementiert werden. In regelmäßigen Beiträgen stellen wir unsere Forschungsarbeit im Bereich Digital Humanities vor.

Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/M... more Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/Modells, Explanations and Processes in the historical sciences) ist eine interdisziplinäre Arbeitsgruppe an der Friedrich-Schiller-Universität Jena. Sie besteht vor allem aus Informatikern (Schwerpunkt KI-Forschung) und Historikern (Schwerpunkt Mittelalter). Core-H (Collaborative Open Research Environment for the Humanities) ist das erste Forschungsprojekt der Arbeitsgruppe MEPHisto, indem die Anforderungen an die Forschungsumgebung für geschichtswissenschaftliche Themenstellungen konkretisiert und einzelne Funktionalitäten prototypisch implementiert werden. In regelmäßigen Beiträgen stellen wir unsere Forschungsarbeit im Bereich Digital Humanities vor. Unsere sieben Kriterien Wie schon im vorherigen Beitrag angesprochen 1 haben wir sieben Kriterien für eine Forschungsumgebung definiert, die den Historischen Workflow unterstützen sollen. Im Folgenden wollen wir diese Kriterien nennen und erläutern:
Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/M... more Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/Modells, Explanations and Processes in the historical sciences) ist eine interdisziplinäre Arbeitsgruppe an der Friedrich-Schiller-Universität Jena. Sie besteht vor allem aus Informatikern (Schwerpunkt KI-Forschung) und Historikern (Schwerpunkt Mittelalter). Core-H (Collaborative Open Research Environment for the Humanities) ist das erste Forschungsprojekt der Arbeitsgruppe MEPHisto, indem die Anforderungen an die Forschungsumgebung für geschichtswissenschaftliche Themenstellungen konkretisiert und einzelne Funktionalitäten prototyppisch implementiert werden. In regelmäßigen Beiträgen stellen wir unsere Forschungsarbeit im Bereich Digital Humanities vor.
Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/M... more Über das Projekt MEPHisto (Modelle, Erklärungen und Prozesse in den historischen Wissenschaften/Modells, Explanations and Processes in the historical sciences) ist eine interdisziplinäre Arbeitsgruppe an der Friedrich-Schiller-Universität Jena. Sie besteht vor allem aus Informatikern (Schwerpunkt KI-Forschung) und Historikern (Schwerpunkt Mittelalter). Core-H (Collaborative Open Research Environment for the Humanities) ist das erste Forschungsprojekt der Arbeitsgruppe MEPHisto, indem die Anforderungen an die Forschungsumgebung für geschichtswissenschaftliche Themenstellungen konkretisiert und einzelne Funktionalitäten prototyppisch implementiert werden. In regelmäßigen Beiträgen stellen wir unsere Forschungsarbeit im Bereich Digital Humanities vor.
Projekt und die Vision Der Name unseres Projektes Core-H ist ein Akronym für Collaborative Open R... more Projekt und die Vision Der Name unseres Projektes Core-H ist ein Akronym für Collaborative Open Research Environment for the Humanities. "Collaborative" ist nicht nur ein Bestandteil des Namens unseres Projekts, sondern steht auch für die Vision, welche für unsere Arbeit maßgeblich und zielsetzend ist. Unser Ziel ist die Entwicklung eines Anforderungsprofils für eine kollaborativ nutzbare offene Forschungsumgebung für die Geisteswissenschaften, die wir in einem ersten Schritt durch die Implementierung von ausgewählten Prototypendieses als ersten Schritt verwirklichen wollen.
Uploads
Projects by MEPHisto Jena
schrieb Jan Engelhardt über die Schwierigkeit einer
gemeinsamen Sprache zwischen Geschichte und Informatik am Beispiel der Komplexität
mittelalterlicher Namen. Der Natur der Sache entsprechend kam dabei die Antwort auf die
eigentliche Frage „Aber wie war es denn jetzt genau?“ etwas zu kurz. Einen kleiner Überblick
zu unseren bisherigen Erkenntnissen über mittelalterliche Namen im RG und allgemein wollen
wir in den folgenden Zeilen geben.
schrieb Jan Engelhardt über die Schwierigkeit einer
gemeinsamen Sprache zwischen Geschichte und Informatik am Beispiel der Komplexität
mittelalterlicher Namen. Der Natur der Sache entsprechend kam dabei die Antwort auf die
eigentliche Frage „Aber wie war es denn jetzt genau?“ etwas zu kurz. Einen kleiner Überblick
zu unseren bisherigen Erkenntnissen über mittelalterliche Namen im RG und allgemein wollen
wir in den folgenden Zeilen geben.
The paper provides insights into the investigation of the structures and protagonists of the late medieval German church by means of information extraction and social network analysis. The basis of our survey is the Repertorium Germanicum, one of the largest editions of German medieval sources at all. For quite some time, historians have been discussing the automatic indexing and exploitation of the Repertorium Germanicum using digital methods. Also the potential of a network analytical evaluation of this material was already discussed. But so far these techniques have not been tested systematically. Until now, a major obstacle of the investigation of the manifold entanglements between medieval German clerics documented in the Repertorium Germanicum is a very laborious data gathering by hand. We therefore are currently working on a semi-automatic information extraction process for the Repertorium Germanicum on the basis of a knowledge base logically representing the historical information. For a formal and reusable representation of this information an ontology of medieval church and clerical prosopography is needed.
In this talk we will show how information extraction methods based on formal ontologies and social network analysis open a very efficient way to model and analyse large networks of hundreds of medieval clerical actors.
We will discuss the requirements for a semi-automatic information extraction from the Repertorium Germanicum, the main source for the “curial benefice market” in the 15th century. It consists of many thousands of Regesten deriving from the late medieval Vatican Registers and containing a huge amount of prosopographical data. The Regesten have an elaborated regular structure, which is based on the terminology of the late medieval Canon and Roman law. Based on these categories it is possible to create information extraction tools that allow for data harvesting from the Repertorium Germanicum. These tools will form the basis for the historical network analysis of the source material. Some examples of this analysis are shown in the presentation.
im Rahmen des dhmuc vom 12.April 2021.
Die Digitalisierung stellt die heutigen Geisteswissenschaften sowohl als Medien- wie auch als Methodenwandel vor vielfältige neue Herausforderungen. Auffällig ist u.a. die gegenwärtig bestehende Kluft zwischen der sich enorm rasch erweiternden digitalen Verfügbarkeit von Quellen und Literatur einerseits und einem überwiegend noch „analogen“ Arbeiten der Mehrzahl der HistorikerInnen andererseits. Um den historischen Forschungsprozess in seinem klassischen Dreischritt von Heuristik, Kritik und Interpretation tatsächlich möglichst weitgehend zu digitalisieren, bedarf es der Entwicklung digitaler Infrastrukturen, die zeitraubende Arbeitsprozesse (z.B. in der Quellenrecherche) effektivieren, die digitale Daten strukturiert verwalten und mathematische Analyseverfahren (z.B. Netzwerkanalyse) einbinden. Mit dieser Problemstellung befasst sich derzeit ein Team von Mediävisten und Informatikern an der Friedrich-Schiller-Universität Jena. Konkret soll eine Wissensbasis zur Erforschung gelehrter Eliten des 15. und frühen 16. Jahrhunderts entwickelt werden, deren technologische Beschaffenheit prototypisch für eine geschichtswissenschaftliche digitale Forschungsumgebung sein soll. Im Rahmen einer Pilotstudie analysieren wir derzeit Ausschnitte aus der digital (im TUSTEP-Format) vorliegenden Edition des Repertorium Germanicum (online), einer für den Bereich der Mediävistik vielleicht einzigartig umfassenden seriellen Quelle zur Geschichte der spätmittelalterlichen deutschen Kirche und Gesellschaft. Mit Techniken des Information Retrieval werden die in diesem Quellenkorpus enthaltenen Informationen zu deutschen Klerikern und ihren Aktivitäten an der päpstlichen Kurie erfasst, dann weiter strukturiert und insbes. unter Einsatz netzwerkanalytischer Verfahren nach konkreten historischen Fragen hin ausgewertet.