Beschreibung des Forschungsvorhabens

Das empirische Forschungsvorhaben untersucht den Sprachausbau des Mittelniederdeutschen vom 13. Jahrhundert bis zum Schreibsprachenwechsel im 16./17. Jahrhundert, mit dem das Mittelniederdeutsche seine Geltung als Schriftsprache an das Frühneuhochdeutsche verliert. Es leistet damit einen Beitrag zur Rekonstruktion der bislang erst punktuell untersuchten grammatischen Entwicklung des Mittelniederdeutschen als historischer Schriftsprache. Die Untersuchung konzentriert sich auf städtische Rechtssatzungen, und zwar aus mehreren Gründen: Sprachliche Ausbauprozesse finden sich mutmaßlich gerade in der Rechtsschriftlichkeit, die komplexe Rechtssachverhalte in allen rechtsrelevanten Aspekten kontextentbunden explizieren muss. In Rechtssatzungen geht es dabei in einem alltagspraktischen Sinne stets um konditionale Sachverhaltsrelationen, so dass untersucht werden kann, wie sich die grammatische Konstruktion von Konditionalität im Untersuchungszeitraum wandelt. Schließlich sind Rechtssatzungen lokalisier- und datierbar, so dass sich die zeiträumliche Entwicklungsdynamik des Ausbaus nachzeichnen lässt.

Entwickelt wird ein „interaktives“ Verfahren, das maschinelles Lernen und Expertenfeedback kombiniert. Auf diese Weise wird ein zentrales Problem bestehender Annotationsverfahren für historische Texte gelöst. Existierende Parsing- und Tagging-Verfahren der Computer- bzw. Korpuslinguistik setzen statische (a priori definierte) Grammatiken bzw. grammatische Kategorien voraus, was der historischen Dynamik der Grammatik nicht gerecht wird. Eine sich diachron entwickelnde, dynamische Grammatik mittels regelbasierter Textanalyseverfahren und Methoden des maschinellen Lernens im Korpus zu „entdecken“ und auf diese Weise den Sprachwandel evidenzbasiert zu rekonstruieren, ist ein Novum. Da dies gleichermaßen sprach-/grammatikhistorisches Wissen sowie Kenntnisse im Bereich der Computerlinguistik und Informatik voraussetzt, ist das Vorhaben als fächerübergreifendes Projekt konzipiert, das eine enge Kooperation der Fächer über den gesamten Förderzeitraum verlangt.

Das Projekt ist mittlerweile abgeschlossen (Laufzeit: 01.01.2017 bis 30.06.2020)

 

  • Zunahme syntaktischer Komplexität?
  • Wachsende Präferenz für verdichtende Konstruktionen?
  • Texttypenspezifik konditionaler Sachverhaltsdarstellungen?
  • Schreibsprachenwechsel zunächst nur "Lexikwechsel"?
  • Erfassung des konstruktionalen Ausbaus
  • Annotationen via human-in-the-loop
  • Abbildung von Ambiguität, Gradienz, Gradualität und Annotatorunsicherheit
  • Analysefortschritt durch maschinelles Lernen
  • Toolunterstützung basierend auf CorA
  • Diagrammatische Illustration der zeit-räumlichen Entwicklung
  • Darstellung der zeit-räumlichen Entwicklungsdynamiken
  • Entwicklung einer dynamischen Variante der Choroplethenkarte