Interaktive Konstruktionsanalyse

Um eine qualitativ hochwertige, kontextsensitive Analyse unseres gesamten Korpus zu gewährleisten, die zudem die Dynamik der (historischen) Grammatikalität grundsätzlich berücksichtigt, entwickeln wir ein interaktives Verfahren. Wir verfolgen einen Human-in-the-loop-Ansatz, der Methoden des Maschinellen Lernens mit Expertenfeedback kombiniert. In diesem Ansatz werden die folgenden zwei Phasen iterativ durchlaufen, bis eine zufriedenstellende Analyse des Korpus erreicht ist.

  • Phase 1: Auf der Grundlage einer partiellen, unsicheren Annotation soll das System grammatische Muster und mögliche Grammatikregeln induzieren. Muster und Regeln haben dabei zunächst rein hypothetischen Charakter, und der Unsicherheit der Annotation soll durch eine adäquate Repräsentation der Unsicherheit der induzierten Regeln Rechnung getragen werden. 
  • Phase 2: Dem/der Experten/in wird die Möglichkeit gegeben, einzelne Vorschläge des Systems zu bestätigen oder zu verwerfen (oder unkommentiert und somit offen zu lassen). Auf diese Weise wird die bestehende Annotation erweitert und verbessert.  

Durch den Einsatz von Methoden des Maschinellen Lernens erreichen wir einen Analysefortschritt: Das Versehen eines Korpus mit Annotationen ist für Menschen eine anstrengende und zeitintensive Arbeit. Durch das Vorschlagen automatisch generierter Annotationen wollen wir die Annotierenden in ihrer Arbeit unterstützen und erhoffen uns zudem eine Zeitersparnis.

Um eine solche interaktive Konstruktionsanalyse zu realisieren, benötigen wir ein geeignetes Werkzeug. Das Annotationstool CorA hat sich bereits für die Annotation historischer Texte bewährt.  Aufgrund des Projektzieles, die Dynamik sprachlicher Entwicklungen zu fassen, nehmen wir Erweiterungen vor, die es erlauben

  • Ambiguität,
  • Gradienz und
  • Annotatorunsicherheit 

zu erfassen.