Kurzüberblick

Weitere Informationen

Datenbank von Präposition-Nomen-Verbindungen

 

 

PREPCON explorativ ist das erste Modul des Onlineformats „Präposition-Nomen-Verbindungen im Kontext“ (PREPCON), das vom Projekt Usuelle Wortverbindungen entwickelt und schrittweise publiziert wird. Es handelt sich um eine vollautomatische Datenbank, die die Vorkommenshäufigkeiten und -proportionen von deutschen Präposition-Nomen-Verbindungen mit rekurrenter interner Nullstelle dokumentiert. Die Datenbank kann sowohl nach Präpositionen als auch nach Nomina geordnet werden und lädt zur Exploration ein. (Der Terminus ‚Nomen‘ basiert auf der Definition in grammis 2.0).

Eckdaten in Stichpunkten

  • Datenbasis: TAGGED-T-gesamt, alle Korpora des Archivs TAGGED-T (Release: DeReKo-2010-II); ca. 1,5 Milliarden Wörter, morphosyntaktisch annotiert
  • Suchverfahren: COSMAS-II-Anfragen nach der Oberflächenform der Präposition, unmittelbar gefolgt von einem Nomen; Trefferreduktion auf 100.000 per Zufallsauswahl
  • Erhebungszeitraum: Mai 2014
  • 78.669 unterschiedliche Präposition-Nomen-Verbindungen mit Mindestvorkommenshäufigkeit 5 (Verbindungen mit geringeren Frequenzen gehen in die Berechnung relativer Frequenzen ein, sind jedoch nicht Teil der Datenbank)
  • 68 Präpositionen
  • 29.687 unterschiedliche Nomen
  • Abrufbare Informationen zu jeder Präposition-Nomen-Verbindung:
    • absolute und relative Frequenz
    • Rang in der Frequenzliste
    • 5 bis 25 automatisch selektierte KWIC-Zeilen

Hinweis: Da diese Datenbank auf den automatisch annotierten Texten in TAGGED-T-gesamt basiert, sind Fehler durch den TreeTagger (hier falsche Nomenzuordnung) nicht zu vermeiden. Wir haben die Datenbank von systematisch falschen Einträgen bereinigt, die sich automatisch finden und entfernen ließen.

Weitere Informationen

Akzeptieren

Diese Website verwendet Cookies. Durch die Nutzung dieser Webseite erklären Sie sich damit einverstanden, dass Cookies gesetzt werden. Datenschutzerklärung