Korpora

Korpora sind digitalisierte, maschinenlesbare Sammlungen authentischer Sprache, riesige Textdatenbanken also, die mithilfe automatischer Methoden durchsuchbar sind. Die Auswertung sprachlicher Massendaten verhilft zu einem sehr viel gesicherteren Urteil über typischen Sprachgebrauch als das mit der individuellen Sprachkompetenz auch nur annähernd möglich wäre.

Quantitative Auswertungen und statistische Clusteringverfahren führen zu neuen Einsichten darüber, auf welche Art und Weise viele Sprecher einer Sprachgemeinschaft verteilt über viele Texte und Zeitverläufe bestimmte sprachliche Einheiten auf dieselbe oder ähnliche Weise einsetzen.

Korpora sind – so groß sie auch sein mögen – trotzdem immer nur eine Stichprobe der Sprache. Man kann also nie sagen, dass ein sprachliches Phänomen nicht existiert, weil es im Korpus nicht nachweisbar war. Man kann sich aber, z.B. als Fremdsprachenlerner und -lehrer, an den Hinweisen einer Korpusanalyse zum Usus orientieren, z.B. zu besonders häufigen oder auch geringen Vorkommen sprachlicher Einheiten, zu verfestigten grammatischen Formen; zu aktuellen Bedeutungen, Situationsbezügen und Bewertungen oder zu Kombinationen zwischen Wörtern (Kollokationen) bzw. verfestigten Wendungen (Idiome, Sprichwörter usw.) u.v.a.m.

DeReKo; esTenTen; skTenTen; SNC

Weiterführende Fachinformationen