Informationsverteilung und Sprachstruktur – Korrelation von grammatischen Ausprägungen der Nomen/Verb-Unterscheidung und lexikalischem Informationsgehalt im Tagalog, Indonesischen und Deutschen / Information distribution and language structure - correlation of grammatical expressions of the noun/verb distinction and lexical information content in Tagalog, Indonesian and German
Informationsverteilung und Sprachstruktur – Korrelation von grammatischen Ausprägungen der Nomen/Verb-Unterscheidung und lexikalischem Informationsgehalt im Tagalog, Indonesischen und Deutschen
Titel (Englisch)
Information distribution and language structure - correlation of grammatical expressions of the noun/verb distinction and lexical information content in Tagalog, Indonesian and German
Beschreibung (Deutsch)
Thema ist die Manifestierung von Variabilität in der formalen Unterscheidung von Wortarten auf der Diskursebene: Korreliert die unterschiedliche formale Ausprägung der Nomen/Verb-Unterscheidung mit Unterschieden im Informationsgehalt der Wortformen? Die Vorhersage ist, dass sprachliche Information in Sprachen mit schwach ausgeprägten formalen Unterschieden zwischen Nomen und Verben anders verteilt ist als in Sprachen mit stark ausgeprägten Unterschieden. Verglichen werden Tagalog (geringe N / V-Unterscheidung), Deutsch (starke N / V-Unterscheidung) und Indonesisch (Zwischenposition).
Die Methodik ist Klassifikation von Wortformen auf der Basis ihres Informationsgehalts in Default- (erwartbare) und Non-Default (überraschende)-Formen und die Überprüfung von Korrelationen mit grammatisch definierbaren Klassen.
Der technologische Output ist ein Analyse-Tool mit Implementationen der informationstheoretischen Konzepte.
Beschreibung (Englisch)
The topic is the manifestation of variability in the formal differentiation of word types at the discourse level: Does the different formal expression of the noun/verb distinction correlate with differences in the information content of the word forms? The prediction is that linguistic information is distributed differently in languages with weak formal differences between nouns and verbs than in languages with strong formal differences. In this project, Tagalog (low N / V distinction), German (strong N / V distinction) and Indonesian (intermediate position) will be compared.
The methodology is to classify word forms on the basis of their information content into default (i.e. expectable) and non-default (i.e. surprising) forms and to check correlations with grammatically definable classes.
The technological output is an analysis tool with the implementations of information theory-concepts.