Abteilung für linguistische und kulturelle Evolution Max-Planck-Institut für Menschheitsgeschichte Jena, Deutschland 2018-01-20 very long title P(A|B)=P(B|A)... 1 / 48
in der Forschung 2 Klassischer Sprachvergleich Die komparative Methode Die phylogenetische Rekonstruktion Erkenntnisse 3 Computergestützte Sprachforschung Probleme des klassischen Sprachvergleichs Grundlegendes Erkenntnisse 4 Jenseits von Sprachwandel 5 Ausblick 3 / 48
Substantiv Häufigkeit moderat Bedeutung «in einer [...] Büchse oder in einem Glas aufbewahrtes Nah- rungsmittel [...]» Synonyme «bewahrend», «erhaltend», «ohne Operation» Aussprache kɔnzˈɛrvə Ursprung Mittellatein conserva 8 / 48
in China (618⚶906 n. Chr.) Philosophen im alten Griechenland (ab 400 v. Chr.) Redner im alten Rom (ab 100 v. Chr.) Moderne Sprachpfleger wie B. Sick (2004) 9 / 48
ist nicht Sprachverfall. Sprachwandel ist allgegenwärtig und unvermeidbar. Sprachwandel folgt in Teilen universellen Tendenzen und Trends. Sprachwandel verläuft in Teilen systematisch. 12 / 48
Indian Old Greek Latin Sanskrit Jacob Grimm Rasmus Rask Undersøgelse om det gamle Nordiske Sprogs Oprindelse 1818 Deutsche Grammatik (Ausgabe II) 1822 13 / 48
Indian Old Greek Latin Sanskrit Indo-European Method for Language Comparison • intensive language comparison • identify regularly recurring similaritities → prove language relationship → reconstruct development of language families Jacob Grimm Rasmus Rask Undersøgelse om det gamle Nordiske Sprogs Oprindelse 1818 Deutsche Grammatik (Ausgabe II) 1822 13 / 48
Old Greek Latin "Fuß" Icelandic fótur ped- ποd- pāda pāda fótur pet- ποd- ótur ed- οd- āda Icelandic Latin Old Greek Old Indian f p π p itar- f p π p aðir ater atήr 13 / 48
Old Greek Latin Icelandic faðir pater πatήr pitar- "Vater" faðir pater πatήr pitar- ótur ed- οd- āda Icelandic Latin Old Greek Old Indian f p π p itar- f p π p aðir ater atήr 13 / 48
Old Greek Latin Icelandic faðir pater πatήr pitar- "Vater" ótur ed- οd- āda Icelandic Latin Old Greek Old Indian f p π p itar- f p π p aðir ater atήr 13 / 48
lautwandel, soweit er mechanisch vor sich geht, vollzieht sich nach ausnahmslosen gesetzen, d.h. die richtung der lautbewegung ist bei allen angehörigen einer sprachgenossenschaft, ausser dem Fall, dass dialektspaltung eintritt, stets dieselbe, und alle wörter, in denen der der lautbewegung unterworfene laut unter gleichen verhältnissen erscheint, werden ohne ausnahme von der änderung ergriffen. (Osthoff und Brugmann 1878: XIII) 14 / 48
Alphabets Was ist das für ein Buchstabe? Das ist ein P. Ich püsse euch alle, ganz besonders Averell, meinen Pleinen. Das reicht! Aber wohin gehen wir, wenn man uns wieder einfängt? Plappe Pleiner! 15 / 48
Alphabets Was ist das für ein Buchstabe? Das ist ein P. Ich püsse euch alle, ganz besonders Averell, meinen Pleinen. Das reicht! Aber wohin gehen wir, wenn man uns wieder einfängt? Plappe Pleiner! Liebe Kinder, heute habe ich Lucky Luke getroffen. Ich küsse euch, ganz besonders Averell, meinen Kleinen! Eure Ma Dalton 15 / 48
Alphabets Was ist das für ein Buchstabe? Das ist ein P. Ich püsse euch alle, ganz besonders Averell, meinen Pleinen. Das reicht! Aber wohin gehen wir, wenn man uns wieder einfängt? Plappe Pleiner! Liebe Pinder, heute habe ich Lucpy Lupe getroffen. Ich püsse euch, ganz besonders Averell, meinen Pleinen! Eure Ma Dalton 15 / 48
thun [...]. Was sonst die Wissenschaft von den Sprachen [...] zu einer der lebensvollsten macht, das tritt hier zunächst zurück. [...] Der Sprachhistoriker steht draußen vor seinem Gegenstande: hier der Anatom, da der Cadaver. Georg von der Gabelentz (1891) Klassischer Sprachvergleich 16 / 48
thun [...]. Was sonst die Wissenschaft von den Sprachen [...] zu einer der lebensvollsten macht, das tritt hier zunächst zurück. [...] Der Sprachhistoriker steht draußen vor seinem Gegenstande: hier der Anatom, da der Cadaver. Georg von der Gabelentz (1891) Klassischer Sprachvergleich 16 / 48
thun [...]. Was sonst die Wissenschaft von den Sprachen [...] zu einer der lebensvollsten macht, das tritt hier zunächst zurück. [...] Der Sprachhistoriker steht draußen vor seinem Gegenstande: hier der Anatom, da der Cadaver. Georg von der Gabelentz (1891) Klassischer Sprachvergleich 16 / 48
Kernmethode des historischen Sprachvergleichs. Das unantastbare Fundament, auf dem die historische Linguistik steht. Tatsächlich: Ein Oberbegriff für ein Sammelsurium an verschiedenen kaum standardisierten Techniken, die beständig weiterentwickelt werden. 17 / 48
Kernmethode des historischen Sprachvergleichs. Das unantastbare Fundament, auf dem die historische Linguistik steht. Tatsächlich: Ein Oberbegriff für ein Sammelsurium an verschiedenen kaum standardisierten Techniken, die beständig weiterentwickelt werden. Besser verstanden als ein Coverterm für alle Methoden des historischen Sprachvergleichs. 17 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... irreguläre Korrespondenz! 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... irreguläre Korrespondenz! 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... 19 / 48
Deutsch Kognatenliste Alinierung Korrespondenzliste Deutsch dünn d ʏ n DEU ENG Frequ. d θ 3 x d d 1 x n n 2 x m m 1 x ŋ ŋ 1 x Englisch thin θ ɪ n Deutsch Ding d ɪ ŋ English thing θ ɪ ŋ Deutsch dumm d ʊ m Englisch dumb d ʌ m Deutsch Dorn d ɔɐ n Englisch thorn θ ɔː n ... ... ... irreguläre Korrespondenz! 19 / 48
der Systematizität des Sprachwandels können wir im Rahmen des historischen Sprachvergleichs relativ sicher verwandte (kognate) Wörter ermitteln. 20 / 48
der Systematizität des Sprachwandels können wir im Rahmen des historischen Sprachvergleichs relativ sicher verwandte (kognate) Wörter ermitteln. Obwohl das Verfahren zum Ermitteln von Lautkorrespondenzen und kognaten Wörtern sehr formal gefasst und beschrieben werden kann, wird es vorwiegend manuell ausgeführt. 20 / 48
Rekonstruktion verstehen wir den Versuch, die Entwicklung einer Sprachfamilie in Form von Stammbäumen darzustellen. Die klassische phylogenetische Rekonstruktion in der Linguistik ist der Kladistik sehr ähnlich, wurde aber viel früher entwickelt. 21 / 48
Rekonstruktion verstehen wir den Versuch, die Entwicklung einer Sprachfamilie in Form von Stammbäumen darzustellen. Die klassische phylogenetische Rekonstruktion in der Linguistik ist der Kladistik sehr ähnlich, wurde aber viel früher entwickelt. Leider sind die Kriterien für die Verfahren kaum formalisiert und werden auch selten transparent angewendet. 21 / 48
fruchten, befruchten, Befruchtung, fruchtbar, fruchtig Frucht f. ‘der Fortpflanzung der eigenen Art dienendes Produkt einer Pflanze’, auch ‘ungeborenes Lebewesen’, übertragen ‘Ertrag’, ahd. fruht (9. Jh.), mhd. vruht, asächs. fruht, mnd. mnl. nl. vrucht beruhen auf einer frühen Entlehnung von gleichbed. lat. frūctus, abgeleitet vom Verb lat. fruī (frūctus sum) ‘genießen, Nutzen ziehen’ (verwandt mit brauchen, s. d.). Das Deminutiv Früchtchen hat die spezielle Bedeutung [...] Dt. «Frucht» in Pfei�er (1993, auch unter https://dwds.de) 24 / 48
fruchten, befruchten, Befruchtung, fruchtbar, fruchtig Frucht f. ‘der Fortpflanzung der eigenen Art dienendes Produkt einer Pflanze’, auch ‘ungeborenes Lebewesen’, übertragen ‘Ertrag’, ahd. fruht (9. Jh.), mhd. vruht, asächs. fruht, mnd. mnl. nl. vrucht beruhen auf einer frühen Entlehnung von gleichbed. lat. frūctus, abgeleitet vom Verb lat. fruī (frūctus sum) ‘genießen, Nutzen ziehen’ (verwandt mit brauchen, s. d.). Das Deminutiv Früchtchen hat die spezielle Bedeutung [...] ererbt von entlehnt von abgeleited von PIE *bhreu◌◌◌̯ Hg◌ ◌ ◌ ̑ - «benutzen» PIE *bhruHg◌ ◌ ◌ ̑ -ié- «benutzen» (Präsens) Urg. *ƀrūkan- «benutzen» AHD brūhhan «benutzen» D brauchen «brauchen» D Brauch «Brauch» AHD fruht «Gewinn, Frucht» D frugal «spärlich» Fr fruit “profit,fruit” Fr frugal “modest (food)” Lt fruor, fruī «ich genieße» Lt frūctus «Gewinn» Lt frux «Frucht, Korn» Lt frugalis «Nutzen bringend» Nach einer Illustration von Hans Geisler (Universität Düsseldorf) [...] Deutsch «Frucht» in Pfei�er (1993, auch unter https://dwds.de) 24 / 48
1925) Einsichten → Sprachwandel → Menschheitsgeschichte → Faktoren von Diversität in Sprache und Kultur → klassische Methoden stoßen an Grenzen → rein automatische Methoden ersetzen keine Expertenerfahrung und -intuition Hindernisse steigender Umfang von Datenmengen historischer Sprachvergleich große und diverse Sprachfamilien Heraus- forderungen Computergestützte Sprachforschung 26 / 48
1925) Einsichten → Sprachwandel → Menschheitsgeschichte → Faktoren von Diversität in Sprache und Kultur → klassische Methoden stoßen an Grenzen → rein automatische Methoden ersetzen keine Expertenerfahrung und -intuition Hindernisse steigender Umfang von Datenmengen historischer Sprachvergleich große und diverse Sprachfamilien Heraus- forderungen Computergestützte Sprachforschung 26 / 48
1925) Einsichten → Sprachwandel → Menschheitsgeschichte → Faktoren von Diversität in Sprache und Kultur → klassische Methoden stoßen an Grenzen → rein automatische Methoden ersetzen keine Expertenerfahrung und -intuition Hindernisse steigender Umfang von Datenmengen historischer Sprachvergleich große und diverse Sprachfamilien Heraus- forderungen Computergestützte Sprachforschung 26 / 48
Datierung von Sprachfamilien) automatisierte Ansätze zur Etymologie (Erkennung von kognaten Wörtern, Alinierung, Ermittlung von Lautkorrespondenzen) 31 / 48
PLAGIARY 1 die Zurueckhaltung die im Umgang mit dem Foederalismusbegriff ORIGINAL 1 die Zurueckhaltung die im Umgang mit dem Foederalismusbegriff PLAGIARY 2 zu beobachten ist mag zu einem gewissen ..Teil. darauf zuruec ORIGINAL 2 zu beobachten ist mag ..........n.ich.t zuletzt darauf zuruec PLAGIARY 3 kzufuehren sein dass sich ...waehre.nd. des 19 Jahrhunderts e ORIGINAL 3 kzufuehren sein dass sich im v.e.r.lauf des 19 Jahrhunderts e HTL2 1 LDTAPCLFSDGS PQKAAYVLWDQTIL QQDITPLPSHETHSA QKGELLALIC Type (1) Plagiaterkennung (Ausschnitt von Guttenbergs Dissertation) 33 / 48
WRONG 1 two b‑ or not two b‑ that is the question CORRECT 1 t‑o be or not t‑o be that is the question WRONG 2 Leavins‑t‑ine distance is the addict distance betwean strings CORRECT 2 Le‑venshtein‑ distance is the ed‑i‑t distance between strings WRONG 3 ”ad‑ress” ”concensus” and ”dependance” are of‑en misspelled CORRECT 3 ”address” ”consensus” and ”dependence” are often misspelled Type (1) Rechtschreibkorrektur 33 / 48
relativ leicht automatisierbar, fördern die Transparenz der vergleichenden Sprachforschung, können durch interaktive Software auch leicht manuell nachkorrigiert werden und 34 / 48
relativ leicht automatisierbar, fördern die Transparenz der vergleichenden Sprachforschung, können durch interaktive Software auch leicht manuell nachkorrigiert werden und sind daher ein perfektes Beispiel für computergestützte (im Gegensatz zu computerbasierter) Sprachforschung. 34 / 48
Wie alt ist eine Sprachfamilie? Welche Wörter wurden in der Ursprache gesprochen? Wo sind Wörter erhalten geblieben, wo verloren gegangen? Was sagt uns das Vokabular der Ursprache über die ursprüngliche Gemeinschaft der Sprecher? 37 / 48
Great Again!) Der Bann von Sprachursprungsfragen durch die Société de Linguistique de Paris: Die Gesellschaft gestattet keinerlei Diskussion zum Ursprung der Sprache oder zur Erschaffung einer Universalsprache. («Statuts» 1871: III, meine Übersetzung) 39 / 48
Great Again!) Der Bann von Sprachursprungsfragen durch die Société de Linguistique de Paris: Die Gesellschaft gestattet keinerlei Diskussion zum Ursprung der Sprache oder zur Erschaffung einer Universalsprache. («Statuts» 1871: III, meine Übersetzung) Seit der quantitativen Wende stellen wir als Linguisten neue Fragen oder trauen uns, lange nicht beachtete Fragen endlich wieder zu stellen. 39 / 48
die Forschungskräfte nicht überflüssig machen. Sie sollen den Forschenden vielmehr durch das Übernehmen der langweiligen Aufgaben Zeit geben, sich wichtigeren Forschungsfragen zu widmen. 41 / 48
die Forschungskräfte nicht überflüssig machen. Sie sollen den Forschenden vielmehr durch das Übernehmen der langweiligen Aufgaben Zeit geben, sich wichtigeren Forschungsfragen zu widmen. Als Beispiel dient hier die moderne Biologie, wie auch die computergestützten Übersetzung. 41 / 48
oder müssen wir uns ausdrücken? 1 Mir tut der Kopf weh. 2 Mir dröhnt der Schädel. 3 Meine Rübe pocht. 4 Ich hab ein fieses Ziehen in der Stirn. 43 / 48
part of a cluster with the central concept "fishscale" with a total of 10 nodes. Hover over forms for each link. Click on the forms to check their sources. Click HERE to export the current network. ty: Line weights: Coloring: Family silver leather fishscale bark coin fur snail skin, hide money shell 49 links for "silver" and "money": Language Family Form 1. Ignaciano Arawakan ne 2. Aymara, Central Aymaran ḳulʸḳi 3. Tsafiki Barbacoan kaˈla 4. Seselwa Creole French Creole larzan 5. Miao, White Hmong-Mien nyiaj 6. Breton Indo-European arhant 7. French Indo-European argent 8. Gaelic, Irish Indo-European airgead 9. Welsh Indo-European arian 10. Cofán Isolate koriΦĩʔdi 45 / 48
part of a cluster with the central concept "leg" with a total of 11 nodes. Hover over the e each link. Click on the forms to check their sources. Click HERE to export the current network. ity: Line weights: Coloring: Geolocation sphere, ball round footprint foot calf of leg circle thigh wheel leg hip buttocks 6 links for "foot" and "wheel": Language Family Form 1. Cofán Isolate c̷ɨʔtʰe 2. Puinave Isolate sim 3. Yaminahua Panoan taɨ 4. Wayampi Tupi pɨ 5. Pumé Unclassified taɔ 6. Ninam Yanomam mãhuk 45 / 48
sein? Wir werden viel mehr Daten haben, darunter mehr leicht vergleichbare Daten. Die Verwendung von Computern wird noch ein Stück normaler geworden sein für Linguisten. 47 / 48
sein? Wir werden viel mehr Daten haben, darunter mehr leicht vergleichbare Daten. Die Verwendung von Computern wird noch ein Stück normaler geworden sein für Linguisten. Auch wenn wir die ganz großen Fragen (Ursache des Sprachwandels, Ursprung der Sprache, automatische Erkennung von Fakenews) nicht lösen können, so werden wir doch mehr wissen, als heute. 47 / 48