Akademie

Berliner sichern den deutschen Wortschatz

Die Akademie der Wissenschaften baut ein digitales Informationssystem auf, um das Kulturgut Sprache und Wortschatz zu sichern.

Der Duden-Verlag hat seine Aktivitäten zuletzt merklich eingeschränkt. Nun soll der deutsche Wortschatz digital erfasst werden.

Der Duden-Verlag hat seine Aktivitäten zuletzt merklich eingeschränkt. Nun soll der deutsche Wortschatz digital erfasst werden.

Foto: picture-alliance

Berlin.  Mit einem groß angelegten Forschungsprogramm wollen Wissenschaftler den deutschen Wortschatz und dessen Entwicklungen vom Jahr 1600 bis in die Gegenwart digital erfassen, beschreiben und im Internet kostenfrei zugänglich machen. Anfang Januar hat an der Akademie der Wissenschaften Berlin-Brandenburg das „Zentrum für digitale Lexikographie“ (ZDL) die Arbeit aufgenommen. Das Projekt ist zunächst auf fünf Jahre angelegt und wird vom Bundesministerium für Bildung und Forschung mit insgesamt zehn Millionen Euro gefördert. Neben den Berlinern, die die Aktivitäten koordinieren, sind die Akademien in Göttingen, Leipzig und Mainz beteiligt.

„Wir steigen in eine neue Ära ein“, sagte der Berliner Arbeitsstellenleiter Alexander Geyken der Berliner Morgenpost: „Wir werden diejenigen sein, die über die Gegenwartssprache Auskunft geben können.“

Die Wissenschaftler müssen eine Lücke schließen, die durch den Rückzug privater Unternehmen aus dem Geschäft mit Wörterbüchern entstanden ist. Der Duden-Verlag hat seine Aktivitäten erheblich eingeschränkt, Bertelsmann hat seine Wahrig-Reihe sogar komplett eingestellt. Jetzt springt der Staat in die Bresche, um das Kulturgut Sprache und Wortschatz zu sichern.

Es geht darum, möglichst viele Sammlungen von Texten digital zu erfassen, die darin vorkommenden Begriffe zu sammeln und zu erklären. Im Ergebnis lässt sich dann mit wenigen Mausklicks ersehen, wie sich der Gebrauch oder auch die Bedeutung der Wörter verändert haben. „Das wird nicht nur für die Wissenschaft, sondern für alle, die die deutsche Sprache verwenden, von großer Bedeutung sein“, sagte Berlins Wissenschaftsstaatssekretär Steffen Krach (SPD).

Grundlage der Arbeit ist das bereits in der Akademie erstellte Digitale Wörterbuch der deutschen Sprache (DWDS). Schon aus dieser Sammlung, deren Basis erheblich erweitert wird, lassen sich gesellschaftliche Trends ablesen. Um auf der Höhe der Zeit zu sein, scannen die Sprachforscher zunehmend auch Einträge im Internet.

Vorbilder Frankreich und Großbritannien

Auch Zeitungen bilden eine wichtige Grundlage. Inzwischen wird etwa das Wort „Döner“ häufiger verwendet als die Imbisskonkurrenz „Currywurst“. Modische „Leggings“ haben im Sprachgebrauch zum klassischen Wort „Strumpfhose“ aufgeschlossen. Dennoch ist die statistische Basis aus wissenschaftlicher Sicht bisher zu gering, sagte der Computerlinguist Geyken. Man benötige zehn Millionen Dokumente, damit die Ergebnisse die Forscher einigermaßen zufriedenstellten.

Die Deutschen orientieren sich mit ihrer Wortschatzsammlung an den Vorbildern in Großbritannien und Frankreich. In Oxford widmen sich 100 Experten seit Jahren der Digitalisierung des englischen Wortschatzes. In Berlin und den anderen Städten sollen einmal 30 Experten arbeiten, die letzten Stellen werden gerade besetzt.

Berlin ist auch aus historischen Gründen zum Zentrum für die Wortschatzerfasser geworden. Hier liegen die Rechte für das Deutsche Wörterbuch. Dieses Standardwerk hatten die Brüder Jacob und Wilhelm Grimm 1838 begonnen. Bis zu ihrem Tod kamen sie aber nur bis zum Buchstaben E. Das Mammutprojekt wurde von Sprachwissenschaftlern vor allem in Berlin fortgesetzt. 1961 erschien zu DDR-Zeiten in Ost-Berlin der 32. und letzte Band. „Deshalb ist ein Projekt, wie wir es jetzt angehen, nirgendwo anders als in Berlin möglich“, sagte Geyken. Aus seiner Sicht ist das eine Daueraufgabe. „Man muss am Ball bleiben, um den Sprachwandel dauerhaft nachzuvollziehen.“

Die Vergangenheit steht im Regal. 32 Bände in grauem Einband. Der Grimm. Das Wörterbuch der deutschen Sprache. Begonnen von den Brüdern Grimm 1838, vollendet 1961 in der damaligen DDR, soll der Grimm den Wortschatz von 1600 bis in die Gegenwart darstellen.

Die Zukunft ist digital. Aber was sie jetzt in der Akademie der Wissenschaften Berlin-Brandenburg nahe dem Gendarmenmarkt begonnen haben, hat eine ähnliche Dimension wie der Grimm. Es soll aber nicht 123, sondern nur fünf Jahre dauern. Der gesamte deutsche Wortschatz, wie er in Sachbüchern, Zeitungen, Romanen, Gedichten, Gebrauchsanweisungen und Internet-Blogs geschrieben wird, soll digital erfasst und nutzbar gemacht werden.

Leiter der Arbeitsstelle ist Alexander Geyken. Sein Beruf vereint die beiden Professionen, die für dieses vom Bundesbildungsministerium geförderte Mammutvorhaben nötig sind. Er ist Computerlinguist, kennt sich also mit Sprache aus und mit moderner Technik. 30 Mitarbeiter soll das Team einmal umfassen, als Geyken im Jahr 2000 in der Akademie anfing, war er der Erste aus seiner Zunft. Hinzu kommt inzwischen ein großes Netzwerk von Zuarbeitern. Denn um einzelne Begriffe kompetent zu erklären, braucht es Fachwissen, über das Sprachwissenschaftler nicht in jedem Fall verfügen. Wissenschaftsstaatssekretär Steffen Krach lobt die „Kultur der Kooperation, die starke geisteswissenschaftliche Forschung und ihre hohe gesellschaftliche Relevanz, sowie nicht zuletzt den freien Zugang zu wissenschaftlichen Erkenntnissen, den wir in Berlin besonders fördern“.

Zu erklären gibt es viel in dem neuen Wörterbuch, seien es komplizierte Fachbegriffe zur Bautechnik oder einfach neue Wortschöpfungen. Geyken gibt in das digitale Wörterbuch der deutschen Sprache, entstanden aus dem sehr viel kleineren Vorläuferprojekt der Akademie, das Wort „Müllstrudel“ ein. Ein inzwischen gebräuchlicher Begriff für die sich mit der Meeresströmung bewegenden Plastikabfallteppiche in den Ozeanen. Das System kennt diesen Müllstrudel natürlich, weil er öfter in Zeitungen vorkommt, die zum bisher schon genutzten „Korpus“ gehört.

Vormarsch der Anglizismen wird noch deutlicher werden

Doch noch niemand hat sich die Mühe gemacht, eine genaue Definition hinzuzufügen oder die Herkunft zu erklären. Man ahnt, welche Arbeit in den kommenden Jahren auf Geyken und seine Mitstreiter zukommt. Das bisherige System liefert für den Laien interessante Auskünfte. So sieht man, wie in den Zeitungen das Wort Skateboard vergleichbare Begriffe wie Rollschuhe oder Inlineskates um Längen schlägt. Oder wie die Bratwurst immer noch deutlich häufiger erwähnt wird als die Currywurst, die vom aufstrebenden Döner bedrängt wird. Auch der vegetarische Falafel kommt immer stärker auf.

Man erkennt auch, dass die Wohnungsnot und die Mieterhöhung Ende der 80er-Jahren in den Medien deutlich häufiger erwähnt wurden, als es heutzutage der Fall ist. Manchmal gibt es statistische Fallen. So kam die asiatische Pfanne „Wok“ in den 90er-Jahren auf. Einzelne Treffer datieren aber von deutlich früher. Kein Wunder: Es gab in der DDR mal ein Waschmittel gleichen Namens.

Einen Unterschied zwischen qualitativ hochwertiger Literatur und Alltagsprosa wollen die Forscher bei Verhandlungen mit den Verlagen über die Nutzung ihrer Rechte für statistische Zwecke nicht machen. Was in Rosamunde-Pilcher-Büchern stehe, sei für die Gegenwartssprache ebenso relevant wie jene Wörter in preisgekrönten Romanen. Auch das Internet als Ort sprachlichen Ausdrucks wird künftig noch stärker durchpflügt. Absehbar ist, dass dadurch der Vormarsch von Anglizismen noch deutlicher wird als bisher schon.