Eigentlich kenne ich den “Wortschatz” der Uni Leipzig schon sehr lange, habe mich aber noch nie wirklich damit beschäftigt und habe seinen enormen Nutzen bisher auch gar nicht verstanden. Jetzt aber vielleicht schon. Der Wortschatz bietet “korpus-basierte, monolinguale Wörterbücher” an, die er aus Zeitungen und zufällig ausgewählen Webseiten zusammenstellt. Diese Wörterbücher zeigen nun nicht Übersetzungen an, wie in einem normalen Wörterbuch, sondern “zusammenhängende” Wörter.
Das klingt alles sehr abstrakt und deshalb gebe ich ein Beispiel. Suche ich z.B. nach “Volkswagen”, kommt heraus: Porsche, Autobauer, VW, Wolfsburg, Kernmarke, bei, Pischetsrieder, Europas, DaimlerChrysler, BMW.
Das bedeutet schlichtweg, in einem Satz, in dem “Volkswagen” vorkommt, kommt auch auffällig häufig “Porsche”, “Autobauer”, “VW”, “Wolfsburg” usw. vor. Die Häufigkeiten werden dann ebenfalls ausgegeben.
Was bringt das Ganze nun?
Zum einen lassen sich so Kollokationen, also typische Wortverbindungen leicht finden. Zum Beispiel frage ich mich, wie man im Chinesischen ausdrückt “eine Chance nutzen”. Wie sollte ich das in einem normalen Wörterbuch finden? Ich kann nur nach “Chance” suchen und hoffen, dass zufällig ein Beispielsatz angegeben ist, der genau das aussagt. Das ist meistens nicht der Fall. Ich könnte bei Google verschiedene Kombinationen durchprobieren und schauen, welche am häufigsten vorkommt. Aber das ist zeitaufwändig und manchmal weiß man gar nicht das entsprechende Wort. In diesem Fall wäre mir nur “Chance” bekannt: 机会. Aber “nutzen” in diesem Zusammenhang? Keine Ahnung!
Die Lösung: Ich gebe 机会 im Wortschatz ein. Das Ergebnis dargestellt als lustige Mindmap:

(Quelle: Wortschatz Uni Leipzig)
Sie zeigt nun also an, welche Wörter besonders häufig mit 机会 zusammen im Satz vorkommen. Sehr wahrscheinlich gibt es auch eine Kombination, die “eine Chance nutzen” heißt, denn sicherlich existiert solch ein Ausdruck auch im Chinesischen. Ganz ohne Hintergrundwissen geht es zwar nun nicht, denn man muss sich nun immer noch für die richtige Kombination entscheiden. In diesem Fall ist es 把握, denn nur das ergibt hier Sinn. 把握机会 wäre also die richtige Kollokation für “eine Chance nutzen”. Das überprüft man dann im Zweifel doch nochmal per Google, ob es auch wirklich so häufig vorkommt. In diesem Fall tut es das.
Zum anderen kann man interessante Fragen statistisch beantworten. Zum Beispiel: War der Empfang des Dalai Lama durch Angela Merkel wirklich wichtig in China oder wurde das hier übertrieben dargestellt?
Suchen wir doch einfach mal nach 达赖, also “Dalai” im chinesischen Wortschatz. Ergebnis:

(Quelle: Wortschatz Uni Leipzig)
Man kann sehen: Besonders häufig im Zusammenhang mit “Dalai” kommt natürlich “Lama” vor. Das verwundert nun noch wirklich überhaupt nicht. Andere auffällig oft vorkommende Kombinationen mit dem Wort sind “Spaltung”, “Autonomie” oder auch “Unabhängigkeit”. Auch das ist noch nichts besonderes. Interessanter ist, dass bereits als 14.-häufigster Begriff der chinesische Name Angela Merkels “默克尔” vorkommt. Interessant und es bestätigt, dass der Besuch tatsächlich stark wahrgenommen wurde.
Ein anderes Beispiel: Essen Chinesen Hunde? Ich suche nach “狗”, also Hund und erhalte:

(Quelle: Wortschatz Uni Leipzig)
Keines der zusammenhängenden Wörter weist auf “Essen” hin. Es gibt “Tier”, “Haustier”, “Herrchen”, “(einen Hund) halten”, “Katze” usw.
Ich vergleiche dieses nun mit 猪, also “Schwein”:

(Quelle: Wortschatz Uni Leipzig)
Aha! Hier sieht die Sache anders aus. Sowohl 肉, als auch 猪肉 sind eng mit dem Schwein verbunden. Beide bedeuten “Fleisch” und “Schweinefleisch”. Daneben sind übrigens auch “Epidemie” und “krankheitserregend” häufig. Außerhalb der Grafik in der genaueren Übersicht steht auch noch 吃, also “essen”. Beim Hund gibt es das viel viel seltener (wenn auch nicht überhaupt nicht…).
Damit ist es also endlich bewiesen, der Hund korreliert in China fast gar nicht mit Essen!
Das klingt jetzt ganz witzig, aber die enorme Bedeutung, die dieser Wortschatz und andere technische Möglichkeiten zur automatischen Sprachverarbeitung im Zusammenhang mit dem Internet bieten, wird mir erst langsam klar. Z.B. kommt mir gerade die Idee so einen großen Begriff wie “Demokratie” innerhalb unterschiedlicher Sprachen und damit oft auch unterschiedlicher Kulturen zu untersuchen… Das Ganze von zu Hause mit dem Laptop auf dem Schoß. Ohne auch nur die kleinste Umfrage.



kommentiert