Uni Leipzig: Wortschatz

Eigentlich kenne ich den “Wortschatz” der Uni Leipzig schon sehr lange, habe mich aber noch nie wirklich damit beschäftigt und habe seinen enormen Nutzen bisher auch gar nicht verstanden. Jetzt aber vielleicht schon. Der Wortschatz bietet “korpus-basierte, monolinguale Wörterbücher” an, die er aus Zeitungen und zufällig ausgewählen Webseiten zusammenstellt. Diese Wörterbücher zeigen nun nicht Übersetzungen an, wie in einem normalen Wörterbuch, sondern “zusammenhängende” Wörter.

Das klingt alles sehr abstrakt und deshalb gebe ich ein Beispiel. Suche ich z.B. nach “Volkswagen”, kommt heraus: Porsche, Autobauer, VW, Wolfsburg, Kernmarke, bei, Pischetsrieder, Europas, DaimlerChrysler, BMW.

Das bedeutet schlichtweg, in einem Satz, in dem “Volkswagen” vorkommt, kommt auch auffällig häufig “Porsche”, “Autobauer”, “VW”, “Wolfsburg” usw. vor. Die Häufigkeiten werden dann ebenfalls ausgegeben.

Was bringt das Ganze nun?

Zum einen lassen sich so Kollokationen, also typische Wortverbindungen leicht finden. Zum Beispiel frage ich mich, wie man im Chinesischen ausdrückt “eine Chance nutzen”. Wie sollte ich das in einem normalen Wörterbuch finden? Ich kann nur nach “Chance” suchen und hoffen, dass zufällig ein Beispielsatz angegeben ist, der genau das aussagt. Das ist meistens nicht der Fall. Ich könnte bei Google verschiedene Kombinationen durchprobieren und schauen, welche am häufigsten vorkommt. Aber das ist zeitaufwändig und manchmal weiß man gar nicht das entsprechende Wort. In diesem Fall wäre mir nur “Chance” bekannt: 机会. Aber “nutzen” in diesem Zusammenhang? Keine Ahnung!

Die Lösung: Ich gebe 机会 im Wortschatz ein. Das Ergebnis dargestellt als lustige Mindmap:


(Quelle: Wortschatz Uni Leipzig)

Sie zeigt nun also an, welche Wörter besonders häufig mit 机会 zusammen im Satz vorkommen. Sehr wahrscheinlich gibt es auch eine Kombination, die “eine Chance nutzen” heißt, denn sicherlich existiert solch ein Ausdruck auch im Chinesischen. Ganz ohne Hintergrundwissen geht es zwar nun nicht, denn man muss sich nun immer noch für die richtige Kombination entscheiden. In diesem Fall ist es 把握, denn nur das ergibt hier Sinn. 把握机会 wäre also die richtige Kollokation für “eine Chance nutzen”. Das überprüft man dann im Zweifel doch nochmal per Google, ob es auch wirklich so häufig vorkommt. In diesem Fall tut es das.

Zum anderen kann man interessante Fragen statistisch beantworten. Zum Beispiel: War der Empfang des Dalai Lama durch Angela Merkel wirklich wichtig in China oder wurde das hier übertrieben dargestellt?

Suchen wir doch einfach mal nach 达赖, also “Dalai” im chinesischen Wortschatz. Ergebnis:


(Quelle: Wortschatz Uni Leipzig)

Man kann sehen: Besonders häufig im Zusammenhang mit “Dalai” kommt natürlich “Lama” vor. Das verwundert nun noch wirklich überhaupt nicht. Andere auffällig oft vorkommende Kombinationen mit dem Wort sind “Spaltung”, “Autonomie” oder auch “Unabhängigkeit”. Auch das ist noch nichts besonderes. Interessanter ist, dass bereits als 14.-häufigster Begriff der chinesische Name Angela Merkels “默克尔” vorkommt. Interessant und es bestätigt, dass der Besuch tatsächlich stark wahrgenommen wurde.

Ein anderes Beispiel: Essen Chinesen Hunde? Ich suche nach “狗”, also Hund und erhalte:


(Quelle: Wortschatz Uni Leipzig)

Keines der zusammenhängenden Wörter weist auf “Essen” hin. Es gibt “Tier”, “Haustier”, “Herrchen”, “(einen Hund) halten”, “Katze” usw.

Ich vergleiche dieses nun mit 猪, also “Schwein”:


(Quelle: Wortschatz Uni Leipzig)

Aha! Hier sieht die Sache anders aus. Sowohl 肉, als auch 猪肉 sind eng mit dem Schwein verbunden. Beide bedeuten “Fleisch” und “Schweinefleisch”. Daneben sind übrigens auch “Epidemie” und “krankheitserregend” häufig. Außerhalb der Grafik in der genaueren Übersicht steht auch noch 吃, also “essen”. Beim Hund gibt es das viel viel seltener (wenn auch nicht überhaupt nicht…).

Damit ist es also endlich bewiesen, der Hund korreliert in China fast gar nicht mit Essen!

Das klingt jetzt ganz witzig, aber die enorme Bedeutung, die dieser Wortschatz und andere technische Möglichkeiten zur automatischen Sprachverarbeitung im Zusammenhang mit dem Internet bieten, wird mir erst langsam klar. Z.B. kommt mir gerade die Idee so einen großen Begriff wie “Demokratie” innerhalb unterschiedlicher Sprachen und damit oft auch unterschiedlicher Kulturen zu untersuchen… Das Ganze von zu Hause mit dem Laptop auf dem Schoß. Ohne auch nur die kleinste Umfrage.

-
  • Facebook
  • Twitter
  • Google Bookmarks
  • del.icio.us
  • LinkedIn
  • MisterWong.DE
  • QQ书签

6 Kommentare zu “Uni Leipzig: Wortschatz”


  1. 1 kbb

    Coole Sache, auch wenn ich keine Ahnung von der chinesischen Sprache habe. Sieht wirklich richtig praktisch aus, das Tool ;-)

  2. 2 kbb

    Hab hier was gefunden: Ein neues China-Blog der FAZ von ihrem Korrespondenten Siemons. Hat bislang nur zwei kleine Alltagsgeschichten, bieten aber meiner Meinung nach ein angenehmes Gegengewicht zu den vielen Analysen, die wir so lesen müssen: http://faz-community.faz.net/blogs/peking/default.aspx

  3. 3 Wen Ji

    Endlich Kommt 宫保鸡丁

    首先准备上好鸡脯肉,净花生米(去皮的,把带皮的花生米放在开水里泡上十分钟后,就可以轻松剥去皮了)
    老抽、盐、辣椒酱、郫县豆瓣酱、糖,水淀粉、鸡蛋清、生粉、葱姜末、蒜末
    制作:鸡脯肉切丁+鸡蛋清、盐、生粉抓匀;
    锅上火入油,至4成热时,滑熟鸡肉丁,捞出;
    花生米入油锅,开小火炸熟,如果火太大,很容易炸焦未熟,吃口有种生的口感;
    两者准备工作完成后,取干净锅,下葱姜末、蒜末爆香,依次下郫县豆瓣酱、辣椒酱,老抽,+少量水,放如鸡丁略烧,勾芡,撒入花生米,淋油出锅;
    特点:咸鲜适中、色泽红亮

  4. 4 smiss

    kbb: Ja, auch insgesamt fand ich die Online-Ausgabe der FAZ in Sachen Chinaberichterstattung recht gelungen. Nettes Blog da, in dem Café, über das er schreibt, war ich auch schon und hab da auch direkt um die Ecke gewohnt. :)

  5. 5 smiss

    文姬: 太好了!做宫保鸡丁好像不是特别难。我今天上课的时候听到别人也做过宫保鸡丁,她说应该很容易,材料都能买。但是我却害怕,无论是什么菜,我对做饭都没有经验。

  6. 6 Jens

    Ich halte die Presse nicht unbedingt für repräsentativ für den Sprachgebrauch in der Bevölkerung.

    Gerade, wenn man “so einen großen Begriff wie “Demokratie” innerhalb unterschiedlicher Sprachen und damit oft auch unterschiedlicher Kulturen [...] untersuchen” will.

Einen Kommentar schreiben