36
コーパスを用いた言語研究の一例 ドイツ語の場合201112

コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

コーパスを用いた言語研究の一例 ― ドイツ語の場合―

2011年12月

Page 2: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

この話の内容

• 日本とドイツにおける,コーパスを利用したドイツ語研究(の一面)を紹介

• ベルリンのDWDSを紹介

• マンハイム(IDS)のCOSMAS IIを紹介

• いくつかの事例の紹介

Page 3: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

ドイツ語コーパス研究前史

• ドイツで1970年前後

–Mannheimer Korpus I (=MKI,220万語)

– Limas-Korpus (100万語)

*microfiche(=微小な紙片)

現在はウェブでも

Page 4: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

MKI利用の研究例

K. Brinker: Das Passiv im heutigen Deutsch (現代ドイツ語の受動態)1971 調査結果の一例:受動文における動作主表示の割合

文芸作品 大衆小説 学術書 新聞 実用書

+動作主 13,4% 20,4% 16,3% 14.6% 2,2%

-動作主 86,6% 79,6% 83,7% 85,4% 97,8%

Page 5: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

日本では1990年前後

• Thomas Mann Corpus (九州大学・樋口研究室)

–どの程度使われていたかは不明

• Mannheimer Korpus I (大阪大学・細谷研究室)

– FDで購入,自作プログラム(MS-DOS上)で文字列検索(変化形対応)

– Windows以降は秀丸でgrepとタグジャンプ

• Limas-Korpus(マイクロフィッシュ)

–動詞ごとの用例などが検索可能

Page 6: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

研究方法の転換(1)

1980年代半ばごろまで:

作例の母語話者による文法性判断に基づく考察が

多かった(そうでない研究もあったが)

1. *Er betrat ein paar Schritte sein Zimmer. 彼は数歩部屋に入った。(対格目的語だと「数歩」は不可)

2. Er trat ein paar Schritte in sein Zimmer. 彼は数歩部屋に入った。(前置詞句なら「数歩」は可能)

成田(1987) 「移動の空間関係を表す4格目的語について」

Page 7: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

研究方法の転換(2-1)

• 作例の文法性を判断するのではなく実例を観察する方法

a) ジョンハ彼女ノ心臓ヲナイフデ刺シタ

b) ジョンハ彼女ノ心臓ニナイフヲ刺シタ

a)とb)はどちらも容認できるか?どちらが自然か?

Page 8: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

研究方法の転換(2-2)

集めた実例の観察から見えてくる

「「刺す」について手元に集まった用例を「~に~を」型と「~を~で」型に分けてみると,その用法にきわめて明瞭な違いがあることが分かる。つまり,「~に~を」型では刺した結果何か有用な物が生産されたり,求める状態が生じたりする。すべては平和なできごとである。これに対して,「~を~で」型ではすべての例が傷害を目的とした行動を指している。」

国広哲也編集 (1980)「日英語比較講座 第2巻 文法」編者補説(269ff.)

Page 9: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

ドイツ語の例

be-動詞と基礎動詞の用例比較調査など

(Mannheimer Korpus I と Limas-Korpus を利用)

(3a) ihmdat raten 彼に助言する

(3b) ihnakk beraten 彼に助言する

「コーパスを利用した実例の分析から,(3a)のパターン

(ihm raten)では「具体的な助言の内容」が ― 形式はさまざ

まながら ― 必ず表されているのに対して,(3b)のパターン

(ihn beraten)では「具体的な助言の内容」は表示されず,

文脈からも読み取れないということが分かりました。」

成田 (1994)「ドイツ語動詞の結合価と文の意味」

月刊「言語」1994年10月号

Page 10: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

体験的・コーパス利用の長短

• 便利な点

– 大量の用例を瞬時に集められる

– 網羅性(特定のコーパスについて)

– 予想外の事例などの発見

• 便利とはいえない点

– (研究方法によっては)大量の用例を,文脈を探し直して読む

ことが必要(初めから読んで集めた方が早いこともある)

– (原則として)容認されない事例を得ることは不可能

Page 11: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの紹介

http://www.dwds.de

Page 12: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの紹介

• DWDS: Digitales Wörterbuch der

Deutschen Sprache(ドイツ語電子辞書)

–Berlin-brandenburgische Akademie der

Wissenschaften (ベルリン・ブランデンブルク科

学アカデミー)

• 日本語簡易ハンドブック(2009年版)

(COSMAS IIとDWDSについての使用方法を説明) GCOE コーパスに基づく言語学教育研究拠点のサイト

Page 13: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの利用例(1) - 旧ウェブサイトで -

• Wortverlauf(語の使用の推移をグラフ化)

– Flugzeug(飛行機)

– Fräulein(ミス;お嬢さん)

※正確な数値ではなく,全体のイメージ把握

Page 14: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

Flugzeug

Page 15: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

Fräulein

Page 16: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの利用例(1b) - 旧ウェブサイトで -

• Wortverlauf(語の使用の推移をグラフ化)

– Flugzeug(飛行機)

• 1940年代の新聞の頻度が圧倒的に高い

•共起語上位はfeindlich(敵の),abschießen(撃墜する),britisch(英国の),Luftkampf(空中戦)など

– Fräulein(ミス;お嬢さん)

•徐々に減少.1970年代の突出の理由は不明.

Page 17: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

w1 F(w1) w2 F(w2) F(w1,w2) MI T-Score Log-L. Belege

1 Flugzeug 7231 feindlich 8811 1069 11.0428 32.6801 14529.6172 Suche

2 Flugzeug 7231 abschießen 1611 558 12.5562 23.6181 8861.8027 Suche

3 Flugzeug 7231 britisch 15484 495 9.1187 22.2086 5319.8213 Suche

4 Flugzeug 7231 Luftkampf 610 210 12.5474 14.4890 3321.4661 Suche

5 Flugzeug 7231 deutsch 117415 459 6.0870 21.1091 3000.2471 Suche

6 Flugzeug 7231 unsere 124575 448 5.9666 20.8275 2853.8684 Suche

7 Flugzeug 7231 Bombe 2661 209 10.4155 14.4462 2622.9985 Suche

8 Flugzeug 7231 werfen 17401 253 7.9820 15.8431 2308.1902 Suche

9 Flugzeug 7231 ab 55568 297 6.5382 17.0483 2118.3220 Suche

10 Flugzeug 7231 Jäger 2116 162 10.3786 12.7184 2023.4513 Suche

11 Flugzeug 7231 verlieren 20567 231 7.6096 15.1209 1987.2695 Suche

12 Flugzeug 7231 schießen 6424 185 8.9680 13.5743 1940.8613 Suche

13 Flugzeug 7231 eigen 55572 269 6.3953 16.2064 1864.7003 Suche

14 Flugzeug 7231 amerikanisch 22286 216 7.3969 14.6097 1794.1039 Suche

15 Flugzeug 7231 viermotorig 198 100 13.1004 9.9989 1679.6608 Suche

16 Flugzeug 7231 zwei 63547 240 6.0372 15.2560 1544.9143 Suche

17 Flugzeug 7231 Nacht 20367 183 7.2876 13.4412 1491.4703 Suche

18 Flugzeug 7231 vermissen 1529 119 10.4023 10.9007 1489.7147 Suche

19 Flugzeug 7231 Schiff 10712 156 7.9843 12.4407 1421.6094 Suche

20 Flugzeug 7231 vernichten 4675 135 8.9719 11.5958 1416.1036 Suche

21 Flugzeug 7231 Absturz 509 96 11.6793 9.7950 1383.0354 Suche

22 Flugzeug 7231 Flak-Artillerie 290 85 12.3153 9.2177 1309.9979 Suche

23 Flugzeug 7231 englisch 15250 155 7.4655 12.3795 1300.8268 Suche

24 Flugzeug 7231 bombardieren 899 97 10.8736 9.8436 1280.4530 Suche

25 Flugzeug 7231 weit 80556 215 5.5363 14.3469 1236.4196 Suche

Seite 1 von 41 >> >|

Page 18: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの利用例(2) - 旧ウェブサイトで -

• Kollokation(コロケーション)

– trinken(飲む)と結びつくことが多い名詞は?

1位 Kaffee (コーヒー)

2位 Bier (ビール)

3位 Wein (ワイン)...

Page 19: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

# w1 F(w1) w2 F(w2) F(w1,w2) MI T-Score Log-L. Belege

1 trinken 9725 Kaffee 4728 688 10.8776 26.2158 9154.6846 Suche

2 trinken 9725 essen 10075 680 9.7693 26.0469 7946.4927 Suche

3 trinken 9725 Bier 3747 512 10.7868 22.6146 6733.7109 Suche

4 trinken 9725 Wein 6560 509 9.9704 22.5385 6086.0356 Suche

5 trinken 9725 Glas 8043 497 9.6419 22.2656 5707.6309 Suche

6 trinken 9725 Tee 2731 326 10.5919 18.0438 4186.8408 Suche

7 trinken 9725 Schluck 1012 249 11.6354 15.7748 3591.9846 Suche

8 trinken 9725 Schnaps 1278 191 10.9161 13.8131 2542.4504 Suche

9 trinken 9725 trinken 9725 248 8.3651 15.7003 2394.1804 Suche

10 trinken 9725 Flasche 4146 214 9.3823 14.6068 2372.0500 Suche

11 trinken 9725 Wasser 23886 243 7.0393 15.4699 1897.6199 Suche

12 trinken 9725 Tasse 1894 150 10.0000 12.2355 1794.2567 Suche

13 trinken 9725 rauchen 2923 157 9.4397 12.5119 1752.1315 Suche

14 trinken 9725 Kognak 532 95 11.1729 9.7426 1300.5406 Suche

15 trinken 9725 Milch 3973 110 8.4837 10.4588 1078.6376 Suche

16 trinken 9725 Sekt 1762 90 9.3672 9.4725 994.4995 Suche

17 trinken 9725 Alkohol 2649 93 8.8263 9.6224 956.5377 Suche

18 trinken 9725 leer 8413 112 7.4273 10.5215 933.2943 Suche

19 trinken 9725 Whisky 479 64 10.7545 7.9954 835.6235 Suche

20 trinken 9725 zuviel 2828 80 8.5147 8.9198 787.6946 Suche

21 trinken 9725 sitzen 33067 127 5.6339 11.0425 745.1757 Suche

22 trinken 9725 Rotwein 728 61 10.0813 7.8030 736.2709 Suche

23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche

24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041 Suche

25 trinken 9725 müssen 232404 213 3.5668 13.3629 668.0143 Suche

Seite 1 von 37 >> >|

Page 20: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDSの利用例(3) - 旧ウェブサイトで -

• 類義語の分析

–benutzen 「利用する,使用する」

–gebrauchen 「利用する,使用する」

•統語構造も同じ[主格主語 - 対格目的語]

Page 21: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

benutzen と gebrauchen

Kollokationを上位50位まで見てみるとgebrauchen

には,Wort(語),Ausdruck(表現),Sprache(こと

ば),Wendung(言い回し),Fremdwort(外来語),

Ausrede(口実),Redewendung(慣用句),

Terminus(術語),Bezeichnung(名称),Anrede

(呼びかけ)など,「言葉」に関する目的語との組み合

わせが多いことがわかる.benutzenではWort(語),

Vorwand(言い逃れ)ぐらいしかない.

Page 22: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDS 新ウェブサイト試用

DWDS-Wortprofil 2010

キーワードと共起する可能性の高い語を表示

trocknen の場合

Augen Farbe Gesicht Hände Lack Sonne

Tränen Wind Wäsche Wäsche am_Ofen

an_Luft in_Sonne läßt

Page 23: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDS 新ウェブサイト試用

単純なコロケーション分析ではなく,キーワードとの文法関係ごとに表示可能。

Relationenfilterで Subjekt (Aktiv) を選択すると

Farbe Lack Sonne Wind Wäsche これらの名詞がtrocknenの主語になる割合が高いことがわかる。

SonneとWindが変化を引き起こす主体,Farbe,Lack,Wäscheが変化主体であることは事例で確認可能。

Page 24: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

DWDS 新ウェブサイト試用

Relationenfilterで Akkusativobjekt を選択すると

Augen Gesicht Hände Tränen Wäsche

これらの名詞がtrocknenの4格目的語になる割合が高いことがわかる。

中でもTränenが目的語になることが特に多いことがわかる。

正確な数値は Tabellenansichtで確認できる。

Page 26: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

COSMAS II の紹介

• COSMAS = Corpus Search, Management and Analysis System

• IDS (Institut für deutsche Sprache)のプロジェクト

• 日本語簡易ハンドブック(2009年版)

(COSMAS IIとDWDSについての使用方法を説明)

GCOE コーパスに基づく言語学教育研究拠点のサイト

Page 27: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

COSMAS II の利用例

語形をめぐって

• 動詞の変化形:実際に使われているか

– trinken(飲む)の過去形,特に2人称は少ないということの確認(ただしほとんどが新聞の書き言葉コーパスだということも考慮する必要あり)

• dieser (この)と jener (あの) の出現頻度の差

• diesen Jahres という「誤用」の増加

Page 28: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

trinkenの現在形と過去形

trinken 44632 tranken 3494

trinke 4168 (ich/er/sie/es)

trank 5586

(er/sie/es/ ihr)

trinkt 11629

trankt 0

trinkst 233 trankst 2

2011年11月29日の調査

Page 29: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

trinkenの完了形

• 完了形: haben + getrunken(<trinken)

&haben /+s0 getrunken で検索

→ 9460 例ヒット

• 個別に見ると

habe /+s0 getrunken 2547

hast /+s0 getrunken 70 (2人称単数)

hat /+s0 getrunken 1311

habt /+s0 getrunken 13 (2人称複数)

Page 30: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

dies- vs. jen-

dieser 2,047,607 jener 113,740

dieses 1,005,030 jenes 38,573

diesem 1,857,114 jenem 44,246

diesen 805,186 jenen 79,256

diese 1,930,180 jene 198,201

合計 7,645,117 合計 474,016

2011年11月29日の調査

Page 31: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

diesen Jahres?

diesen Jahres 9,785 dieses Jahres 87,790

Monats 199 Monats 2,817

Wochenendes 0 Wochenendes 566

Tages 9 Tages 2,139

Morgens 0 Morgens 51

Abends 4 Abends 2,484

2011年11月29日の調査

Page 32: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

diesen Jahres? (2010/11/15)

diesen Jahres 9514 dieses Jahres 85129

Monats 196 Monats 2751

Wochenendes 0 Wochenendes 547

Tages 9 Tages 2091

Morgens 0 Morgens 51

Abends 4 Abends 2394

Page 33: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

事例分析(1-1)

• IDSのプロジェクト grammis のモジュール Grammatik in Fragen und Antworten(=文法Q&A)では,コーパス調査に基づき格語尾の「誤用」を説明

dieses Jahres(今年の) 65290 例

*diesen Jahres(今年の) 5712 例 (IDSの書き言葉コーパスによる)

dies- は冠詞類なので,中性属格の語尾は-esが正しいが,形容詞の語尾である-enになっている事例が意外と多い(ここ30年ほど急増)

Page 34: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

事例分析(1-2)

• 他の名詞を調査 ⇒ 「誤用」はJahresが圧倒的に多い.

• 規定語が形容詞の場合(語尾は-en)を調査して,この「誤用」の多頻度を説明.

vergangenen Jahres (昨年) 25.290 例

nächsten Jahres (翌年) 14.281 例

kommenden Jahres (来年) 6.502 例

letzten Jahres (前年) 12.682 例

Page 35: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

事例分析(1-3)

• 「去年・昨年」と「翌年・来年」の規定語はどちらも形容詞.

vergangenen diesen nächsten

letzten diesen kommenden

(去・昨) (今) (翌・来)

• それにつられて指示冠詞dieser(この)も形容

詞の語尾になってしまっていると,この「誤用」の多頻度を説明.

Page 36: コーパスを用いた言語研究の一例 ドイツ語の場合23 trinken 9725 gern 12559 99 6.6713 9.8522 721.3235 Suche 24 trinken 9725 mehr 154932 187 3.9640 12.7985 681.4041

今日はここまで