本文ここから

自然言語理解における意味選択過程

氏名 呂 軍
学位の種類 工学博士
学位記番号 博甲第34号
学位授与の日付 平成3年3月25日
学位論文の題目 自然言語理解における意味選択過程
論文審査委員
 主査 教授 松野 孝一郎
 副査 教授 矢野 圭司
 副査 教授 三井 幸雄
 副査 助教授 曽田 邦嗣
 副査 助教授 中村 和郎

平成2(1990)年度博士論文題名一覧] [博士論文題名一覧]に戻る.

目次
第1章 序論 p.1
1.はじめに p.1
2.今までの研究 p.2
3.本論文の目的と構成 p.5
第2章 完全な文章の理解における単語当りの異なる意味の数 p.8
1.はじめに p.8
2.実験1 p.9
3.自然言語理解における意味選択過程 p.12
4.単語当りの平均情報量と単語当たりの異なる意味の数 p.14
4-1 情報量の概念 p.14
4-2 単語当りの平均情報量の定義 p.15
4-3 単語当たりの平均情報量と単語当りの異なる意味の数 p.18
4-4 考察 p.20
5.まとめ p.24
第3章 不完全な文章の理解における単語当りの異なる意味の数 p.25
1.はじめに p.25
2.実験2 p.28
3.まとめ p.40
第4章 自然言語理解における文脈形成能力の限界 p.41
1.はじめに p.41
2.実験3 p.42
3.実験4 p.49
4.まとめ p.59
第5章 自然言語理解における意味選択能力の限界 p.57
1.はじめに p.57
2.実験5 p.58
3.まとめ p.65
第6章 結論 p.66
1.本論文のまとめ p.66
2.結論 p.68
付録 文章に現れる単語当りの異なる意味の数 p.69
1.はじめに p.69
2.測定1 p.70
3.測定2 p.71
4.測定3:文章に現れる単語当りの異なる意味の数 p.75
5.まとめ p.79
参考文献 p.80
謝辞 p.84

 自然言語理解には曖昧さを低減する心理情報過程が関与する。これまで、人間が文章を読む時、どのようにして単語の意味の曖昧さを解消するかについて、実験心理学に基づく手法を用いて種々の研究がなされて来た。しかし、単語に含まれる曖昧さについての定量評価はまだなされていない。例えば、われわれ人間が文章を読んで単語の意味を理解する時、いくつかの異なる意味の中から1つを選択するだろうか、との問題が提起される。本研究では、人間の自然言語理解における単語当たりの平均曖昧さを定量的に測定した。
 通常、1つの単語に含まれる異なる意味の数は2つ以上となるため、単語の意味は文脈によって決定されると考えられる。われわれ人間が文章を読みながら、単語の意味を理解する時、個々の単語の意味は文脈に基づいて選択され、決定される。この選択過程を明らかにするためには、個々の単語に含まれる異なる意味の数を定量することが必要となる。そのための定量測定法を提案した。具体的な測定手法は以下の通りである。
 先ず、文章を被験者に単語ずつ読ませて、既出の文脈のみに依存して単語の意味がわかるかどうかを判断させる。次に、文章を一度読み終えてから、同じ文章を被験者にもう一度繰り返して読ませ、個々の単語について同様の判定を求める。二回目の測定においてはそれぞれ個々の単語に対して一回目の判断をそのまま保留するかあるいは変更するかを判断させる。二回目の判定では、個々の単語の意味選択に既出のみならず、後出の文脈も関与することになる。一回目と二回目とのそれぞれの測定において、意味が判明したと判定される単語当たりの平均確率を定義することができる。この確率を、シャノンの情報量を定義する確率の関連づけることにより、単語当たりの平均情報量を定義することが可能となり、それに基づいて一回目と二回目との間で発生する新たな情報量を定量評価した。この情報量を測定することにより、日本語、英語、中国語の三つの自然言語につき、単語当たりの平均の異なる意味の数を明らかにした。単語当たりの平均の異なる意味の数はこの三つの自然言語の場合、いずれも2.81±0.06となることが判明した。一方、任意の単語配列を可能とする対称文法を伴う仮想言語の場合、既出の文脈によって単語の意味が全て曖昧さなく確定するとするならば、単語当たりの異なる意味の数はe(=2.781…)に漸近することが判明した。
 測定される単語当たりの異なる意味の数は文脈に依存するため、同様の測定を不自然な文脈を伴う文章についても行った。ここでの不自然な文脈とは完全なかつ自然な文脈からランダムに単語を抜きとったものに対応する。ランダムに抜き取る割合は1%から19%までを対象とした。抜き取る割合が上昇するにつれ、被験者にとっての単語当りの異なる意味の数も上昇する。19%抜き取りの場合、被験者が文脈を形成し得るとした時、単語当りの異なる意味の数は2.90より大きくなった。
 完全な文からランダムに抜き取られた単語が少なければ、文の全体の意味がまだわかるが、抜き取られた単語が多くなると、文の全体の意味がわからなくなる。即ち、文脈を形成することが出来なくなる。文脈を形成できる単語抜き取りの上限値は大略27%となった。単語抜き取り率が27%を超えると、被験者は最早文脈を形成することが出来なくなる。
 文脈が形成できる限界の27%単語抜き取り文章につき、ここで提案した測定法に基づいて単語当りの異なる意味の数を算定したところ、その値は凡そ3.3となった。単語当りの異なる意味の数が3.3ぐらいを超えると、被験者は単語の意味を選択することが出来なくなる。
 以上のことをまとめると、次の通りになる。通常、被験者は文章を読む時、殆ど無意識の内に単語の意味を選択してしまう。文章の不完全性が増大するにつれ、被験者にとっての単語当たりの異なる意味の数は増大してしまう。このことは被験者の脳における言語処理機構に課せられる選択肢が増大し、かつその中からの選択が実際に要請されることに対応する。即ち、以前に為した選択を絶えず修正する過程が付随していることに対応する。そのため、被験者が不完全な文章を読む時、完全な文章の場合に比べて単語の意味についての判断が結果において間違う機会が増大する。言語処理を行う脳は単語の意味を選択すると言う判断を行うと同時に、以前の判断を絶えず修正し続けると言う二つの機能を備えていることになる。この二つの特性を本研究において明らかにすることが出来た。

非公開論文

お気に入り

マイメニューの機能は、JavaScriptが無効なため使用できません。ご利用になるには、JavaScriptを有効にしてください。

ページの先頭へ戻る