senshu  /  ippan
 space

研究紹介 二宮

自然言語の構文解析に関する研究
二宮 崇(電子情報工学専攻)

英語や日本語などの自然言語で書かれたテキストをコンピュータ上で処理する技術は「自然言語処理」と呼ばれ、代表的な技術として仮名漢字変換や機械翻訳、テキストからの情報抽出等があります。構文解析は自然言語処理の重要な基礎技術の一つであり、与えられた文の構造、例えば、句や節、動詞の主語目的語、関係節、分詞構文、句の係り受け等の構文構造の解析を行います。本研究では、HPSGと呼ばれる言語学で研究されている文法理論に基づく構文解析の研究を行っています。HPSGは、精密な解析を与えてくれる一方、辞書や文法のわずかな間違いで解析に失敗するという脆弱性の問題や、解析速度の問題を抱えています。そこで、脆弱性の問題を解決するため、正解データからの帰納推論による文法学習の研究を行っています。また、スーパータガーと呼ばれる辞書項目選択の確率モデルを構文解析に導入する研究や、決定性構文解析の研究を行っており、HPSG構文解析の高精度化と高速化を実現しています。現在はこれらの研究をさらに発展させ、日本語の主格や目的格を解析する日本語格解析の研究を行っています。例えば、「太郎は花子を愛している」という文では「太郎」が主格で「花子」が目的格となります。受動態や関係節では助詞と格の関係が変化するため格解析は構文構造とも大きく関係しています。本研究では構文構造の解析と格の解析を同時に実現するHPSG文法の理論化と開発を行っています。

img2


 [ キーワード ]   知能情報学   自然言語処理   構文解析