TOP > 研究活動 > 研究者総覧「情報知」 > 社会システム情報学専攻 > 情報社会基盤環境論講座 > 小川 泰弘

研究者総覧「情報知」

社会システム情報学専攻

氏 名
小川 泰弘(おがわ やすひろ)
講座等
情報社会基盤環境論講座
職 名
准教授
学 位
博士(工学)
研究分野
自然言語処理 / 機械翻訳 / 法律情報処理

研究内容

自然言語処理による多言語情報共有
■研究の概要■

知識と情報を幅広く共有することを目的とし、自然言語処理に関する研究を進めている。特にアジアでの情報共有に重点を置いている。これまでに、日本語形態素解析システム、日本語-ウイグル語機械翻訳システムの開発を行った。特に日本語-ウイグル語機械翻訳の研究では、翻訳システムだけでなく日本語-ウイグル語翻訳辞書の作成も行った。最近は、日本語法令の翻訳支援および法制執務(法令の起草・改正・運用)を支援する研究を行っている。法令の翻訳は、日本の法律を外国人に広く知らせることを目的とするだけでなく、アジアの国々における法制執務を支援するプロジェクトの一環でもある。

■研究テーマ■

(1) 日本語形態素解析

日本語の特徴に着目することで、従来より簡潔で、かつ日本語と類似したアジアの言語にも応用可能な形態素解析に関する研究を進めている。これまでの日本語形態素解析では、日本語の活用を前提として研究がなされてきた。しかし日本語が活用していないことを前提とする派生文法を利用することによって、これまで複雑な処理が必要であった動詞の変形(いわゆる活用)を簡明に表現することが可能となる。それに基づき、従来よりも接続規則数が少ない日本語形態素解析システムMAJOを開発した。

(2) 日本語-ウイグル語機械翻訳

日本語とウイグル語は言語分類において共に膠着言語であるとされ、語順がほぼ同じであるなど、構文的にも類似した点が多い。そのため日本語-ウイグル語翻訳は、日本語入力文の形態素解析が終了した段階で、各単語を対応するウイグル語の訳語に置き換えることで可能となる。さらに、我々の研究により、日本語だけでなくウイグル語も派生文法で記述できることを実証した。そして、我々が開発した日本語形態素解析システムMAJOを利用して、日本語-ウイグル語機械翻訳システムを実現した。

また、日本語-ウイグル語機械翻訳のために、日本語-ウイグル語電子辞書も作成した。これはウイグル語-日本語辞書を電子化し、その逆辞書という形式で日本語-ウイグル語辞書を半自動的に生成した。その際、ウイグル語-日本語辞書および日本語-ウイグル語辞書の各項目を約6年の歳月をかけて人手により修正した。

(3) 日本語法令翻訳支援

日本語の法令をより多くの外国人に理解してもらうことを目的に政府が進める日本語法令外国語訳プロジェクトに協力している。このプロジェクトでは、これまで翻訳者によって異なっていた法律用語の訳語の統一を図るとともに、現在の法令を速やかに翻訳することを目指している。

我々は、この研究の一環として、図に示すBilingual KWICを作成した。このシステムは、あらかじめ日本語文とその訳文を用意しておき、そこへ単語を入力すると、その単語の訳語を自動的に推定し、なおかつ単語と訳語がそれぞれ中心に来るように文を配置して表示する。これにより、同じ単語が異なる語に訳されているかどうか、また、異なる訳語がある場合はどのように訳し分けられているかの確認が簡単に行える。このBilingual KWICを用いて、訳語を統一した辞書の作成支援、さらにはその辞書に基づく翻訳支援を行っている。

■今後の展開■

(3)に示した法令翻訳プロジェクトは、日本国内にいる外国人に法令を周知するだけでなく、日本の法令を諸外国へ紹介し、その国の法令整備の支援をすることも目的としている。特に、旧社会主義国などでは、体制の変更に伴なう法令整備が追い付いていない面があり、日本などの先進国が協力している。こうした国々の中には、日本語と良く似た言語を利用する国もある。現在の法令翻訳プロジェクトは、英語への翻訳を主な目的としているが、我々の日本語-ウイグル語機械翻訳の研究を応用することで、そうした国々の言葉への翻訳が可能になると考えており、それらの実現を目指している。 また、法令の翻訳だけでなく、日本語の法制執務の支援として、法令のXML化や、法令改正の正しさの検証などについても研究している。
 
Bilingual KWIC

Bilingual KWIC

 

経歴

  • 2000年名古屋大学大学院工学研究科情報工学専攻博士課程(後期課程)修了。博士(工学)。
  • 2000年名古屋大学大学院工学研究科計算理工学専攻助手。
  • 2003年名古屋大学大学院情報科学研究科情報システム学専攻助手。
  • 2012年名古屋大学情報基盤センター准教授。現在に至る。

所属学会

  • 情報処理学会
  • 言語処理学会

主要論文・著書

  1. Bilingual KWIC - 対訳抽出の可視化による翻訳支援,言語処理学会第11回年次大会発表論文集,pp. 811-814 (2005).
  2. An Experiment on Japanese-Uighur Machine Translation and Its Evaluation, Machine Translation : From Real Users to Research, Lecture Notes in Computer Science Springer 3265, pp. 208-216 (2004).
  3. 日本語言い換え処理を利用した日本語-ウイグル語対訳辞書の拡充,自然言語処理,Vol. 11,No. 5,pp. 39-61 (2004).