2007年12月27日計算機数理科学専攻・情報数理モデル論講座
金森研究室(金森准教授)
我々の研究室では、機械学習の基礎理論の構築と実用的な学習アルゴリズムの開発を目指して研究を行っています。
研究のキーワードは「学習」です。もう少し付け加えると「統計的学習」とか「情報論的学習」などです。ここで言う学習とは、観測したり収集したデータから有用な情報を抽出して、将来起こりそうなことを予測したり意思決定を行うことを指しています。このような一連の情報処理をコンピュータに行わせたい、ということが動機付けになっていますので「機械学習」という言葉も使われています。さまざまな現実的な設定のもとで予測精度が高い学習方法を考えて、その方法が妥当であることを数学的に保証し、実用的なアルゴリズムを開発することが主な研究テーマです。
最近研究している面白い学習アルゴリズムの1つに、ブースティングという方法があります。「三人寄れば文珠の知恵」の諺の通り、あまり賢くないコンピュータ(学習アルゴリズム)をたくさん集めてとても賢いコンピュータを作ろうという方法です。ポイントは
- デタラメな予測より少しだけ精度が高い学習機械をたくさん集めて
- それらの間で適切な重みで多数決をする
ということです。出来るだけバラエティに富むように学習機械を集めてくることが大切です。賢い人が多いけれど均質な集団より、出来はほどほどだけど色んな人がいる集団のほうが、右図のように全体としての正答率は高くなり、これは(ある設定のもとで)数学的に示すことができます。
その他の研究テーマとして
- いろいろな状況のもとでの学習アルゴリズムの開発、例えば・・・
- 過去と将来でデータの分布が異なる(共変量シフト)ときの学習法
- データに大きなノイズが含まれるときのロバストな学習法
- 学習結果の信頼性を評価するための統計的方法
- 学習アルゴリズムの統計的性質を微分幾何の観点から調べる情報幾何学
- 最適化手法の学習アルゴリズムへの応用
- 確率最適化やロバスト最適化など不確実性のもとでの最適化法
などに取り組んでいます。同専攻の神保研究室や他大学の統計・学習関連の研究室と共同で研究やゼミを行う機会も多いです。