2012年10月05日メディア科学専攻・音声映像科学講座
村瀬研究室(村瀬洋教授、井手一郎准教授、出口大輔准教授)
私たちの研究室では、コンピュータで画像や映像を認識し、人間の視覚情報処理機能を支援する研究を行っています。「百聞は一見にしかず」、「人間は外部情報の8割以上を視覚情報で得ている」と言われるように、視覚情報は、人間と外界とのインタフェースにとって非常に重要な役割を果たしています。画像や映像を認識することができれば、人間の代わりに外界を認識して人間を支援することや、視覚に頼る大変な作業を機械が代行することが可能になります.私たちの研究室ではこのようなシステムの実現を目指し、画像や映像の認識の研究を以下に示す3つのサブグループで進めています。
(1) ITSグループ
自動車を運転する際は、運転者は視覚で周囲環境に注意を払う必要があります。例えば、歩行者や自転車の飛び出し、信号機の状態、道路標識周囲の自動車の動きの確認、などのとても高度な視覚的な判断が必要となります。これらの周囲環境を機械で自動的に認識し、運転者を支援する研究を行っています。更に、運転者が対象物を見落としていないかを推定するといった人間の状態を認識する研究、次世代カーナビゲーションシステムのための映像地図の構築、自車位置の高精度推定に関する研究も行っています。
(2)認識グループ
近年,デジカメを高機能化するための技術や、防犯カメラを有効活用するための技術が求められています。それらを実現するために、顔認識、人物認識、文字認識、などの周囲の対象物を高精度に画像認識する研究を行っています。例えば、携帯カメラで撮影した遠方で小さい文字や記号などを高精度に認識する研究、防犯カメラなどにみられる低解像の画像を高解像度化して人にとって見やすく表示する研究、また複数の視点のカメラ画像を利用して人間の行動・属性、もしくは物体を高精度に認識する研究を行っています。
(3)メディアグループ
インターネット上の画像や映像、過去の大量の放送映像など、我々の身の回りには大量の画像や映像が存在しています。これらの画像や映像を人間にとって利用しやすいようにコンピュータで適切に加工し、人間を支援する研究を行っています。例えば、過去に放送された大量のニュース放送映像から、ある特定の事件を過去から現在にわたるまで追跡しその事件を人間にわかりやすく提示する研究、料理映像をレシピと対応付けることにより料理を支援する研究、ツイッター等のソーシャルメディアを利用してスポーツ映像を短時間に要約する研究などを行っています。