next up previous
Next: 定性的表現の定量化 Up: No Title Previous: No Title

はじめに

 自然言語表現を受けて注目点を切り替える カメラワークが求められるスタジオ撮影や遠隔講義, 自律型ロボット といったシーンでは, ユーザとの定性的なコミュニケーションの結果 として映像を抽出する機能が求められる.
 これまでにも, アクティブカメラの制御を目的に, 自然言語を用いた カメラワークの理解[]や, 与えられた撮影対象にふさわしい ズーム率を自動的に決定する方法[]などが報告されている. しかし, これらでは, 自然言語の持つ曖昧性と空間キャプチャのための 定量的変換の方法が十分に検討されていなかったり, 取り込まれる空間情報が理解されてカメラの行動に反映されている わけではなかった.
 映像の内容の理解としては, 宮崎ら[]が, 教室での講義を 対象に, 5つの状況を捉えて, それぞれの状況において各ユーザがみたい 映像を調停の形で決定する方法を提案しているが, カメラの動きは 予め規定されたユーザの映像化ルールに基づいている.
 本研究では, 人間と計算機との空間情報の共有と円滑なコミュニケーション を目指して, パンチルト機能とズーム機能を備えたカメラを用いて, 視野内あるいは視野外に存在する複数の 物体を認識し, それらの間の位置関係を理解することについて 検討する.

Yutaka Sugano 平成13年3月15日