要約

実世界の複雑な状況下において自律的に動作する計算機システムにとって,実世界における動的状況の理解は不可欠な機能である.このような動的状況の理解はコンピュータビジョンの分野において長年にわたり研究されており,これらの研究において得られた知見は,各種実世界システムに対して適用されている.

動的状況理解を実現するために,対象追跡は最も重要且つ基盤となる技術の一つである.何故なら,動的状況変化の多くは実世界中の対象の移動によって特徴付けられるからである.対象追跡に関する技術を実世界システムに適用するためには,(1)複雑な状況に対応可能,且つ(2)実時間処理可能な対象追跡法が必要である.

そこで本論文は,動的に変化する多様な状況に適応可能な実時間対象追跡システムを提案する.本論文の目的は,実世界の状況や与えられたタスクに応じて柔軟,且つ適応的に振る舞いを変化させながら,複数注視対象の追跡を継続することのできるシステムの実現である.

広範囲における複数対象の実時間追跡を実現するために,我々は分散協調視覚の考えに基づいてシステムを設計する.分散協調視覚システムは,複数の能動視覚エージェントにより構成されており,能動視覚エージェント間の協調動作によりシステム全体として与えられたタスクを実現している.能動視覚エージェントとは,シーンの観測を行う観測ステーション(アクティブカメラを備えた画像処理システム)の論理モデルである.能動視覚エージェント群による実時間対象追跡を実現するためには,(1)広範囲における対象検出及び追跡を行うためのアクティブカメラの設計,(2)アクティブカメラを用いた実時間対象追跡の実現,(3)複数対象の実時間追跡を目的とした能動視覚エージェント間の協調動作の実現,が技術的な課題として挙げられる.

まず,広範囲における能動的観測を行うために,我々は視点固定型パン・チルト・ズームカメラを開発した.このカメラは,投影中心と回転中心が常に一致するように較正されており,パン・チルト・ズームパラメータを変化させながら画像を撮影しても,画像間に視差が存在しないという性質を持つ.この性質により,(1)撮影画像集合から1枚のパノラマ画像を生成可能である(図1),(2)生成されたパノラマ画像から任意のパン・チルト・ズームで撮影される画像を抽出可能である(図2).こうした特性を利用することによって,任意のパン・チルト・ズームで観測された入力画像と生成背景画像との比較(背景差分)により対象物体の検出を行うアクティブカメラシステムが実現可能となる.

図1: ワイドパノラマ画像(180枚の観測画像から生成)

図2: 背景差分による対象検出
(左:観測画像,中:生成背景画像,右:差分画像)

次に,単一のアクティブカメラによる実時間対象検出・追跡のために,視点固定型パン・チルト・ズームカメラを用いた能動的背景差分法を提案する(図3).このシステムでは,システムの持つ視覚機能とカメラ制御機能をそれぞれ並行に動作するモジュールによって実現し,ダイナミックメモリを介した両機能間の実時間相互作用により,シーン中を移動する追跡対象の継続的追跡を実現している.ダイナミックメモリとは,並列プロセス間の情報交換のための共有メモリである.ダイナミックメモリを介するにより,各プロセスは非同期且つ任意のタイミングで,任意の時刻に観測された情報を獲得することが可能となる.このように画像観測・処理を行う視覚モジュールとカメラ制御を行う行動モジュールが動的インタラクションを行うことにより,ストップアンドセンスを繰り返さなければならなかった従来の能動的背景差分法と比べ,対象移動への追従性の高い滑らかなカメラ制御による対象追跡可能になった(実験結果 [動画] ).

図3: 視点固定型カメラに利用した視覚・行動モジュールによる能動的背景差分

能動視覚エージェント群の実時間協調動作を実現するために,我々は三層構成のインタラクションシステムを提案する.

本システムでは,各層における動的相互作用によって,システム全体として複雑な動的状況下における複数の移動対象の実時間追跡を可能としている(実験結果 [動画] .スナップショットを図5に示す).

図4: 3層構成アーキテクチャ
(下:intra-AVA層,中:intra-Agency層,上:inter-Agency層)

図5: 実験結果(スナップショット) [動画]