計算機の応用分野で,関節物体の姿勢推定に対する要求が高まりつつある.こ こでいう姿勢とは,対象物体の関節の曲がり具合がどのような状態にあるかを 規定するものである.仮想世界の構築を行うためには人体全体に対する姿勢推 定が必要であるし,機械の遠隔操作を想定するなら,手指の姿勢推定が重要と なる.また,計算機の端末にカメラを設置して計算機利用者の行動を数値化で きれば,ヒューマン・インターフェースの一助となる.
特に対象を人体や手指に限定する場合,関節物体の姿勢推定を行う一つのアプ ローチとして,人体や手指の円筒近似できる部分をリボンとして画像から抽出 し,段階的に統合していく方法が考えられる.
倉掛らは明確な人体モデルを持たず,画像中のエッジからリボンを抽出し,そ のリボンの接続関係を考察することによって平面内での関節物体の動作を認識 している[1].
また,ユーニパンらはカラー画像を用いて肌色領域を抽出し,領域の形状から どの領域が腕であるかを判別した後,画像平面内での領域間の関係をもとに腕 の姿勢推定を行っている[2].
しかし,これらの手法では立体的な対象物モデルを持たないので,三次元的に 姿勢を再現することが難しい.これに対して,関節物体の空間的な形状,姿 勢,動作を直接認識するため,様々な研究が行われてきた.実用に近い方法で は,データグローブの装着や指先の着色などが挙げられる[3]. これらの方法の特徴は,対象となる人体に特別なマーカーや装置を付帯させる ことにある.しかしながら,こうした装着型のデバイスは認識対象である利用 者に負担を強いる.また,遠隔地の対象物体の姿勢推定を行うような状況にあ っては,そうした工夫自体が無理な場合があり,特別な装具に頼らない姿勢推 定法が求められる.
そこで,装着型のデバイスを用いるかわりに,人体に対応する立体的で明確な モデルを構築し,モデルマッチング手法により問題を解決しようとする研究が 行われている.この場合,人体に負担は強いられない.しかし,従来の研究で は,モデルマッチング処理の実現に際して,モデルに関する先見的な知識が多 くの場合予め組み込まれている.すなわち,画像特徴とモデルの特定の部分と の対応づけがヒューリスティックな知識によって行われている.最もよく見ら れるのが,人体モデルや手指モデルを用いる場合に,人体や手指の円筒近似で きる部分をリボンないし長方形領域という形の画像特徴に対応させる方法であ る [4,5].
例えば,木本らは,人体をスティックモデルで表現し,対象のシルエット領域 を心線化してモデルとの対応づけを行い,姿勢の解析を行っている [6].一方,ユーニパンらはMRFを用い,モデルの構造を利用して 長方形領域の抽出を効率よく行っているが,モデル自身は二次元内で動くこと しか考慮されていない[7].
画像特徴に領域の形状を用いない研究としては,石井らが人体の動作パターン の抽出を目的として,肌色領域の位置のみに注目し,ステレオ画像を使用する 研究が挙げられる[8].しかし,この研究では肌色領域がモデルの どこに対応するかがやはり予め考察により解決されている.島田らは手指に対 する姿勢推定方法を提案している[9]が,彼らの方法は画像上の 突起領域が指先に対応するという対象物体に関する知見をマッチング処理に採 り入れている.
このような画像の特徴とモデルとの対応づけをマッチング処理内部に予め組み 込んでおく方法はマッチング処理の高速化や効率化には有利であるが,その一 方でアルゴリズムの汎用性が犠牲となる.
そこで,本稿ではモデルを正確に表現することでマッチング処理を対象物体に 依存しないようにし,できるだけその一般的な定式化と解法を目指す.モデル と対象物体との合致度を高くすれば,画像からの特徴量はそれほど必要ないと の観点に立ち,シルエット画像を前提にしたマッチング処理方法について提案 する.
以下,2章では対象とする関節物体について述べ,それに対する モデルを定義する.3章では入力情報として用いるシルエッ ト画像などについて説明し,4章では本研究における姿勢推定 問題の定式化について述べ,5章で今回提案する方法について 述べる.さらに6章で本方法による実験とその結果への考察 を行う.最後に,7章で結論を述べる.