unknown@wiki 正面顔検出

※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

与えられた画像中の顔を検出するには、顔と顔以外のものを正確に区別できる識別器が必要である。顔と顔以外の対象の識別では、顔以外の対象は無数に存在し、それらすべてを訓練データとして学習することは不可能である。また、人毎に顔の形や目鼻等の顔の部品も異なっているので、顔のクラスも変動も少なくない。そのため、未学習の顔を顔として識別でき、しかも、あらゆる顔以外の対象を顔以外に識別できるような識別器を比較的小数の訓練サンプルから学習しなければならない。そのためには、汎化性能の高い手法が必要となる。

顔検出手法には、肌色情報を用いた方法や顔の部品に注目する方法などようのに顔に関する知識を利用する方法と訓練サンプルとして多くの顔画像と顔以外の対象の画像を用意し、学習により顔検出のための識別器を構成するExample-based 顔検出法がある。

肌色情報は、高速な処理が可能であること、また、画像内の顔の大きさ、回転、 多少の向きの変化等に影響を受け難い等の理由から,、顔の検出では頻繁に利用されている[35,110]。しかし、色恒常性等の難しい問題もあり、 明るさが動的に変化する環境下では色情報のみで顔検出することは容易ではない。そのため、明るさの変化の影響を受け難い表色系を利用することにより対処していることが多い[109,107,108]。人間が顔の認識する場合には、色情報よりも濃淡情報の方が重要であるとの心理学的知見もあり [47,18]、 形状情報を全用いないで色情報のみで顔を正確に検出することは難しい。むしろ、色情報は画像中からの初期候補を絞り込むために利用するのが良いと考えられる。

心理学の知見によれば、人間は顔写真を見せられた時、目、鼻、口を重点的に見ることが報告されている[112,6]。こうした心理学の知見に基づき、目、鼻、口を検出して、その位置から顔を検出する手法が開発されている[113]。しかし、画像中から目、鼻、口を検出する問題は、顔を検出する問題と同等の難しさを含んでおり、必ずしもそれらを安定に検出できるとは限らない。

Example-based顔検出法では、多くの訓練サンプルから未学習のデータに対して誤り無く識別できる識別器を構成するための方法が重要となる。ニューラルネットワークは、そのための代表的な統計手法である。Rowley等[93]は、多層パーセプトロンを顔検出のための顔と顔以外の対象の識別に利用した。この手法は、現在、最も有名な顔検出法のひとつと見なされている。ニューラルネットに関しては、すでに多くの解説等もあるので、ここでは、顔検出に利用可能で、最近注目されている統計手法として、サポートベクターマシンとそれに関連してロジスティック回帰を紹介する。