特徴比較の基本は正規化と測定~判定
前章と同様に顔認識を例にとり、2章における「特徴比較」を数学的に記述 しましょう。ただし具体的なアルゴリズムではありません。それこそ専門家が 知恵を絞る話であり、ここで述べるのはあくまで概念的な話です。
位置不変性を得るために、通常まず取り込んだ画像を幾何学的に補正します。 つまり顔とカメラの距離が少し離れて全体的に小さくなっていれば、それを標 準的サイズまで相似的に大きくするわけです。また全体に傾いていたら、回転 させて真っ直ぐにするわけです。さまざまな統計的分布の形状を比較する際、 そもそもデータ全体の平均や分散(散らばり具合)が全然違っていたら比べよ うがないので、平均がゼロ、分散が1となるよう、データ全体を簡単な規則で 変換するということがよく行われます。これをデータの正規化といいますが、 いわば画像の正規化を行うわけです。もちろん最初の登録の際にも、正規化さ せた上で特徴量を取り出すことになります。
正規化された入力画像から、今度は表情不変な特徴量を測定します。特徴量 として何をとるかというのが、顔認識技術の本質中の本質といえるでしょう。 ごく簡単な例をあげるなら、目の上下方向の幅という特徴量は、顔認識のため にはまったく意味を持ちません。同一人物の中で、目の疲れ具合はもちろん、 まばたきの直前直後などで大きく変化するからです。2つの目尻の間隔という 特徴量は、それに比べるとはるかに意味を持ちます。もちろんその特徴量だけ で顔認識が行えるわけでは、通常ありません。
特徴量は一般に複数種類ありますが、とにかくそれを測定し数値化します。 特徴量が一つに集約される場合、入力された顔の特徴量と、それが名乗る本人 として登録された顔の特徴量とを比べて判定を行います。その差なり比なりが、 最低基準より小さければ許容、最高基準より大きければ棄却、そしてその間に あれば保留(再試行または別の認識方法)ということにします。アルゴリズム によっては最低基準と最高基準とが等しい場合もあり、その場合は保留という ことはなく一発で許容か棄却かが決定されます。
sponsored link
このページ
のTOPへ


