ident
統計的物体同定
🇯🇵 🇬🇧

よく似た画像の組が,もともと同じものを写したものなのか,似たものだけれども違うものを写したものなのかを判別し,さらにその判別の確信度も統計的に評価しようという研究です.

この研究では,ある対象について,さまざまな画像を収集します(下の例では,さまざまな木の葉を集めています).さらに,「同じカテゴリーに属する画像の組(この例なら,同じ種類の木の葉の画像の組)」「異なるカテゴリーに属する画像の組」のそれぞれについて,画像の種々の特徴量(色調,空間周波数分布など)の隔たりを求めます.

そして,各「特徴量の隔たり」を軸とする座標空間で,「同じカテゴリーの組」を表す点に値0を,「異なるカテゴリーの組」を表す点に値1を与え,これらの点と値をもっともよく近似する関数を「ロジスティック回帰分析」で求めます.

新たに,同じカテゴリーか異なるカテゴリーかわからない画像の組が与えられたとき,これを上の特徴量空間にプロットして,その点に対応する関数の値を求めます.この値が「この画像の組が異なるカテゴリーに属する」ことの確信度となります.

 

ところで,ロジスティック回帰分析による判別は,ニューラルネットワークの考え方では2層の階層型ネットワークに相当します.ロジスティック回帰分析では,判別に用いる統計モデルは明確ですが,線形判別ですから,判別の境界が複雑な場合には対応できません.一方,ロジスティック回帰分析の拡張となる3層の階層型ネットワークでは,複雑な問題に対応できますが,判別に用いられている統計モデルが不明確ですし,学習による最適化を行うため計算時間がかかります.

そこで,ロジスティック回帰分析と3層の階層型ネットワークとを組み合わせて,線形判別でも判別できる部分はロジスティック回帰分析で,境界付近の微妙な判別についてはニューラルネットワークで判別します.この方法で,ニューラルネットワークだけを用いる場合よりも,判別精度をほとんど下げることなく,かつ計算時間を大幅に短くすることができます.また,境界付近以外では,明確な統計モデルにもとづく判別の確信度が得られます.

 

同じカテゴリーの葉の組の例 異なるカテゴリーの葉の組の例

 

logistic

特徴量の隔たりd1, d2について「同じカテゴリーに属する組」「異なるカテゴリーに属する組」をプロットし,それぞれに「異なるカテゴリーに属する」ことの確信度として値0,値1を割り当てる.これらのプロットと値の関係をロジスティック関数で近似する.

 

おもな研究発表

 

また,下記の論文は,歯科X線画像処理の一部ですが,画像の最適な2値化を統計的クラスタリングによって行うもので,いわばこの「統計的物体同定」の研究の末裔といえます.