ステレオビジョン

提供: Precipedia
移動: 案内検索

ステレオビジョン(Stereo vision)とは,ステレオ視とも呼ばれ,異なる視点で撮影された2枚以上のカメラ画像を用いて,被写体(3次元物体)までの距離と姿勢などの3次元情報を復元するセンシング手法の一種である.

詳細

ステレオビジョンは,2台(または3台以上)のカメラで同一の3次元物体を観測した際に得られるカメラ画像から3次元物体の位置や距離などを三角測量に基づいて復元する計測手法である[1].単に三角測量と呼ばれることもあるが,ステレオビジョンはカメラの幾何学的なモデル化,カメラ画像への画像処理および三角測量までの一連の処理を含めた呼び名である.また,カメラを視覚における「眼」に例えて2台のカメラを用いた場合を2眼視(2眼ステレオ視)と呼び,3台のカメラを用いた場合を3眼視(3眼ステレオ視)と呼ぶことがある.以下では主に2眼ステレオ視について解説する.


カメラ画像は3次元空間上の3次元物体を2次元のカメラ撮像面に射影することで得られる.ステレオビジョンでは2次元のカメラ画像から3次元物体の復元を行うために,カメラの幾何学的なモデル化を必要とする.一般にカメラのモデル化にはピンホールカメラモデルが用いられる.ピンホールカメラモデルは3次元物体上の一点から反射した光がカメラのレンズ中心(光学中心)を通り,カメラの撮像面に入射することを仮定したモデルであり,2次元のカメラ画像の一点と3次元物体上の一点が光学中心を通して直線で結ばれる関係となる.このとき,カメラ画像上の一点から光学中心を通して3次元シーンへの方向を示す3次元ベクトルを視線(または光線)と呼ぶ.ピンホールを通過した像は倒立像となるため,正立像として処理を行える透視投影モデル(仮想的に撮像面が3次元物体と光学中心の間に配置される)が広く用いられる.モデル化されたカメラを記述するパラメータには,像距離(焦点距離と呼ばれることもある),光軸点および画素サイズなどがある.なお,像距離は光学中心から撮像面までの距離であり,光軸点は光軸と撮像面との交点の位置を表す画像座標である.これらのパラメータはZhangの方法[2]などを用いて計測より前に校正することが多い(カメラキャリブレーション).


図1(a)に透視投影モデルにより表現されたカメラ画像上の点(画素)と視線の関係を示す.3次元物体への方向を表す視線は光学中心と画素を結ぶ直線として求められるが,物体までの距離情報が不定であるため,視線上のどこに物体が存在するか特定できない.そこで,図1(b)に示すように2台のカメラを用いる.カメラAとカメラBの光学中心を結ぶ基線とカメラの姿勢が既知であれば,各カメラ画像上で同じ物体を表す画素から求められた2本の視線(視線Aおよび視線B)と基線により3角形を形成することにより,三角測量を適用することができる.


図1

引用

  1. 金谷健一,菅谷保之,金澤靖:“3次元コンピュータビジョン計算ハンドブック”,森北出版,2016
  2. Z. Zhang: “A Flexible New Technique for Camera Calibration”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, No.11, pp.1330-1334, 2000