車載カメラ映像の深層学習による都市名の推定 入力画像の特性が判別性に及ぼす影響の評価
近年,ドライブレコーダーなどの車載カメラの増加とWeb による画像や動画の共有サービスの一般化により,世界中の都市の風景画像や映像をインターネットから取得することが出来るようになってきた.これらの情報は,都市の三次元モデル生成への応用や,地図の頻繁な更新,あるいは景観シミュレーションなど,幅広い応用が期待されるが,そのためには撮影された位置の情報が必要となる.しかし,GPS などの位置情報が,必ずしも画像や映像に付加されているとは限らない.そこで,このようなシーン情報から撮影位置を同定する研究が盛んに行われているが,ほとんどの研究は,ある程度の位置が分かっていることを前提に,詳細な位置合わせを...
Saved in:
Published in | 生産研究 Vol. 68; no. 2; pp. 115 - 121 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Japanese |
Published |
東京大学生産技術研究所
01.03.2016
|
Online Access | Get full text |
ISSN | 0037-105X 1881-2058 |
DOI | 10.11188/seisankenkyu.68.115 |
Cover
Summary: | 近年,ドライブレコーダーなどの車載カメラの増加とWeb による画像や動画の共有サービスの一般化により,世界中の都市の風景画像や映像をインターネットから取得することが出来るようになってきた.これらの情報は,都市の三次元モデル生成への応用や,地図の頻繁な更新,あるいは景観シミュレーションなど,幅広い応用が期待されるが,そのためには撮影された位置の情報が必要となる.しかし,GPS などの位置情報が,必ずしも画像や映像に付加されているとは限らない.そこで,このようなシーン情報から撮影位置を同定する研究が盛んに行われているが,ほとんどの研究は,ある程度の位置が分かっていることを前提に,詳細な位置合わせをするものであった.一方で,世界中の都市を対象として,大域的な位置推定を目指した研究例はほとんど無い.そこで,本論文では世界中の映像を対象として,大域的な位置推定を行うことを目標とする.大域的な位置推定ができれば,既存の詳細位置合わせ手法を適用できると考えられる.提案手法では,Google Street View の画像を学習データとして深層学習(Deep Learning) による認識を行うものとし,認識に際して,カメラごとの特性の違いや,視点の位置姿勢が異なることよる見えの変化に対応するものとした.都市の数が増えると難易度が上がると考えられることから,今回は,主要都市のみを対象として,どの程度の認識が可能か検証を行った.実験の結果,提案手法により,従来よりも高い認識率を実現できることが分かった. |
---|---|
ISSN: | 0037-105X 1881-2058 |
DOI: | 10.11188/seisankenkyu.68.115 |