動き情報を加えたPredNetによる未来画像生成の高精度化

論文情報

西片智広,山内 悠嗣,“動き情報を加えたPredNetによる未来画像生成の高精度化”,画像センシングシンポジウム,2021.

概要

モビリティ分野では自動運転技術の実用化を目指して盛んに研究開発が行われているが,その 1 つに自車周辺の環境を認識するセンシング技術が挙げられる.安全安心な自動運転を実現するためには,自動運転車に搭載された多数のセンサにより周囲を観測し,獲得した情報から周囲の環境を認識する必要がある.さらに,危険な状態を早期に把握するためには,この先に発生する事象の予測が重要であることから自車及びその周辺の状況を予測する研究が進められている.センサから獲得される情報の 1 つに車載カメラからの映像がある.カメラから観測できる画像から,この先に観測できる未来の画像を生成することができれば,より高度な予測の実現が期待できる.未来の画像を生成する研究は幾つか提案されているが,その中でも PredNet[3] は,畳み込み Long Short Term Memory(LSTM)をベースとした深層学習ネットワークであり,高精度な画像の予測を実現している.PredNet は連続した数フレームの画像群を入力し,1 フレーム先の未来画像を生成する.PredNet が対象としている車載カメラの映像は,走行する自車の動きと,カメラで観測している自動車や歩行者等の移動体の動きの2 つの動きが含まれる.これら 2 つの動きをより把握することができれば,この先の映像がどのように変化するか予想できる.そこで,本研究では高精度な未来画像を生成するために,未来画像の生成時に動きの情報を加味する.明示的に動きの情報を加味することで,画像内で移動する物体や動的な背景を考慮することが可能となり,高精度な未来画像の生成が期待できる.動きの情報を加味するために,本研究では深層学習に基づく DDFlowにより推定したオプティカルフローを用いる.

ポスター


Bibtex Reference

@inproceedings{西片2021, 
  author = {西片 智広 and 山内 悠嗣},
  title = {{動き情報を加えたPredNetによる未来画像生成の高精度化}},
  booktitle = {画像センシングシンポジウム},
  year = {2021},
}