画像の圧縮・復元モデルと認識モデルのEnd-to-End学習

論文情報

柴田 蓮,山内 悠嗣,“画像の圧縮・復元モデルと認識モデルのEnd-to-End学習”,動的画像処理実利用化ワークショップ,2024.paper

概要

エッジコンピューティングを活用した画像認識システムは,通信量が増加するとネットワークの負担が大きくなるため通信速度が低下する問題が発生する.通信量削減のために圧縮・復元した画像を認識するアプローチが提案されたが,未圧縮の画像を用いて認識する場合と比べて認識精度が低下することが報告されている.そこで,本稿では画像を圧縮・復元するモデルと認識するモデルを End-to-End で学習するフレームワークを提案する.提案手法は,異なる 2 つのモデルを End-to-End で学習することで,画像を圧縮・復元した際に認識に有効な情報の欠落を防ぐことが可能となり,高精度な画像認識の実現が期待できる.

ポスター

スライド

Bibtex Reference

@inproceedings{柴田2024, 
  author = {柴田 蓮 and 山内 悠嗣},
  title = {画像の圧縮・復元モデルと認識モデルのEnd-to-End学習},
  booktitle ={動的画像処理実利用化ワークショップ},
  year = {2024},
}

 

 

 

変形ARマーカの高速かつ高精度な姿勢推定

論文情報

浅野 右京,山内 悠嗣,“変形ARマーカの高速かつ高精度な姿勢推定”,電子情報通信学会 東海支部 卒業研究発表会,2024.paper

概要

2次元コードが急速に普及し,キャッシュレス決済や ロボットの自己位置推定など様々な用途で利用されている.しかし,2次元コードが変形すると,認識や位置・姿勢推定が難化する.深層学習により変形した2次元コードの3次元位置・姿勢を推定する手法が提案されたが,姿勢推定精度と計算時間に課題があった. そこで,本研究では変形を除去するモデルと姿勢を回帰推定するモデルをEnd-to-Endで学習した手法を提案する.変形を除去するタスクと同時に姿勢を推定することで,姿勢推定精度の向上が期待できる.また,従来手法は最近傍法による姿勢推定であるが,提案手法は全結合層にて回帰推定を行うため計算量を削減できる.

ポスター

Bibtex Reference

@inproceedings{浅野2024, 
  author = {浅野 右京 and 山内 悠嗣},
  title = {変形ARマーカの高速かつ高精度な姿勢推定},
  booktitle ={電子情報通信学会 東海支部 卒業研究発表会},
  year = {2024},
}

 

 

 

自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化

論文情報

高瀬 俊希,山内 悠嗣,“自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化”,ビジョン技術の実利用ワークショップ,2023.paper

概要

深層学習により画像上の顔の交換や属性・表情を変更するDeepfake が問題となり,Deepfake により生成された画像を検出する研究が活発に行われている.近年,画像認識分野においてVision Transformerベースの手法が優れた性能を発揮することが報告されているが,Deepfake 検出問題においては畳み込みニューラルネットワークベースの手法と比較して性能が低下することが分かっている.そこで,本研究では自己教師あり学習を導入したWavelet Vision Transformer による高精度なDeepfake 検出法を提案す る.Wavelet Vision Transformer は,Deepfake 検出において画像中の重要な高周波成分を捉えることができるモデルである.表現学習の一種である自己教師あり学習と組み合わせることで,Deepfake 画像における加工の痕跡を正確に検知することが可能となり,高精度な検出が期待できる.

ポスター

Bibtex Reference

@inproceedings{高瀬2023, 
  author = {高瀬 俊希 and 山内 悠嗣},
  title = {自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化”}},
  booktitle ={ビジョン技術の実利用ワークショップ},
  year = {2023},
}

 

 

 

未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習

論文情報

加藤 誉基,山内 悠嗣,“未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習”,電気・電子・情報関係学会東海支部連合大会,2023.paper

概要

強化学習は機械学習の一つであり,自らが行動することで得られる経験から学習する.そのため,学習データを用意することが難しいタスクや未知の環境でもタスクを解くことができる可能性を持つ.強化学習は観測した現在までの状態における価値を最大化するよう学習する.価値とは,将来に亘って獲得できる報酬の期待値であり,西片等は先の状態を予測できれば現在の状態より高い価値を求められるという発想から先の状態を予測するモデルを価値関数に導入した.しかし,現時刻から時間が経過するほど未来の予測は曖昧さを含み不安定となるため,長期の予測を導入した場合,性能が低下する問題を抱えていた. そこで,本研究ではより高い現在の状態の価値を求めるため,先の状態を予測する際に時間経過に対して重み付けする.これにより,提案手法は直近の未来予測の結果を重視することが可能となり,早期に高い報酬を得ることが期待できる.

スライド

Bibtex Reference

@inproceedings{加藤2023, 
author = {加藤 誉基 and 山内 悠嗣}, 
title = {未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習}},
booktitle ={電気・電子・情報関係学会東海支部連合大会}, 
year = {2023}, 
}

 

 

 

動的環境における動作計画のための C-space の予測

論文情報

木南 貴志,坂本 健太朗,山内 悠嗣,“動的環境における動作計画のための C-space の予測”,ロボティクス・メカトロニクス 講演会,2023.paper

概要

人と一緒に作業を行う協働ロボットの需要が拡大し,作業の自動化のために様々な分野に導入されている.人間と同じ空間でロボットが作業をするには,周囲の環境を把握して障害物を避けるだけでなく,作業を行う人間に衝突しない動作が求められる. 動作計画では Configuration-space(C-space) と呼ばれるロボットの姿勢を表現した空間が用いられる.実空間におけるロボットと障害物が衝突するような姿勢は,C-space 上においてコンフィギュレーション障害物として写像されるため,C-space 上でコンフィギュレーション障害物を回避する経路を生成することで,実空間においても障害物を回避するような動作を生成できる.人間のように動きを伴う物体が存在するような動的環境に対応するためには,動きを予測して動的な障害物を避けるようなロボットの動作を計画する必要がある.しかしながら,動的な障害物を考慮した C-space の作成や動作計画法は提案されているが,動的障害物の動きを予測するまでには至っていない. そこで,本稿では時系列情報から次時刻の C-space を予測する深層学習ネットワークを提案する.既に我々は,3次元の占有グリッドマップとして表現されるボクセルデータから C-space を生成する Vox2C-space[1] と呼ぶ深層学習ネットワークを提案している.本研究では,Vox2C-space を拡張して時系列データに適応させることで次時刻の C-space を高速に予測する.予測した C-space を用いて動作計画を行うことで,動的な環境に対応することが可能となる.

ポスター

Bibtex Reference

@inproceedings{木南2023, 
  author = {木南 貴志 and 坂本 健太朗 and 山内 悠嗣},
  title = {動的環境における動作計画のための C-space の予測}},
  booktitle ={ロボティクス・メカトロニクス 講演会},
  year = {2023},
}

 

 

 

人の姿勢予測に基づいた協働ロボットの動作計画

論文情報

坂本 健太朗,山内 悠嗣,“人の姿勢予測に基づいた協働ロボットの動作計画”,電子情報通信学会総合大会,2023.paper

概要

人と同じ空間で働くことができる協働ロボットが開発され,小型かつ軽量であることから様々な産業への導入が進んでいる.協働ロボットの安全方策としては,接触時の緊急停止や人の接近に伴い動作速度を低下させる等の対応策が採られているが,これらは生産性を低下させることに繋がる. そこで,本研究では安全を確保しつつ作業の生産性を維持するために,人の姿勢予測に基づいた協働ロボットの動作計画を提案する.これにより人とロボットの接触を予測すると,ロボットの動作を変更するため,生産性の低下を抑制することが出来る.

ポスター

Bibtex Reference

@inproceedings{坂本2023, 
  author = {坂本 健太朗 and 山内 悠嗣},
  title = {人の姿勢予測に基づいた協働ロボットの動作計画}},
  booktitle ={電子情報通信学会総合大会},
  year = {2023},
}

 

 

 

時系列予測モデルを導入した価値関数に基づく強化学習

論文情報

西片 智広,山内 悠嗣,“時系列予測モデルを導入した価値関数に基づく強化学習”,動的画像処理実利用化ワークショップ,2023.paper

概要

強化学習は環境とエージェントの相互のやり取りにより,一定期間における報酬の期待値を表す価値が最大となるように学習することで,エージェントが取るべき行動を獲得できる教師なし学習手法の1 つである.高い価値を得るためには,未知である将来の状態において最適な行動を選択する必要がある.未知である将来の状態を事前に把握できれば,より良い行動を選択できるため,結果的に高い価値を得ることが可能である.そこ で,本研究では深層学習に基づく未来画像生成技術を利用することで,未知である将来の状態を事前に予測する.事前に将来の状態を予測することで,より高い価値を得るための行動を選択することが可能となるため,早期に高い報酬が得られることが期待できる.

ポスター

Bibtex Reference

@inproceedings{西片2023, 
  author = {西片 智広 and 山内 悠嗣},
  title = {{時系列予測モデルを導入した価値関数に基づく強化学習}},
  booktitle = {動的画像処理実利用化ワークショップ},
  year = {2023},
}

 

 

 

エッジコンピューティングのための圧縮画像認識

論文情報

高瀬 俊希,戸谷 響,西片 智広,山内 悠嗣,“エッジコンピューティングのための圧縮画像認識”,ビジョン技術の実利用ワークショップ,2022.paper

概要

近年,エッジコンピューティングを利用した画像認識システムの普及により,インターネットに接続された低スペックな端末においても,高機能な画像認識技術が利用できるようになった.しかしながら,高画質・高解像度の画像のようにデータサイズの大きいファイルを送受信すると,通信時間の増加やネットワーク帯域に負荷がかかる問題が発生する.そこで,本稿では,エッジコンピューティングを活用した画像認識システムにおけるデータ通信量を削減するために,画像の圧縮・復元と画像認識を行う 2 つのネットワークから構成されるフレームワークを提案する.クライアント側では,データ通信量を削減するためにエンコーダにより画像を圧縮してエッジサーバへ送信する.エッジサーバでは圧縮データをデコーダにより復元した画像を認識する.本稿では提案するフレームワークを画像分類と物体検出の 2 つのタスクに適用し,その有効性を確認する.

スライド

[]

Bibtex Reference

@inproceedings{高瀬2022, 
  author = {高瀬 俊希 and 戸谷 響 and 西片 智広 and 山内 悠嗣},
  title = {{エッジコンピューティングのための圧縮画像認識}},
  booktitle = {ビジョン技術の実利用ワークショップ},
  year = {2022},
}

 

 

 

Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成

論文情報

木南 貴志,山内 悠嗣,“Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成”,日本ロボット学会学術講演会,2022.paper

概要

近年,労働力の不足や人件費の削減などの理由により,ロボットを活用した作業の自動化の需要が高まっている.ロボットによる作業の自動化を実現するには,ロボットアームの動作時の軌道を作成する必要があり,教示と動作計画の 2 種類が存在する.教示は作業者がロボットを操作して動作を記憶し,記憶した動作を連続的に再生するティーチングプレイバックにより作業を再現する.教示には多くの時間が必要になることや,作業内容や環境が変わったときに,教示をやり直す必要があるため,近年では動作計画に関する研究が盛んに取り組まれている.動作計画は,ロボットが障害物を避けながら初期姿勢から目標姿勢へ達する軌道を計画する問題である.動作計画では Configuration-space(C-space) と呼ばれるロボットの姿勢を表現した空間が用いられる.実空間におけるロボットと障害物が衝突するような姿勢は,C-space 上においてコンフィギュレーション障害物として写像されるため,C-space 上でコンフィギュレーション障害物を回避する経路を生成することで,実空間においても障害物を回避するような動作を生成することができる. 全ての姿勢における衝突情報を写像した完全な C-space を作成するには膨大な計算を必要とするため,動作計画の際には完全な C-space を作成することなく,逐次的に衝突判定を行いながら経路を探索する.そのため,サンプリングベース手法などの逐次的に経路を探索する以外の手法を利用することができない問題がある. そこで,本稿では機械学習に基づいて C-space を生成する Vox2C-space を提案する.Vox2C-space は,エンコーダ・デコーダ型のネットワークで構成された Cspace 生成ネットワークである.提案手法は,2 値のボクセルで表現された占有グリッドマップから機械学習により C-space を生成する.直接的に衝突判定の計算を行わないため,C-space を高速に計算することが可能となる.

スライド


Bibtex Reference

@inproceedings{木南2022, 
  author = {木南 貴志 and 山内 悠嗣},
  title = {{Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成}},
  booktitle = {日本ロボット学会学術講演会},
  year = {2022},
}

 

 

 

機械学習に基づく経路計画

論文情報

金田 康志,木南 貴志,山内 悠嗣,“機械学習に基づく経路計画 ”,電子情報通信学会総合大会,2022.paper

概要

自律型移動ロボットに必要な技術として経路計画がある.経路計画は,事前に作成した環境地図を用いて,現在位置から目標位置まで障害物に衝突することなくロボットが最短で移動できる経路を計画する技術である.従来の経路計画では,乱数を用いてノードをサンプリングするため,最終的に出力される経路以外の経路も計画する問題を抱えており,多くの無駄な計算が発生する.そこで,本研究では機械学習を用いて経路を構成するノードをサンプリングすることで,余分な計算を削減することを目的とする.

ポスター


Bibtex Reference

@inproceedings{金田2022, 
  author = {金田 康志 and 木南 貴志 and 山内 悠嗣},
  title = {{機械学習に基づく経路計画}},
  booktitle = {電子情報通信学会総合大会},
  year = {2022},
}