国内会議 | 中部大学機械知能研究室

条件付きCutPasteを用いた異常検知の高精度化

2025年03月11日

論文情報

本田晴己，山内悠嗣，“条件付きCutPasteを用いた異常検知の高精度化”，電子情報通信学会東海支部卒業研究発表会，2025．

概要

近年，AI を活用した異常検知が急速に進展している．異常検知モデルを構築する際の大きな課題として異常データの不足が挙げられる．この課題に対処するため，擬似的に異常画像生成する CutPaste と呼ばれる手法が提案されている [1]．CutPaste は画像の一部を切り取り，同じ画像の別の位置に貼り付けることで異常画像を擬似的に生成する手法である．しかし，CutPaste ではランダムな位置に切り貼りをするため，現実には存在し得ない不自然な異常画像が生成されることがある．そこで，本研究では条件付き CutPaste を用いた異常検知法を提案する．これにより，微小な疑似を含んだ異常画像を生成し，現実で発生し得る異常画像に類似した画像のみで学習することで分類精度の向上が期待できる．paper

ポスター

Bibtex Reference

@inproceedings{本田2025, 
　　author = {本田晴己 and 山内 悠嗣}, 
　　title = {{条件付きCutPasteを用いた異常検知の高精度化}},
　　booktitle = {電子情報通信学会東海支部 卒業研究発表会} 
　　year = {2025}, 
}

画像の圧縮・復元モデルと認識モデルのEnd-to-End学習

2024年03月01日

論文情報

柴田蓮，山内悠嗣，“画像の圧縮・復元モデルと認識モデルのEnd-to-End学習”，動的画像処理実利用化ワークショップ，2024．paper

概要

エッジコンピューティングを活用した画像認識システムは，通信量が増加するとネットワークの負担が大きくなるため通信速度が低下する問題が発生する．通信量削減のために圧縮・復元した画像を認識するアプローチが提案されたが，未圧縮の画像を用いて認識する場合と比べて認識精度が低下することが報告されている．そこで，本稿では画像を圧縮・復元するモデルと認識するモデルを End-to-End で学習するフレームワークを提案する．提案手法は，異なる 2 つのモデルを End-to-End で学習することで，画像を圧縮・復元した際に認識に有効な情報の欠落を防ぐことが可能となり，高精度な画像認識の実現が期待できる．

ポスター

スライド

Bibtex Reference

@inproceedings{柴田2024, 
　　author = {柴田 蓮 and 山内 悠嗣}, 
　　title = {{画像の圧縮・復元モデルと認識モデルのEnd-to-End学習}},
　　booktitle ={動的画像処理実利用化ワークショップ}, 
　　year = {2024}, 
}

変形ARマーカの高速かつ高精度な姿勢推定

2024年02月29日

論文情報

浅野右京，山内悠嗣，“変形ARマーカの高速かつ高精度な姿勢推定”，電子情報通信学会東海支部卒業研究発表会，2024．paper

概要

2次元コードが急速に普及し，キャッシュレス決済やロボットの自己位置推定など様々な用途で利用されている．しかし，2次元コードが変形すると，認識や位置・姿勢推定が難化する．深層学習により変形した2次元コードの3次元位置・姿勢を推定する手法が提案されたが，姿勢推定精度と計算時間に課題があった．そこで，本研究では変形を除去するモデルと姿勢を回帰推定するモデルをEnd-to-Endで学習した手法を提案する．変形を除去するタスクと同時に姿勢を推定することで，姿勢推定精度の向上が期待できる．また，従来手法は最近傍法による姿勢推定であるが，提案手法は全結合層にて回帰推定を行うため計算量を削減できる．

ポスター

Bibtex Reference

@inproceedings{浅野2024, 
　　author = {浅野 右京 and 山内 悠嗣}, 
　　title = {{変形ARマーカの高速かつ高精度な姿勢推定}},
　　booktitle ={電子情報通信学会 東海支部 卒業研究発表会}, 
　　year = {2024}, 
}

自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化

2023年12月07日

論文情報

高瀬俊希，山内悠嗣，“自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化”，ビジョン技術の実利用ワークショップ，2023．paper

概要

深層学習により画像上の顔の交換や属性・表情を変更するDeepfake が問題となり，Deepfake により生成された画像を検出する研究が活発に行われている．近年，画像認識分野においてVision Transformerベースの手法が優れた性能を発揮することが報告されているが，Deepfake 検出問題においては畳み込みニューラルネットワークベースの手法と比較して性能が低下することが分かっている．そこで，本研究では自己教師あり学習を導入したWavelet Vision Transformer による高精度なDeepfake 検出法を提案する．Wavelet Vision Transformer は，Deepfake 検出において画像中の重要な高周波成分を捉えることができるモデルである．表現学習の一種である自己教師あり学習と組み合わせることで，Deepfake 画像における加工の痕跡を正確に検知することが可能となり，高精度な検出が期待できる．

ポスター

Bibtex Reference

@inproceedings{高瀬2023, 
　　author = {高瀬 俊希 and 山内 悠嗣}, 
　　title = {{自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化”}},
　　booktitle ={ビジョン技術の実利用ワークショップ}, 
　　year = {2023}, 
}

未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習

2023年08月28日

論文情報

加藤誉基，山内悠嗣，“未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習”，電気・電子・情報関係学会東海支部連合大会，2023．paper

概要

強化学習は機械学習の一つであり，自らが行動することで得られる経験から学習する．そのため，学習データを用意することが難しいタスクや未知の環境でもタスクを解くことができる可能性を持つ．強化学習は観測した現在までの状態における価値を最大化するよう学習する．価値とは，将来に亘って獲得できる報酬の期待値であり，西片等は先の状態を予測できれば現在の状態より高い価値を求められるという発想から先の状態を予測するモデルを価値関数に導入した．しかし，現時刻から時間が経過するほど未来の予測は曖昧さを含み不安定となるため，長期の予測を導入した場合，性能が低下する問題を抱えていた．そこで，本研究ではより高い現在の状態の価値を求めるため，先の状態を予測する際に時間経過に対して重み付けする．これにより，提案手法は直近の未来予測の結果を重視することが可能となり，早期に高い報酬を得ることが期待できる．

スライド

Bibtex Reference

@inproceedings{加藤2023, 
author = {加藤 誉基 and 山内 悠嗣}, 
title = {{未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習}},
booktitle ={電気・電子・情報関係学会東海支部連合大会}, 
year = {2023}, 
}

動的環境における動作計画のための C-space の予測

2023年06月30日

論文情報

木南貴志，坂本健太朗，山内悠嗣，“動的環境における動作計画のための C-space の予測”，ロボティクス・メカトロニクス講演会，2023．paper

概要

人と一緒に作業を行う協働ロボットの需要が拡大し，作業の自動化のために様々な分野に導入されている．人間と同じ空間でロボットが作業をするには，周囲の環境を把握して障害物を避けるだけでなく，作業を行う人間に衝突しない動作が求められる．動作計画では Configuration-space(C-space) と呼ばれるロボットの姿勢を表現した空間が用いられる．実空間におけるロボットと障害物が衝突するような姿勢は，C-space 上においてコンフィギュレーション障害物として写像されるため，C-space 上でコンフィギュレーション障害物を回避する経路を生成することで，実空間においても障害物を回避するような動作を生成できる．人間のように動きを伴う物体が存在するような動的環境に対応するためには，動きを予測して動的な障害物を避けるようなロボットの動作を計画する必要がある．しかしながら，動的な障害物を考慮した C-space の作成や動作計画法は提案されているが，動的障害物の動きを予測するまでには至っていない．そこで，本稿では時系列情報から次時刻の C-space を予測する深層学習ネットワークを提案する．既に我々は，3次元の占有グリッドマップとして表現されるボクセルデータから C-space を生成する Vox2C-space[1] と呼ぶ深層学習ネットワークを提案している．本研究では，Vox2C-space を拡張して時系列データに適応させることで次時刻の C-space を高速に予測する．予測した C-space を用いて動作計画を行うことで，動的な環境に対応することが可能となる．

ポスター

Bibtex Reference

@inproceedings{木南2023, 
　　author = {木南 貴志 and 坂本 健太朗 and 山内 悠嗣}, 
　　title = {{動的環境における動作計画のための C-space の予測}},
　　booktitle ={ロボティクス・メカトロニクス 講演会}, 
　　year = {2023}, 
}

人の姿勢予測に基づいた協働ロボットの動作計画

2023年03月08日

論文情報

坂本健太朗，山内悠嗣，“人の姿勢予測に基づいた協働ロボットの動作計画”，電子情報通信学会総合大会，2023．paper

概要

人と同じ空間で働くことができる協働ロボットが開発され，小型かつ軽量であることから様々な産業への導入が進んでいる．協働ロボットの安全方策としては，接触時の緊急停止や人の接近に伴い動作速度を低下させる等の対応策が採られているが，これらは生産性を低下させることに繋がる．そこで，本研究では安全を確保しつつ作業の生産性を維持するために，人の姿勢予測に基づいた協働ロボットの動作計画を提案する．これにより人とロボットの接触を予測すると，ロボットの動作を変更するため，生産性の低下を抑制することが出来る．

ポスター

Bibtex Reference

@inproceedings{坂本2023, 
　　author = {坂本 健太朗 and 山内 悠嗣}, 
　　title = {人の姿勢予測に基づいた協働ロボットの動作計画}},
　　booktitle ={電子情報通信学会総合大会}, 
　　year = {2023}, 
}

時系列予測モデルを導入した価値関数に基づく強化学習

2023年03月02日

論文情報

西片智広，山内悠嗣，“時系列予測モデルを導入した価値関数に基づく強化学習”，動的画像処理実利用化ワークショップ，2023．paper

概要

強化学習は環境とエージェントの相互のやり取りにより，一定期間における報酬の期待値を表す価値が最大となるように学習することで，エージェントが取るべき行動を獲得できる教師なし学習手法の1 つである．高い価値を得るためには，未知である将来の状態において最適な行動を選択する必要がある．未知である将来の状態を事前に把握できれば，より良い行動を選択できるため，結果的に高い価値を得ることが可能である．そこで，本研究では深層学習に基づく未来画像生成技術を利用することで，未知である将来の状態を事前に予測する．事前に将来の状態を予測することで，より高い価値を得るための行動を選択することが可能となるため，早期に高い報酬が得られることが期待できる．

ポスター

Bibtex Reference

@inproceedings{西片2023, 
　　author = {西片 智広 and 山内 悠嗣}, 
　　title = {{時系列予測モデルを導入した価値関数に基づく強化学習}},
　　booktitle = {動的画像処理実利用化ワークショップ}, 
　　year = {2023}, 
}

エッジコンピューティングのための圧縮画像認識

2022年12月08日

論文情報

高瀬俊希，戸谷響，西片智広，山内悠嗣，“エッジコンピューティングのための圧縮画像認識”，ビジョン技術の実利用ワークショップ，2022．paper

概要

近年，エッジコンピューティングを利用した画像認識システムの普及により，インターネットに接続された低スペックな端末においても，高機能な画像認識技術が利用できるようになった．しかしながら，高画質・高解像度の画像のようにデータサイズの大きいファイルを送受信すると，通信時間の増加やネットワーク帯域に負荷がかかる問題が発生する．そこで，本稿では，エッジコンピューティングを活用した画像認識システムにおけるデータ通信量を削減するために，画像の圧縮・復元と画像認識を行う 2 つのネットワークから構成されるフレームワークを提案する．クライアント側では，データ通信量を削減するためにエンコーダにより画像を圧縮してエッジサーバへ送信する．エッジサーバでは圧縮データをデコーダにより復元した画像を認識する．本稿では提案するフレームワークを画像分類と物体検出の 2 つのタスクに適用し，その有効性を確認する．

スライド

[]

Bibtex Reference

@inproceedings{高瀬2022, 
　　author = {高瀬 俊希 and 戸谷 響 and 西片 智広 and 山内 悠嗣}, 
　　title = {{エッジコンピューティングのための圧縮画像認識}},
　　booktitle = {ビジョン技術の実利用ワークショップ}, 
　　year = {2022}, 
}

Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成

2022年09月08日

論文情報

木南貴志，山内悠嗣，“Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成”，日本ロボット学会学術講演会，2022．paper

概要

近年，労働力の不足や人件費の削減などの理由により，ロボットを活用した作業の自動化の需要が高まっている．ロボットによる作業の自動化を実現するには，ロボットアームの動作時の軌道を作成する必要があり，教示と動作計画の 2 種類が存在する．教示は作業者がロボットを操作して動作を記憶し，記憶した動作を連続的に再生するティーチングプレイバックにより作業を再現する．教示には多くの時間が必要になることや，作業内容や環境が変わったときに，教示をやり直す必要があるため，近年では動作計画に関する研究が盛んに取り組まれている.動作計画は，ロボットが障害物を避けながら初期姿勢から目標姿勢へ達する軌道を計画する問題である．動作計画では Configuration-space(C-space) と呼ばれるロボットの姿勢を表現した空間が用いられる．実空間におけるロボットと障害物が衝突するような姿勢は，C-space 上においてコンフィギュレーション障害物として写像されるため，C-space 上でコンフィギュレーション障害物を回避する経路を生成することで，実空間においても障害物を回避するような動作を生成することができる. 全ての姿勢における衝突情報を写像した完全な C-space を作成するには膨大な計算を必要とするため，動作計画の際には完全な C-space を作成することなく，逐次的に衝突判定を行いながら経路を探索する．そのため，サンプリングベース手法などの逐次的に経路を探索する以外の手法を利用することができない問題がある．そこで，本稿では機械学習に基づいて C-space を生成する Vox2C-space を提案する．Vox2C-space は，エンコーダ・デコーダ型のネットワークで構成された Cspace 生成ネットワークである．提案手法は，2 値のボクセルで表現された占有グリッドマップから機械学習により C-space を生成する．直接的に衝突判定の計算を行わないため，C-space を高速に計算することが可能となる．

スライド

Bibtex Reference

@inproceedings{木南2022, 
　　author = {木南 貴志 and 山内 悠嗣}, 
　　title = {{Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成}},
　　booktitle = {日本ロボット学会学術講演会}, 
　　year = {2022}, 
}

Category 国内会議

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

ポスター

スライド

Bibtex Reference

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

スライド

Bibtex Reference

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

ポスター

Bibtex Reference

論文情報

概要

スライド

Bibtex Reference

論文情報

概要

スライド

Bibtex Reference