tmori’s blog

公開メモ帳くらいの感覚で書いています。技術系多め。日常少なめ。

単眼カメラによる姿勢推定を用いた応用技術のメモ

論文メモ

単眼カメラによる2次元座標の姿勢推定を応用した論文調査のメモ。

個人の識別
- 単眼カメラから得られる骨格情報を用いた人物識別 -CNNとSVMの比較-
- 単眼RGBカメラによる姿勢推定情報と歩容特徴量を用いた個人識別手法
3次元座標への変換
- 教師あり学習
- 教師なし学習
データセット
- Human3.6M
- MPII Human Pose Database

個人の識別

カメラによる個人識別では顔認識が一般的に使用される。

顔が映らないことが想定される状況では、骨格情報を用いることが検討されている。

単眼カメラから得られる骨格情報を用いた人物識別 -CNNとSVMの比較-

http://www.mech.chuo-u.ac.jp/umedalab/publications/pdf/2017/D69.pdf

姿勢推定にはOpenPoseを使用
入力には骨格座標16点のx,y座標と尤度*1
骨格情報を直積で2次元に変換してCNNへと入力する
SVMの推定では特徴の一部が欠落することを考慮し、特徴量を限定した (左パーツのみなど) SVMも用意する
CNNの識別率は98.7%, SVM (8個全て) の識別率は78.0%

単眼RGBカメラによる姿勢推定情報と歩容特徴量を用いた個人識別手法

https://www.ams.giti.waseda.ac.jp/data/pdf-files/2019_yamaguchi_bt.pdf

姿勢推定にはOpenPoseを使用
OpenPoseで得た2次元座標を3d-pose-baseline*2で3次元座標に変換して使用

3次元座標への変換

教師あり学習

ニューラルネットによる2dから3dへの回帰
2dの骨格情報はOpenPoseを使用
データセットはHuman3.6Mを使用

日本語の概要 : 論文まとめ：A simple yet effective baseline for 3d human pose estimation - Qiita

教師なし学習

2Dの画像のみを使用して3Dの骨格情報に変換
敵対的に学習
ランダムで奥行の情報を付与し、3Dの骨格情報を回転。別の角度になった3Dを2Dに変換し、2Dとして正しいかを識別する。

日本語の概要 :

ザックリまとめ Unsupervised 3D Pose Estimation with Geometric Self-Supervision論文 - Qiita

データセット

Human3.6M

360万の3Dの骨格情報とそれに対応した画像のデータセット
使用は教育・研究（アカデミック）のみ

MPII Human Pose Database

human-pose.mpi-inf.mpg.de

2.5K の画像とそれに対応した骨格情報のデータセット

*1:推定座標のaccuracy score ?

*2:https://github.com/una-dinosauria/3d-pose-baseline