tmori’s blog

公開メモ帳くらいの感覚で書いています。技術系多め。日常少なめ。

単眼カメラによる姿勢推定を用いた応用技術のメモ

単眼カメラによる2次元座標の姿勢推定を応用した論文調査のメモ。

個人の識別

カメラによる個人識別では顔認識が一般的に使用される。

顔が映らないことが想定される状況では、骨格情報を用いることが検討されている。

単眼カメラから得られる骨格情報を用いた人物識別 -CNNとSVMの比較-

http://www.mech.chuo-u.ac.jp/umedalab/publications/pdf/2017/D69.pdf

  • 姿勢推定にはOpenPoseを使用
  • 入力には骨格座標16点のx,y座標尤度*1
  • 骨格情報を直積で2次元に変換してCNNへと入力する
  • SVMの推定では特徴の一部が欠落することを考慮し、特徴量を限定した (左パーツのみなど) SVMも用意する
  • CNNの識別率は98.7%, SVM (8個全て) の識別率は78.0%

単眼RGBカメラによる姿勢推定情報と歩容特徴量を用いた個人識別手法

https://www.ams.giti.waseda.ac.jp/data/pdf-files/2019_yamaguchi_bt.pdf

  • 姿勢推定にはOpenPoseを使用
  • OpenPoseで得た2次元座標を3d-pose-baseline*2で3次元座標に変換して使用

3次元座標への変換

教師あり学習

arxiv.org

日本語の概要 : 論文まとめ:A simple yet effective baseline for 3d human pose estimation - Qiita

教師なし学習

arxiv.org

  • 2Dの画像のみを使用して3Dの骨格情報に変換
  • 敵対的に学習
  • ランダムで奥行の情報を付与し、3Dの骨格情報を回転。別の角度になった3Dを2Dに変換し、2Dとして正しいかを識別する。

日本語の概要 :

ザックリまとめ Unsupervised 3D Pose Estimation with Geometric Self-Supervision論文 - Qiita

データセット

Human3.6M

vision.imar.ro

  • 360万の3Dの骨格情報とそれに対応した画像のデータセット
  • 使用は教育・研究(アカデミック)のみ

MPII Human Pose Database

human-pose.mpi-inf.mpg.de

  • 2.5K の画像とそれに対応した骨格情報のデータセット

*1:推定座標のaccuracy score ?

*2:https://github.com/una-dinosauria/3d-pose-baseline