Item type |
SIG Technical Reports(1) |
公開日 |
2022-05-05 |
タイトル |
|
|
タイトル |
深層指差し方向推定 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
卒論スポットライトセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者名 |
中村, 周
野中, 聡馬
川西, 康友
延原, 章平
西野, 恒
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
人間が興味や注意を表すジェスチャである指差しの方向を自動で推定することは,人間の意図の理解において重要な課題である.既存の研究では,深度カメラや複数台のカメラで近距離から撮影された画像に対し推定を行っているが,指差し推定を実用化するためには,監視カメラのような遠方から撮影された低解像度な単眼 RGB 画像に対する推定を実現する必要がある.このためには,特徴量をデータから直接学習することができる畳み込みニューラルネットワークが有効である.本研究では,写実的な指差しの画像とその方向の真値を持つデータセットを自動で作成する手法を 3 種類提案し,作成したデータセットでネットワークを訓練・評価した.評価実験の結果,複数種の訓練データを使用することで性能が向上することを確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2022-CVIM-230,
号 23,
p. 1-8,
発行日 2022-05-05
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |