Item type |
Journal(1) |
公開日 |
2016-04-15 |
タイトル |
|
|
タイトル |
複数人対話における頭部運動に基づく次話者の予測 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Predicting Next Speaker Based on Head Movement in Multi-party Meetings |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:インタラクションの理解および基盤・応用技術] 頭部運動,次話者予測,話者交替,複数人対話,会話分析 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
著者所属(英) |
|
|
|
en |
|
|
Communication Science Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
Communication Science Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
Communication Science Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
Communication Science Laboratories, NTT Corporation |
著者名 |
石井, 亮
大塚, 和弘
熊野, 史朗
大和, 淳司
|
著者名(英) |
Ryo, Ishii
Kazuhiro, Otsuka
Shiro, Kumano
Junji, Ymatao
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
複数人対話において,これまで着目されていなかった参加者の頭部運動と次話者との関連性を明らかにし,頭部運動の情報を用いて誰が次話者になるかを予測するモデルを提案する.まず,4者の対話のデータ収録を行い,発話情報,および頭部計測センサから取得される頭部位置,回転角からなる頭部運動情報を含む会話コーパスを構築した.コーパスデータを用いて,現話者の発話末の頭部運動と話者交替の関連性を分析した結果,話者継続時と交替時で,現話者の頭部運動が異なることが示された.また,非話者の発話末の頭部運動と次話者の関連性を分析した結果,話者継続時の非話者,話者交替時の非次話者と次話者の3者間で,頭部運動の特徴が異なることが示された.分析で差が見られた現話者,非話者の頭部運動情報を用いて,話者継続と話者交替のどちらが起こるか,さらに,話者交替時に非話者の中で誰が次話者になるかを2段階で予測する次話者予測モデルを構築した.その予測精度の評価の結果,現話者と非話者の頭部運動情報が話者継続/交替の予測に有用であることが示唆された.また,非話者の頭部運動情報が話者交替時の次話者の予測に有用であることが示唆された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We proposed a model for predicting the next speaker in multi-party meetings by focusing on the participants' head movements measured by using a six degrees-of-freedom head tracker. Results of an analysis of head movements collected from multi-party meetings revealed differences in the amounts and amplitude of movement of the head position and rotation of the speaker near the end of an utterance in turn-keeping and turn-changing. The results also revealed the differences in the amounts of movement, amplitude, and frequency of head position movement and rotation between the listeners in turn-keeping, turn-changing, and the next speaker in turn-changing. We then built a next speaker prediction model that features two processing steps to predict whether turn-changing or turn-keeping will occur and who the next speaker will be in turn-changing. The evaluation results for the model suggest that the speaker's and listeners' head movements contribute to predicting the next speaker. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 57,
号 4,
p. 1116-1127,
発行日 2016-04-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |