Item type |
SIG Technical Reports(1) |
公開日 |
2020-11-25 |
タイトル |
|
|
タイトル |
StarGANに基づく話者変換の基本周波数系列の安定化 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Stabilize Foundamental Frequency of StarGAN based Voice Conversion System |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声分析・変換・検出 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
Convergence Lab. 株式会社 |
著者所属 |
|
|
|
時空テクノロジーズ株式会社 |
著者所属(英) |
|
|
|
en |
|
|
Convergence Lab. Inc. |
著者所属(英) |
|
|
|
en |
|
|
ZIKU technologies Inc. |
著者名 |
木村, 優志
春日, 秀之
|
著者名(英) |
Masashi, Kimura
Hideyuki, Kasuga
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
コンピューターグラフィックスで作られた外見で動画配信を行う Virtual Youtuber (VTuber / バーチャルライバー) や,Virtual Influencer と呼ばれる存在が近年注目されている.CG による固有の外観をもっているが,声に関しては声優などが務めることが多い.ここで,バーチャルタレントの外見だけではなく,話者変換によって声を変えることができればより便利である.StarGAN-VC2++ は高精度な話者変換モデルの一つであるが,基本周波数が振動するという問題がある.そこで,新たに Δ????0 損失項を導入し,基本周波数の振動の抑制を試みる.実験の結果,基本周波数の振動の抑制が確認された.しかし,フィルタが発振する例が見られる問題が残る. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Virtual Youtuber and Virtual Influencer is getting attention, which is video streamers with avator appearence created computer graphics. They have unique appearance, however regarding the voice, usually voice actor plays. It would be usefull not only changing appearance but also changing voice with voice converter. StarGAN-VC2++ is a high quality voice converter, however has a problem of ????0 vibration. We propose Δ????0 loss term to reduce ????0 vibration. Experimental result shows that ????0 loss term reduces ????0 vibration, however sometimes filter oscillates. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2020-SLP-134,
号 34,
p. 1-4,
発行日 2020-11-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |