Item type |
SIG Technical Reports(1) |
公開日 |
2023-02-21 |
タイトル |
|
|
タイトル |
Fed-StarGANv2-VC:連合学習を用いた多対多声質変換 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SLP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者名 |
平井, 龍之介
齋藤, 佑樹
猿渡, 洋
|
著者名(英) |
Ryunosuke, Hirai
Yuki, Saito
Hiroshi, Saruwatari
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,連合学習を用いたユーザ参加型の多対多声質変換モデル学習法を提案する.従来の多対多声質変換技術は,多数話者の音声を含むデータセットを用いて声質変換モデルを学習する.しかし,学習されたモデルが多種多様なユーザによる入力音声に対して高品質な声質変換を実現する保証はない.提案手法では,高品質な多対多声質変換を実現する StarGANv2-VC モデルを研究開発者とユーザが協同的に学習し,ユーザが所有する音声データのプライバシーを保護しながら,より多様な話者の音声を変換可能な深層学習モデルを構築する.実験的評価の結果より,提案手法が従来の非分散型学習法と同程度の話者類似性を達成しうることを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2023-SLP-146,
号 11,
p. 1-8,
発行日 2023-02-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |