WEKO3
-
RootNode
アイテム
AutoVCを用いたゼロショットリアルタイム声質変換手法の提案
https://ipsj.ixsq.nii.ac.jp/records/214323
https://ipsj.ixsq.nii.ac.jp/records/2143230ad2ffc4-6993-4ad6-9e44-e36e485c90fa
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-12-13 | |||||||||||
タイトル | ||||||||||||
タイトル | AutoVCを用いたゼロショットリアルタイム声質変換手法の提案 | |||||||||||
タイトル | ||||||||||||
言語 | en | |||||||||||
タイトル | A Study of Zero-Shot Real-Time Voice Conversion Method Using AutoVC | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 農業・音声・ゲーム | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
現在,金沢工業大学 | ||||||||||||
著者所属 | ||||||||||||
現在,金沢工業大学 | ||||||||||||
著者所属 | ||||||||||||
現在,金沢工業大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Presently with Kanazawa Institute of Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Presently with Kanazawa Institute of Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Presently with Kanazawa Institute of Technology | ||||||||||||
著者名 |
鈴木, 大志
× 鈴木, 大志
× 鷹合, 大輔
× 中沢, 実
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 声質変換とは,人物の声の声質のみを別人の声質に変換する技術である.その中でも,ゼロショット声質変換は,変換モデルの学習した音声にない声質間での変換が可能な手法である.AutoVC は,ゼロショット声質変換モデルで,入力話者の声のメルスペクトログラムと入出力話者の話者埋め込みベクトルを入力する事で,話者らの声を学習しているか否か関わらず,出力話者の声質のメルスペクトログラムを出力する.これを,音声波形に復元する際に,音既存手法では WaveNet や Griffin-Lim などの多くの計算時間を要する手法を用いておりリアルタイムな声質変換の弊害となっている.そこで,本研究ではメルスペクトログラムに代えて,スペクトル包絡を用いた.そして,波形の復元は WORLD を用いる事でリアルタイムな声質変換を実現した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10116224 | |||||||||||
書誌情報 |
研究報告マルチメディア通信と分散処理(DPS) 巻 2021-DPS-189, 号 5, p. 1-6, 発行日 2021-12-13 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8906 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |