WEKO3
-
RootNode
アイテム
Crazy vocoder は砕けない~でもちょっとくだけた未来の話を~
https://ipsj.ixsq.nii.ac.jp/records/218398
https://ipsj.ixsq.nii.ac.jp/records/2183981f0556d9-46b6-430d-a5cd-2e17e4ac1612
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
MUS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2022-06-10 | |||||||
タイトル | ||||||||
タイトル | Crazy vocoder は砕けない~でもちょっとくだけた未来の話を~ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Crazy vocoder is unbreakable-But let’s talk about an informal vision of the future- | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 招待講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
明治大学総合数理学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Interdisciplinary Mathematical Sciences, Meiji University | ||||||||
著者名 |
森勢, 将雅
× 森勢, 将雅
|
|||||||
著者名(英) |
Masanori, Morise
× Masanori, Morise
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在の音声合成研究者が論文に Vocoder と記載するとき,その多くは Deep neural network (DNN) を用いて何らかのパラメータから高品質な音声波形を生成する Neural vocoder を指すのではないだろうか.もしそうであれば,音声符号化という役割ではなく,高品質な音声を合成したいという高品質 Vocoder が持つ『黄金の精神』が,Neural vocoder 世代に受け継がれたことを意味する.本稿では,恐らく今後失われていくであろう伝統的な Vocoder の波形生成部のアルゴリズム,および一連の知識がまだ音声研究において役立つかという将来展望について紹介する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | When current speech synthesis researchers refer to Vocoder in their papers, they are most likely referring to Neural vocoder, which generates high-quality speech from parameters by using deep neural networks (DNN). If so, the “golden spirit” of a high-quality vocoder, which is to synthesize high-quality speech rather than play the role of speech encoding, has been passed on to the Neural vocoder generation. This paper presents the core algorithms in the waveform generation of traditional vocoder, which will probably be lost in the future, and prospects for how this body of knowledge can still be useful in speech research. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2022-MUS-134, 号 6, p. 1-6, 発行日 2022-06-10 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8752 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |