WEKO3
-
RootNode
アイテム
v.Connect:ユーザが声色操作可能な歌声合成器
https://ipsj.ixsq.nii.ac.jp/records/80398
https://ipsj.ixsq.nii.ac.jp/records/80398685fc2ec-c193-4842-a4b2-2bd3f2a42c17
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-01-27 | |||||||
タイトル | ||||||||
タイトル | v.Connect:ユーザが声色操作可能な歌声合成器 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | v.Connect : A Singing Synthesis System Enabling Users to Control Vocal Tones | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | スペシャルセッション | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電気通信大学 | ||||||||
著者所属 | ||||||||
電気通信大学 | ||||||||
著者所属 | ||||||||
電気通信大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro-Communications | ||||||||
著者名 |
小川, 真
矢崎, 俊志
阿部, 公輝
× 小川, 真 矢崎, 俊志 阿部, 公輝
|
|||||||
著者名(英) |
Makoto, Ogawa
Syunji, Yazaki
Koki, Abe
× Makoto, Ogawa Syunji, Yazaki Koki, Abe
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | VOCALOID 「初音ミク」 の発売以来,ユーザが自由に歌声ライブラリを制作できるフリーの歌声合成器 UTAU が開発されるなど,歌声合成への関心が高まっている.これら歌声合成器は主にアマチュアの音楽制作に使用されるが,ユーザが声色を任意時刻に混ぜて指定する機能がない.また,声色操作を行うことで処理時間やデータ量が大きくなる.本研究では音声合成分析系 WORLD を用い,メルケプストラムと Vorbis による励起信号からなるコーパスを声色別に収録し,各音素間を時間伸縮関数で接続することで,ユーザがモーフィング率を指定し声色を操作できる歌声合成器 v.Connect を開発した.提案手法を用いて歌声コーパス 「波音リツコネクト」 を制作した.このコーパスの容量は波形の 2 倍程度であった.合成速度は 1.7~2.2 倍と改善され,圧縮による劣化は主観的には感じられなかった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Since the release of Hatsune Miku, interets in singing synthesis increase. For example, a singing synthesis system, UTAU, has been developed as a freeware. Most of these systems, however, lack of the function that users can mix vocal tones at any times. Controling tonal changes in singing requires a large amount of time and data for synthesis. We have developed a singing synthesis system, v.Connect, which connects corresponding phonemes with a time-stretching function to enable users to control tonal changes in singing by specifying the rate of voice morphing. The system processes voice signals with WORLD, a voice synthesis and analysis system, and uses corpora of various tonal voices consisting of Mel cepstra and excitation signals compressed by Vorbis. We constructed a corpus, ”Namine Ritsu Connect”, using the proposed method. It was found that the size of the corpus was two times larger than that of raw waves, and that synthesis from the corpus was 1.7 to 2.2 times faster than that from raw waves. Degradation caused by compression was not sensed subjectively. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2012-MUS-94, 号 10, p. 1-7, 発行日 2012-01-27 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |