Item type |
Journal(1) |
公開日 |
2015-12-15 |
タイトル |
|
|
タイトル |
テキストからの表現豊かな音声合成を目指した宣伝文からの強調アクセント句の予測 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Emphasized Accent Phrase Prediction from Advertisement Text for Text-to-expressive Speech Synthesis |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文(特選論文)] 表現豊かな音声合成,テキスト解析,強調予測,アクセント句 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
日本電信電話株式会社NTTメディアインテリジェンス研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTメディアインテリジェンス研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTメディアインテリジェンス研究所 |
著者所属(英) |
|
|
|
en |
|
|
NTT Media Intelligence Labs. |
著者所属(英) |
|
|
|
en |
|
|
NTT Media Intelligence Labs. |
著者所属(英) |
|
|
|
en |
|
|
NTT Media Intelligence Labs. |
著者名 |
中嶋, 秀治
水野, 秀之
阪内, 澄宇
|
著者名(英) |
Hideharu, Nakajima
Hideyuki, Mizuno
Sumitaka, Sakauchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
テキストからの表現豊かな音声合成(expressive TTS)の実現にはテキスト解析技術と音声生成技術の発展が必要である.本論文では前者のテキスト解析に焦点をあて,商品宣伝文の表現豊かな音声合成を対象とし,宣伝文の持つテキスト情報から強調をおいて発話されるアクセント句を予測する方式の提案を行う.この目的のため,現在のTTSで用いられているテキスト解析技術によって高い精度で抽出可能な特徴量を検討した.強調の有無とそれらの特徴量との間での相互情報量の計算の結果,アクセント句内の主たる内容語の出現形と主たる機能語の出現形と品詞が強調の有無に対する高い予測力を持つことが分かった.そして,これらの特徴量とSVMとを用いる強調位置の予測方法が良好な精度を示すことを予測実験により確認した.合成品質の改善に強調位置をコンテキスト情報として利用することが有効と確認されている音声合成の前段のテキスト解析の機能として本手法が有望であると考えられる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Realizing Expressive Text-to-speech synthesis needs developments of both text processing and the rendering of natural expressive speech. This paper focuses on the former as a front-end task in the production of synthetic speech, and investigates a novel method for predicting emphasized accent phrases from advertisement text information. For this purpose, we examine features that can be accurately extracted by text processing based on current Text-to-speech synthesis technologies. Among features, the word surface string of the main content and function words and the part-of-speech of main function words in an accent phrase are found to have higher potential on predicting whether the accent phrase should be emphasized or not through the calculation of mutual information between emphasis label and features of Japanese advertisement sentences. Experiments confirm that emphasized accent phrase prediction using support vector machine (SVM) offers encouraging accuracies for the system which requires emphasized accent phrase locations as a context information to improve speech synthesis qualities. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 56,
号 12,
p. 2384-2394,
発行日 2015-12-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |