WEKO3
-
RootNode
アイテム
音声検索語検出を前処理に用いた未知語や認識誤りに頑健な音声ドキュメント検索
https://ipsj.ixsq.nii.ac.jp/records/90272
https://ipsj.ixsq.nii.ac.jp/records/90272d0b4a55f-0703-4b2d-ab18-dcf570d22556
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-02-15 | |||||||
タイトル | ||||||||
タイトル | 音声検索語検出を前処理に用いた未知語や認識誤りに頑健な音声ドキュメント検索 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Front-ending Spoken Document Retrieval with Spoken Term Detection Robust for OOV and Missrecognized Words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [特集:音声ドキュメント処理] 音声ドキュメント処理,音声ドキュメント検索,音声検索語検出 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者名 |
瀧上智子
秋葉, 友良
× 瀧上智子 秋葉, 友良
|
|||||||
著者名(英) |
Tomoko, Takigami
Tomoyosi, Akiba
× Tomoko, Takigami Tomoyosi, Akiba
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声ドキュメント処理において,未知語や音声認識誤りへの対処は不可欠である.本研究では,音声ドキュメント検索に対し,未知語・認識誤りへの対策が比較的検討されている音声検索語検出の手法を前処理として取り入れる手法を提案する.提案手法はまず,連続音節認識結果に対し,クエリを構成する単語を検索語とした音声検索語検出を行い,各語の出現情報を取得し,次にこの出現情報を用いて各文書とクエリとの関連度を計算し,文書検索を行う.提案手法の有効性を調べるために,講演音声を対象とした音声ドキュメント検索テストコレクションを用いて,大語彙連続音声認識結果に対してそのままテキストベースの検索手法を適用する従来法との比較実験を行った.提案法は,クエリに未知語が含まれる場合でも,検索性能を落とすことなく頑健に検索できることが分かった.特に,音声ドキュメントの単語正解率が60%程度と低い場合では,未知語を含むクエリの性能を有意に改善した.さらに,従来法と提案法を相補的に統合することにより,検索性能がより改善されることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | How to deal with speech recognition errors and out-of-vocabulary (OOV) words is one of the challenging problems in spoken document processing. To deal with the problem in spoken document retrieval (SDR), we propose the method that incorporates spoken term detection (STD) into the spoken document retrieval process. The proposed method firstly performs STDs for each term appeared in a given query topic, and then the detection results are used to calculate the relevancy of the retrieved document against the topic. To investigate the effectiveness of the proposed method, we conducted the experimental evaluation using the SDR test collection targeting Japanese lecture speech by comparing with the conventional SDR method using LVCSR and text-based document retrieval. The result showed that the proposed method did not degrade the retrieval performance even if the query included OOV terms. It also showed that it improved the retrieval performance of OOV queries significantly when word correct rate of the spoken document was relatively low (around 60%). Furthermore, the integration of the proposed and the conventional methods further improved the retrieval performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 54, 号 2, p. 506-517, 発行日 2013-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |