WEKO3
-
RootNode
アイテム
近似文字列照合による全文検索のための接尾辞配列の高速走査法
https://ipsj.ixsq.nii.ac.jp/records/17627
https://ipsj.ixsq.nii.ac.jp/records/176270588da78-386e-4333-ab84-770395184058
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-09-15 | |||||||
タイトル | ||||||||
タイトル | 近似文字列照合による全文検索のための接尾辞配列の高速走査法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Fast Traversal of Suffix Arrays for Full - text Approximate String Matching | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 研究論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
通信総合研究所 | ||||||||
著者所属 | ||||||||
通信総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Communications Research Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Communications Research Laboratory | ||||||||
著者名 |
内山, 将夫
井佐原, 均
× 内山, 将夫 井佐原, 均
|
|||||||
著者名(英) |
Masao, Utiyama
Hitoshi, Isahara
× Masao, Utiyama Hitoshi, Isahara
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近似文字列照合による全文検索では,入力パターンと一定以下の編集距離にある部分テキストすべてをテキストから検索する.近似文字列照合による全文検索は,テキストを接尾辞トライにより索引付けし,それを利用して検索することにより実現できる.しかし,接尾辞トライの占める空間領域は大きいため,接尾辞配列を索引として利用することもある.接尾辞配列を索引として利用する場合には,従来研究では,接尾辞トライ上での探索を接尾辞配列上での2分探索により模擬している.それに対して,本稿では,2分探索ではなく,補助的な配列を用いることにより,高速に,接尾辞トライ上での探索を模擬することができる手法を提案した.さらに,2分探索による方法を利用した場合と提案手法を利用した場合とにおける検索速度を実験的に測定し,提案手法の方が検索速度が速いことを示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Given a text and an input pattern, the goal of full-text approximate string matching is to search for all parts of the text that match the pattern. Full-text approximate string matching can be performed using a suffix trie as an index of the text. A suffix trie, however, is relatively large. So, a suffix array, which is a compact representation of a suffix trie, is often used to simulate searches on a suffix trie. A binary search algorithm is used to search the array. A method is described in this paper that uses an auxiliary array to simulate searches on a suffix trie. The method does not use a binary search algorithm so that it can perform a faster simulation. Experiments showed that the proposed method is faster than one using a binary search algorithm. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 43, 号 SIG09(TOD15), p. 1-14, 発行日 2002-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |