WEKO3
-
RootNode
アイテム
仏典全文検索システムの構築と評価
https://ipsj.ixsq.nii.ac.jp/records/100618
https://ipsj.ixsq.nii.ac.jp/records/1006186c22f1e0-816e-4d24-a37e-15a9f0792faf
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-04-01 | |||||||
タイトル | ||||||||
タイトル | 仏典全文検索システムの構築と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Construction and evaluation of full-text search system for Buddhist sutras | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
和歌山大学システム工学部 | ||||||||
著者所属 | ||||||||
和歌山大学大学院システム工学研究科 | ||||||||
著者所属 | ||||||||
和歌山大学システム工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Systems Engineering, Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems Engineering, Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Systems Engineering, Wakayama University | ||||||||
著者名 |
村川, 猛彦
丁, 敏
中川, 優
× 村川, 猛彦 丁, 敏 中川, 優
|
|||||||
著者名(英) |
Takehiko, Murakawa
Ding, Min
Masaru, Nakagawa
× Takehiko, Murakawa Ding, Min Masaru, Nakagawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 経典撮影画像と文字情報を対応付けた,経典読解支援システムを構築するにあたり,劣化や字体の違いなどのため,機械的文字認識のみでは文字の特定が困難なものもある.本研究では,経典画像から対応するテキストファイルの特定を支援する全文検索システムを構築した.CBETAの大正新脩大蔵経テキスト情報をデータベースに登録し,検索エンジンSennaの持つ近傍検索を用いて,ワイルドカード検索や複数行検索ができるようにした,16枚の経典画像に基づくテキストデータに対して,その一部を取り出して検索することで元のテキストファイルが特定できるか実験を行い,3文字程度でも複数の語があれば特定しやすくなることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In constructing a reading support system which contrasts the shot images of some Buddhist sutra with text data, we have difficulty identifying some characters only using automatic character recognition because of sutra's degradation and of the difference of the fonts. In this paper, we report our full-text search system for Buddhist sutras. The system stores the text files derived from CBETA's Taisho Tripitaka data and provides a search form which enables a wildcard search and a multiple line search using the neighborhood search supplied by the search engine Senna. We took experiment of file identification with 16 shot images to show that a couple of trigrams often retrieve the text file. | |||||||
書誌情報 |
じんもんこん2007論文集 巻 2017, p. 221-228, 発行日 2007-12-13 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |