WEKO3
-
RootNode
アイテム
古典籍資料をテキスト化するOCRの開発及び全文検索サービスの実験的提供
https://ipsj.ixsq.nii.ac.jp/records/230747
https://ipsj.ixsq.nii.ac.jp/records/230747b66c98a3-6379-460d-a07e-ad200378236c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2023 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2023-02-16 | |||||||
タイトル | ||||||||
タイトル | 古典籍資料をテキスト化するOCRの開発及び全文検索サービスの実験的提供 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | コンピュータと人間社会 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
国立国会図書館 | ||||||||
著者名 |
青池, 亨
× 青池, 亨
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 国立国会図書館は、所蔵する古典籍資料(江戸期以前の和古書、清代以前の漢籍等)に対する検索性の向上を目的として、デジタル化した古典籍資料をテキスト化するOCRの開発及びテキスト化処理を内製にて実施した。また、処理によって得たテキストデータを利用して、実験サービス「次世代デジタルライブラリー」上で2022年11月から古典籍資料約6万点について全文検索機能の提供を開始した。本稿では、開発したOCRモデルについてその性能の分析を行う。また、古典籍資料の全文検索によって新たに可能になった情報探索方法について説明する。なお、作成したOCR学習用のデータセット及びOCRプログラムはオープンソースとして公開予定である。 | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00349328 | |||||||
書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 417-418, 発行日 2023-02-16 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |