Item type |
Symposium(1) |
公開日 |
2019-12-07 |
タイトル |
|
|
タイトル |
機械学習のための資料レイアウトデータセットの構築と公開 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Construction and Publication of Book Layout Datasets for Machine Learning |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
data set; machine learning; OCR; Next Digital Library |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
国立国会図書館 |
著者所属 |
|
|
|
国立国会図書館 |
著者所属 |
|
|
|
国立国会図書館 |
著者所属 |
|
|
|
国立国会図書館 |
著者所属(英) |
|
|
|
en |
|
|
National Diet Library, National Diet Library, National Diet Library, National Diet Library |
著者名 |
青池, 亨
木下, 貴文
里見, 航
川島, 隆徳
|
著者名(英) |
Toru, Aoike
Takafumi, Kinoshita
Wataru, Satomi
Takanori, Kawashima
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国立国会図書館電子情報部電子情報企画課次世代システム開発研究室(次世代室)では,機械学習技術を図書館サービスに取り入れ,応用することで,資料の検索可能性と提供可能性の拡張を実現するべく調査研究活動に取り組んできた[1].また,これらの研究成果を活用したサービスを一般に利用可能な形で提供する場として,2019 年3 月に「次世代デジタルライブラリー(https://lab.ndl.go.jp/dl/)[2][3]」を公開した.他方,国立国会図書館のデジタル化資料の利活用促進や学術コミュニティへの貢献の観点から,外部の研究者やエンジニアが研究・技術開発用途に利用可能なデータセットを公開することも大きな意義がある.本論文では,国立国会図書館デジタルコレクションのデジタル化資料を活用して作成・公開したデジタル化資料のレイアウトのデータセット(NDLDocL)について,その特色や先行する他機関のデータセットとの相違点を紹介する.また,実際の構築過程における検討事項や開発したアノテーションツールの紹介と,現時点で想定している活用方法のアイデアについて述べる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The National Diet Library is exploring ways to enhance the searchability and availability of library materials through the application of machine learning technologies to library services. Additionally, the NDL launched its Next Digital Library website (https://lab.ndl.go.jp/dl/) in March 2019 to demonstrate to the general public how the results of this research can be used to provide library services. The disclosure of datasets for use outside the NDL in the research and development of new technologies is also significant from the perspective of promoting the use of digitized materials and contributing to the academic community. In this paper, we describe the characteristics of a layout dataset (NDL-DocL) that was prepared using digitized library materials from the NDL Digital Collections, including the differences between our dataset and those previously disclosed by other institutions. In this paper, we also present the content of feasibility studies conducted while configuring the system, the presently assumed usage patterns, and an annotation tool we developed. |
書誌情報 |
じんもんこん2019論文集
巻 2019,
p. 115-120,
発行日 2019-12-07
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |