WEKO3
-
RootNode
アイテム
図書館における機械学習技術の実践的適用について 次世代デジタルライブラリーの機能改修及び新たなデータセットの公開を中心に
https://ipsj.ixsq.nii.ac.jp/records/215772
https://ipsj.ixsq.nii.ac.jp/records/215772ebc77114-1617-48eb-96b1-238c1d634f92
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2021-12-04 | |||||||
タイトル | ||||||||
タイトル | 図書館における機械学習技術の実践的適用について 次世代デジタルライブラリーの機能改修及び新たなデータセットの公開を中心に | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | On the practical application of machine learning in the library Focusing on the functional modification of the next digital library and the release of new datasets | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | データセット,機械学習,画像検索,OCR,次世代デジタルライブラリー | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
国立国会図書館 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Diet Library | ||||||||
著者名 |
青池, 亨
× 青池, 亨
|
|||||||
著者名(英) |
Toru, Aoike
× Toru, Aoike
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 国宣国会図書館のデジタル化資料について,機械学習を適用したサービス提供の改善を試みるに当たっては, 日指す機能を実現するための有効性や構築コストに考慮してデータセットの設計・整備を行うこと,また,既存の大規模データ資源や日覚ましく進展する画像認識分野の機械学習アルゴリズムを活用することの両方に目を配る必要がある.本論文では,新たに構築・公開したデータセット件(画像タグデータセットNDL-ImageLabel及びOCR1行データセットについて,その設計思想と有効性を論じ,実際の活用事例として年末にサービスの改修を予定している次世代デジタルライブラリーの技術要素や新規事業の技術検討における役割を紹介する.本論文で取り上げたデータセットや機械学習モデルについてはNDLラボのGitHub(https://github.com/ndl-lab/)から公開している. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | When attempting to improve services by applying machine learning to the digitized materials held by the National Diet Library (NDL), it is important to consider the preparation of data sets based on a design that takes into account the effectiveness and construction cost to realize aimed functions. It is also necessary to pay attention to the coordination of existing large-scale data resources and machine learning algorithms in the field of image recognition, which has made remarkable progress in recent years. In this paper, we discuss the design concept and effectiveness of two newly released datasets (image tagging dataset NDL-ImageLabel and OCR one-line dataset) and, as an actual case study, introduce how they are playing a role both in the inhouse technical renovation of the Next Digital Library, which is scheduled to be released to the public at the end of the FY2021, and in the technical investigation for new library services. The datasets and the machine learning models discussed in this paper are available on GitHub repository of NDL Labs (https://github.com/ndl-lab/). | |||||||
書誌情報 |
じんもんこん2021論文集 巻 2021, p. 72-79, 発行日 2021-12-04 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |