WEKO3
-
RootNode
アイテム
CPU環境で高速に動作する軽量OCR「NDL古典籍OCR-Lite」の開発
https://ipsj.ixsq.nii.ac.jp/records/241527
https://ipsj.ixsq.nii.ac.jp/records/2415276c72aaea-cb3c-483d-9df3-77803b1ba0fc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年12月7日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, CH:会員:¥0, DLIB:会員:¥0 |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2024-11-30 | |||||||
タイトル | ||||||||
タイトル | CPU環境で高速に動作する軽量OCR「NDL古典籍OCR-Lite」の開発 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Development of NDLkotenOCR-Lite, a lightweight OCR that runs at high speed in a CPU environment | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 機械学習,OCR,古典籍,翻刻データ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
国立国会図書館 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Diet Library | ||||||||
著者名 |
青池, 亨
× 青池, 亨
|
|||||||
著者名(英) |
Toru, Aoike
× Toru, Aoike
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 国立国会図書館(NDL)では,OCR処理プログラムとして明治期以降の活字の図書・雑誌資料を対象としたNDLOCRや古典籍資料を対象としたNDL古典籍OCRを開発し、オープンソースで公開してきた.しかし,これらのOCRは,動作環境にGPUを必須とすることから,必要な機材や技術知識の敷居が高く,事実上利用者層を狭めていた点が課題であった.近年,動画等をリアルタイムで処理するための技術として,計算負荷を大幅に抑えてGPUのない環境でも高速かつ高精度に動作する機械学習モデルの研究が顕著に進んでいる.こうした研究の知見を取り入れてこれらのOCR処理プログラムを改良し,CPU環境で高速に動作するOCRの開発をすることとした.その第一歩として「NDL古典籍OCR-Lite」の開発を行ったので報告する.あわせて,本研究の知見を活かした今後の見通しについても紹介する.なお、本研究の成果はオープンソースとして公開を予定している. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The National Diet Library (NDL) has developed and released OCRs as open source: NDLOCR for books and periodicals in print from the Meiji period onward, and NDLkotenOCR for classical materials. However, these OCRs, which require a GPU as their operating environment, have a high barrier in terms of the necessary equipment and technical knowledge, despite their “anyone can use them freely” philosophy, and have effectively narrowed the user base. In recent years, there has been remarkable progress in research on machine learning models for real-time processing of video and other data, which can operate at high speed and with high accuracy even in environments without a GPU, greatly reducing the computational load. By reworking the OCR processing program to incorporate knowledge from these fields, the development of an OCR that runs at high speed in a CPU environment was considered. As a first step, we have developed NDLkotenOCR-Lite. The results of this study are scheduled to be released as open source at the end of November 2024. Future prospects for utilizing the findings of this research are also described. | |||||||
書誌情報 |
じんもんこん2024論文集 巻 2024, p. 181-186, 発行日 2024-11-30 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |