近代デジタルライブラリーの文字切り出しにおける実際的手法

福尾, 真実; 高田, 雅美; 城, 和貴; Manami, Fukuo; Masami, Takata; Kazuki, Joe

WEKO3

インデックスツリー

RootNode

アイテム

近代デジタルライブラリーの文字切り出しにおける実際的手法

https://ipsj.ixsq.nii.ac.jp/records/80891

名前 / ファイル	ライセンス	アクション
IPSJ-MPS12087034.pdf (214.0 kB)	Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2012-02-23

タイトル

近代デジタルライブラリーの文字切り出しにおける実際的手法

タイトル

言語

タイトル

Practical technique in the Kanji character clipping of the Digital Library from the Meiji Era

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

奈良女子大学理学部情報科学科

著者所属

奈良女子大学大学院人間文化研究科

著者所属

奈良女子大学大学院人間文化研究科

著者所属(英)

Dept. of Advanced Information and Computer Sciences, Nara Women's University

著者所属(英)

Graduate School of Humanities and Sciences, Nara Women's University

著者所属(英)

Graduate School of Humanities and Sciences, Nara Women's University

著者名

福尾, 真実高田, 雅美城, 和貴

著者名(英)

Manami, Fukuo Masami, Takata Kazuki, Joe

論文抄録

内容記述タイプ

Other

内容記述

本研究では，近代デジタルライブラリーが所蔵する画像データから上手く文字を切り出す実際的手法の開発を行う．国立国会図書館では近代デジタルライブラリーとして，所蔵する書籍を Web 上で一般公開している．これらは，画像データとして公開されており，文書内容を用いた検索が行えないため，早急なテキスト化が求められている．そのため，近代書籍に特化した多フォント漢字認識手法が提案されている．しかし，ルビが振られた書籍からは上手く文字が切り出せず，認識ができない．そこで本稿では書籍の本文からルビを取り除く手法を開発する．

論文抄録(英)

内容記述タイプ

Other

内容記述

In this research, we develop a practical technique to clip the kanji character well from the image data that the digital library from meiji era houses. The national diet library in Japan is opened to the public as the digital library from meiji era on the Web. There are shown as image data. Since it is impossible to perform full text search, it should be converted to text data. Therefore, it has been proposed the multi-fonts kanji character recognition method for early-modern Japanese printed books. Kanji characters with rubi occur that the kanji character clipping and recognition are badly constructed. In this paper, we propose a technique to remove the rubi from body of the book.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10505667

書誌情報

研究報告数理モデル化と問題解決（MPS）

巻 2012-MPS-87, 号 34, p. 1-6, 発行日 2012-02-23

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 19:37:01.860853

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

近代デジタルライブラリーの文字切り出しにおける実際的手法

× 福尾, 真実高田, 雅美城, 和貴

× Manami, Fukuo Masami, Takata Kazuki, Joe

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

近代デジタルライブラリーの文字切り出しにおける実際的手法

× 福尾, 真実 高田, 雅美 城, 和貴

× Manami, Fukuo Masami, Takata Kazuki, Joe

Versions

Share

Cite as

エクスポート

× 福尾, 真実高田, 雅美城, 和貴