WEKO3
-
RootNode
アイテム
近代文献のデジタルアーカイブ化とテキストマイニング―岩波書店「思想」を題材に
https://ipsj.ixsq.nii.ac.jp/records/83197
https://ipsj.ixsq.nii.ac.jp/records/83197d16b4c42-122c-4748-847c-2d971d12483c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-07-28 | |||||||
タイトル | ||||||||
タイトル | 近代文献のデジタルアーカイブ化とテキストマイニング―岩波書店「思想」を題材に | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Digital Archiving and Text Mining of Modern-style Japanese Literatures using Iwanami Shoten’s Journal “Shisou” (thoughts) | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学工学系研究科/知の構造化センター | ||||||||
著者所属 | ||||||||
東京大学知の構造化センター | ||||||||
著者所属 | ||||||||
東京大学知の構造化センター | ||||||||
著者所属 | ||||||||
東京大学工学系研究科/知の構造化センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Engineering / Center for Knowledge Structuring,University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Engineering / Center for Knowledge Structuring, University of Tokyo | ||||||||
著者名 |
美馬, 秀樹
丹治, 信
増田, 勝也
太田, 晋
× 美馬, 秀樹 丹治, 信 増田, 勝也 太田, 晋
|
|||||||
著者名(英) |
Hideki, Mima
Makoto, Tanji
Katsuya, Masuda
Susumu, Ota
× Hideki, Mima Makoto, Tanji Katsuya, Masuda Susumu, Ota
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究の目的は,1921年に創刊された岩波書店『思想』90年分(約1000号,約8600論文,約16万ページ)を題材とし,電子化・構造化を行うことで,a)『思想』という知の集積,分析により20世紀日本の哲学・思想史を明らかにすること,b)分析結果の学部・大学院教育での活用の方法論構築を進めること,及びc)歴史的文献テキストの電子化,アーカイブ化に関する方法論を確立すること,である.本稿では,上記『思想』のデジタルアーカイブ化とテキストマイニングに関し,『思想』雑誌の電子化・構造化の手順とその問題点を報告し,特に,OCRによる文字認識精度の向上,自動化・システム化に向けたレイアウト解析ソフトウェアの開発について,現状の取り組みと予備的に行った実験評価について報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The purpose of this study is to reveal Japanese modern history of philosophy by structuring Iwanami shoten's journal “Shisou” (Thoughts) using MIMA Search structuring knowledge system in which natural language processing (NLP), text mining and visualization are integrated. Iwanami shoten's “Shisou” is one of the represent journals of philosophy in Japan, which has almost 90 years history from 1921 to the present-day, about 8,600 papers / more than 160,000 pages textual data. By digitalizing and analyzing the huge historical textual data using optical character recognition (OCR), NLP and the MIMA Search, we expect to discover new knowledge on Japanese historical flow of thinking during one of the most important eras, from before the World War II to the present-day. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN1010060X | |||||||
書誌情報 |
研究報告人文科学とコンピュータ(CH) 巻 2012-CH-95, 号 4, p. 1-8, 発行日 2012-07-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |