Item type |
Symposium(1) |
公開日 |
2018-11-24 |
タイトル |
|
|
タイトル |
「みんなで翻刻」による翻刻テキストの分析の試み |
タイトル |
|
|
言語 |
en |
|
タイトル |
Preliminary analyses of the full text produced by “Minna de Honkoku” |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Minna de Honkoku\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Quantitative content analysis\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Historical gazetteer\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Open science\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Earthquake |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属(英) |
|
|
|
en |
|
|
University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者名 |
加納, 靖之
橋本, 雄太
|
著者名(英) |
Yasuyuki, Kano
Yuta, Hashimoto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
市民参加型の史料翻刻プロジェクト「みんなで翻刻」で生成されたテキストに対して,既存の計量テキスト分析用のツールを利用して,頻出語の計数や共起関係の分析を実施した.また,歴史地名データを利用して,テキスト中の地名の同定についても検討した.「地震」という語には,方角や地名に関する語だけでなく,被害に関する語が伴なうことが多いことがわかった.一定の分析結果が得られたものの,分析に利用する辞書の整備や地名の同定方法を洗錬されたものにすることが今後の課題である. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We made preliminary analyses of the full text produced by “Minna de Honkoku” which is a project for crowdsourced transcription of Japanese documents on historical earthquakes. We used existing tools for text mining and dictionary to extract frequent words and co-occurrence network. We also tried to extract ace names using an integrated historical gazetteer. The word “earthquake” co-occur with the words that describes direction and place as well as damage. We need good dictionary and gazetteer to obtain better results of text mining. |
書誌情報 |
じんもんこん2018論文集
巻 2018,
p. 147-152,
発行日 2018-11-24
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |