WEKO3
-
RootNode
アイテム
古文テキスト解析のための文字N グラムの出現確率を利用した単語分割
https://ipsj.ixsq.nii.ac.jp/records/79417
https://ipsj.ixsq.nii.ac.jp/records/79417556cae3f-40d7-4189-af88-0f2f060b0985
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-09 | |||||||
タイトル | ||||||||
タイトル | 古文テキスト解析のための文字N グラムの出現確率を利用した単語分割 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Term Extraction for Text Analysis of Japanese Ancient Writings Based on Probability of Character N-grams | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
立命館大学 情報理工学部 | ||||||||
著者所属 | ||||||||
立命館大学 情報理工学部 | ||||||||
著者所属 | ||||||||
立命館大学 情報理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者名 |
吉村, 衛
木村, 文則
前田, 亮
× 吉村, 衛 木村, 文則 前田, 亮
|
|||||||
著者名(英) |
Mamoru, Yoshimura
Fuminori, Kimura
Akira, Maeda
× Mamoru, Yoshimura Fuminori, Kimura Akira, Maeda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在,日本語の古文に対して汎用的に用いることができる形態素解析器は存在しない.それゆえ日本語の古文に対しては,文章を単語に分割することさえ困難である.単語分割が行えるようになると,古文テキストの解析に役立てることができる.本論文では,日本語の古文の文章を単語に分割する手法を手案する.本手法では,文字Nグラムの単語らしさを評価し,この単語らしさが高い文字Nグラムを単語として文の単語への分割を行う.今回は,「源氏物語」に対し本手法の評価実験を行い,評価・考察を行う. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Currently, there are few available tools to separate ancient Japanese sentences into terms. Therefore, it is difficult to extract archaic Japanese terms from Japanese ancient writings. In this paper, we propose a method of term extraction for Japanese ancient writings. We calculate the likelihood of character n-grams to be a term, and extract character n-grams with higher likelihood as archaic Japanese terms. We conducted experiments of term separation using the term likelihood by the proposed method. | |||||||
書誌情報 |
じんもんこん2011論文集 巻 2011, 号 8, p. 261-268, 発行日 2011-12-03 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |