WEKO3
-
RootNode
アイテム
形態素bi - gramと品詞bi - gramの重ね合わせによる形態素解析
https://ipsj.ixsq.nii.ac.jp/records/49120
https://ipsj.ixsq.nii.ac.jp/records/49120bff11a08-00ff-4c8b-97bc-9e271b0d6256
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1996 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1996-03-14 | |||||||
タイトル | ||||||||
タイトル | 形態素bi - gramと品詞bi - gramの重ね合わせによる形態素解析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Japanese Morphological Analysis by Superposition of Morpheme Bi - gram and Part - of - Speech Bi - gram | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学工学研究科 | ||||||||
著者所属 | ||||||||
京都大学工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electrical Engineering, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electrical Engineering, Kyoto University | ||||||||
著者名 |
森, 信介
長尾, 眞
× 森, 信介 長尾, 眞
|
|||||||
著者名(英) |
Shinsuke, Mori
Makoto, Nagao
× Shinsuke, Mori Makoto, Nagao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 入力文を単語に分割し品詞を付加する形態素解析は、日本語処理における基本的な処理である。英語の品詞タグ付けと異なりコーパスに基づく形態素解析の試みはあまり行なわれていない。本論文では、コーパスに基づく形態素解析の新しい手法を提案する。我々の提案は次のように要約される。)各形態素の語彙化、)附属語列の登録、)マルコフモデルの重ね合わせ。これらのアイデアは形態素解析に特有ではなく、他のコーパスに基づく手法に応用できる。以上のアイデアに基づく形態素解析器を作成し、EDRコーパスに対して実験を行なった結果、非常に高い精度を得た。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Morphological analysis, which segments the input sentence into words and attaches part-of-speeches to them, is the most fundamental process of Japanese language processing. Contrary to English part-of-speech tagging, only few attempts have so far been made at corpus-based Japanese morphological analysis. In this paper we propose a novel method for corpus-based Japanese morphological analysis. Our proposals are summarized as follows: 1) lexicalization of all morphemes; 2) memorization of particle sequence; 3) superposition of Markov models. These ideas are so general that one can apply them to other corpus-based applications. We conducted experiments on EDR corpus and obtained the considerably high accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1996, 号 27(1995-NL-112), p. 37-44, 発行日 1996-03-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |