WEKO3
-
RootNode
アイテム
Support Vector Machineを用いた日本語固有表現抽出
https://ipsj.ixsq.nii.ac.jp/records/11758
https://ipsj.ixsq.nii.ac.jp/records/117584c87f760-9815-4216-8a56-b8dff9e7247e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-01-15 | |||||||
タイトル | ||||||||
タイトル | Support Vector Machineを用いた日本語固有表現抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Japanese Named Entity Extraction Using Support Vector Machine | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Graduate School of Information Science of Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Graduate School of Information Science of Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Graduate School of Information Science of Nara Institute of Science and Technology | ||||||||
著者名 |
山田, 寛康
工藤, 拓
松本, 裕治
× 山田, 寛康 工藤, 拓 松本, 裕治
|
|||||||
著者名(英) |
Hiroyasu, Yamada
Taku, Kudo
Yuji, Matsumoto
× Hiroyasu, Yamada Taku, Kudo Yuji, Matsumoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,機械学習アルゴリズムSupport Vector Machine(SVM)を用いて日本語固有表現抽出を学習する手法を提案し,抽出実験によりその有効性を検証する.固有表現抽出規則の学習には,単語自身,品詞,文字種などを素性として使用するため,その素性空間は非常に高次元となる.SVMは汎化誤差が素性空間の次元数に依存しないため,固有表現抽出規則の学習においても過学習を起こすことなく汎化性能の高い学習が実現できる.また多項式Kernel関数を適用することで複数の素性の組合せを考慮した学習が計算量を変えることなく実現できる.CRL固有表現データを用いてIREX固有表現抽出タスクに対して実験を行った結果,語彙,品詞,文字種,およびそれら任意の2つの組合せを考慮した場合,交差検定によりF値で約83という高精度の結果が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a method for Japanese named entity (NE)extraction using Support Vector Machines (SVM). The generalizationperformance of SVM does not depend on the size of dimensions of thefeature space, even in a high dimensional feature space, such as namedentity extraction task using lexical entries, part-of-speech tags andcharacter types of words as the primitive features. Furthermore, SVMcan induce an optimal classifier which considers the combination offeatures by virtue of polynomial kernel functions. We apply the methodto IREX NE task using CRL Named Entities data. The cross validationresult of the F-value being 83 shows the effectiveness of the method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 43, 号 1, p. 44-53, 発行日 2002-01-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |