WEKO3
-
RootNode
アイテム
辞書に基づく単語の再帰的語義展開
https://ipsj.ixsq.nii.ac.jp/records/10718
https://ipsj.ixsq.nii.ac.jp/records/107185aaed97c-50a3-41e0-be71-b9ed9b55e22a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-02-15 | |||||||
タイトル | ||||||||
タイトル | 辞書に基づく単語の再帰的語義展開 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Recursive Expansion of Word Definition Based on Dictionaries | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語 | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories | ||||||||
著者名 |
鈴木, 敏
× 鈴木, 敏
|
|||||||
著者名(英) |
Satoshi, Suzuki
× Satoshi, Suzuki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 辞書の持つ単語と定義文の関係を利用した,単語のベクトル化のための新しい手法を提案する.提案手法は定義文を再帰展開することにより単語ベクトルを生成する手法である.定義文を単語の集合と見なして再帰展開するときの問題は,この展開が無限に続くため,単語頻度などが計算できなくなることにある.しかし,展開時に一定の重みを仮定することで無限級数の形式に変換でき,計算可能となる.提案手法では,この展開を確率モデルとして扱い,計算の各過程における意味を明確にしている.これにより,応用の見通しが良くなるという長所を得ている.本論文では提案手法の詳細を示すとともに,本手法を単語類似度計算へ適用し,TF-IDFに基づく計算結果と比較・検証を行った.その結果は精度・再現率ともに提案手法が優位であるという明確な有効性を示すものであった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a new method for computing the probabilistic vector expression of words based on dictionaries, which exploits the relationship between headwords and their definitions. A word definition is a set of other words, each of which is expanded by its own definition. Generally, this expansion cannot be computed because it is repeatedly applied infinitely. Nevertheless, an assumption of adding a certain weight to each expansion formulates the infinite expansion to infinite series and makes it possible to be computed. The proposed method provides clear applicability and a well-founded procedure based on stochastic processes each of which is obvious. This paper describes details of the method and demonstrates its application to word similarity in comparison with TF-IDF. The simulations clearly show the advantage of our method in both recall and precision results. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 46, 号 2, p. 624-630, 発行日 2005-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |