WEKO3
-
RootNode
アイテム
ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得
https://ipsj.ixsq.nii.ac.jp/records/62351
https://ipsj.ixsq.nii.ac.jp/records/623512b602c56-152f-4179-a504-62b084ccf539
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-05-14 | |||||||
タイトル | ||||||||
タイトル | ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning Semantic Categories from Web Search Logs Using Label Propagation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
ヤフー株式会社 | ||||||||
著者所属 | ||||||||
ヤフー株式会社 | ||||||||
著者所属 | ||||||||
ヤフー株式会社 | ||||||||
著者名 |
小町, 守
× 小町, 守
|
|||||||
著者名(英) |
Mamoru, Komachi
× Mamoru, Komachi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年ウェブ検索が一般的になり,ウェブを用いた知識獲得の研究が盛んになってきている.検索ログはユーザのユーザの関心を反映した情報源であり,ターゲット広告や検索支援のための情報抽出源として注目を集めている.しかしながら,既存の検索クエリログを用いた意味カテゴリ学習の研究ではユーザが入力したクエリを用いることによるリソースの問題,ブートストラップに代表される手法の可搬性の問題,そしてウェブを対象にした大規模データに対する拡張性の問題,の 3 つの問題点があった.そこで,本研究では検索クリックスルーログを用いた高精度な意味カテゴリ獲得,そしてラベル伝播によるグラフ理論に基づく手法の提案,最後にMapReduceを用いた並列分散計算により,これらの問題を解決する.意味カテゴリ学習タスクにおいて検索クリックスルーログを用いた研究はこれまでになく,本研究では既存手法に比べ高精度・高再現率で意味カテゴリを獲得できることを示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently knowledge acquisition from the web is actively studied as web search becomes widespead. Web search logs are getting much more attention than before for the purpose of information extraction for applications such as targeted advertisement and query suggestion. However, previous work has three problems: query logs of poor quality due to inherent variations of the users' input; portability issue resulted from machine learning method such as bootstrapping; and scalability issue for handling large amount of data extracted from the web. Thus, we propose to use web clickthrough logs for learning semantic categories at high precision; apply a graph theoretic label propagation method; and perform parallel and distributed computation using MapReduce. Our main contribution is the use of web clickthrough logs for the task of learning semantic categories, and we demonstrated it achieves higher precision and recall than previous work. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-76, 号 9, p. 1-6, 発行日 2009-05-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |