WEKO3
-
RootNode
アイテム
クエリらしさに基づく文書コレクションを利用したクエリ自動補完
https://ipsj.ixsq.nii.ac.jp/records/225588
https://ipsj.ixsq.nii.ac.jp/records/225588d9cc7ca4-3714-4fb5-b5a4-47e3e9b5e995
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年4月14日からダウンロード可能です。
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, DBS:会員:¥0, IFAT:会員:¥0, DLIB:会員:¥0 |
Item type | Trans(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-04-14 | |||||||||
タイトル | ||||||||||
タイトル | クエリらしさに基づく文書コレクションを利用したクエリ自動補完 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Estimating Query-ness for Corpus-based Query Auto Completion | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | [研究論文] 情報検索,クエリ自動補完 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||
資源タイプ | journal article | |||||||||
著者所属 | ||||||||||
筑波大学 | ||||||||||
著者所属 | ||||||||||
筑波大学 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
University of Tsukuba | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
University of Tsukuba | ||||||||||
著者名 |
打田, 智子
× 打田, 智子
× 加藤, 誠
|
|||||||||
著者名(英) |
Tomoko, Uchida
× Tomoko, Uchida
× Makoto, P. Kato
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 情報検索システムのクエリ自動補完において,現在主流の手法では,クエリ補完候補を生成するため,過去に蓄積された膨大なクエリログを必要とする.本論文では,専門ドメイン検索システムなど,クエリログが入手しづらい状況下において,入手可能な他のクエリログおよびその文書コレクションと,ターゲットとする文書コレクションから,クエリ補完候補を生成するアプローチについて述べる.具体的にはまず,他のクエリログのクエリ中に出現する単語N-gramのN-gram確率と,対応する文書コレクション中のN-gram確率との比率(「クエリらしさ」を表現する係数)を推定する回帰モデルを構築する.次に,得られた回帰モデルをターゲットとする文書コレクションに適用することで,実際のクエリ補完候補を生成するN-gramモデルを構築する.実験により,提案手法は,他のクエリログのみ,またはターゲットとする文書コレクションのみを用いて構築したN-gramモデルよりも,ユーザクエリの予測タスクにおいて良い性能を与えることが示された. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Most of the existing work in Query Auto Completion for Information Retrieval relies on a vast amount of user query logs. In this paper, we describe an approach to generating candidate queries with available document corpus other than the target document corpus and query logs related to the document corpus in situations where sufficient query logs are not available such as domain-specific search. More concretely, we first learn regression models to estimate the ratio of N-gram probabilities in query logs and N-gram probabilities in the document corpus related to the query log. We call the ratio of N-gram probabilities “Query-ness.” Then we build an N-gram language model by applying the learned regression models to the target document corpus to generate unknown candidate queries. The experimental results show that our method performs better than baselines that only use target document corpus or other query logs in query prediction tasks. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11464847 | |||||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 16, 号 2, p. 1-15, 発行日 2023-04-14 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 1882-7799 | |||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |