Item type |
Journal(1) |
公開日 |
2019-08-15 |
タイトル |
|
|
タイトル |
意味空間上の分布表現に基づくWebサイトと閲覧ユーザの統合分析モデル |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Model for Integrated Analysis of Website and User by Gaussian Embedding |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] Word2vec,Doc2vec,分散的意味表現,Webサイト閲覧履歴データ,ビジネスアナリティクス |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
上智大学 |
著者所属 |
|
|
|
早稲田大学 |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Sophia University |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者名 |
保坂, 大樹
河部, 瞭太
山下, 遥
後藤, 正幸
|
著者名(英) |
Taiju, Hosaka
Ryota, Kawabe
Haruka, Yamashita
Masayuki, Goto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,消費者のWebサイト閲覧行動は重要なマーケティング分析の対象となっている.サイトの閲覧行動を分析することで,サイト間の関係性やユーザの嗜好を把握し,Web広告の掲載やメールの配信などのマーケティング施策の最適化や効率化が可能となるためである.しかし,蓄積されたWeb閲覧履歴データ中のサイトやユーザの関係性は複雑であり,サイト単位やユーザ単位の分析が困難となる場合が多い.したがって,そのような状況においても適用可能,かつ有効な分析手法が望まれている.本研究では,単語の意味分析において良い性能を示しているWord2vecとその拡張モデルに基づき,各サイトや各ユーザをそれぞれ意味空間上の多次元正規分布として表現するとともに,意味空間上のサイトやユーザの関係性に基づいて分析を行うための手法を提案する.学習された意味空間上の表現を用いた分析により,単純な閲覧,被閲覧の関係ではなく,閲覧行動の背後に存在するサイトやユーザの潜在的な特性や関係性を把握することが可能となる.また,提案手法では,サイトやユーザが持つ性質の広がりが多次元正規分布の分散行列として学習される.最後に,提案手法の有効性を検証するために,実際の閲覧履歴データ分析に適用し,得られる結果に関する考察を与える.さらに,分散行列をサイトの閲覧者の多様性,またはユーザの嗜好の多様性として解釈し,より詳細な分析が行えることを示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, many companies analyze Web browsing history of users for understanding their preferences and relationships between websites. The analysis is useful for optimizing of marketing measures such as the mail distribution or the advertisement on the internet. However, the complex relationship between objects in stored Web browsing history makes the analysis of a certain website or a user difficult. It is, therefore, advisable to provide effective analysis methods even in that circumstance. In this research, we focus on the Word2vec model and extensible models which show high-performance in natural language processing and propose the analysis method based on a multidimensional normal distribution in a semantic vector space. Through the analysis based on distributed representation on semantic vector space, we can understand semantic features and relationships between websites and users behind browsing activity instead of direct relationships based on the number of accesses. Finally, we demonstrate the analysis based on our proposed model by applying a practical data. Furthermore, we interpret a covariance matrix of a website as diversity of viewers, and that of a user as diversity of the preference. We show that these measures can be used to analyze more minutely. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 60,
号 8,
p. 1390-1402,
発行日 2019-08-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |