Item type |
Trans(1) |
公開日 |
2016-06-29 |
タイトル |
|
|
タイトル |
トピックモデルに基づく大規模ネットワークの重複コミュニティ発見 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Overlapping Community Detection in Large-scale Networks Using Topic Models |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[研究論文] 大規模ネットワーク,重複コミュニティ,トピックモデル,確率的変分ベイズ法 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
筑波大学情報学群知識情報・図書館学類 |
著者所属 |
|
|
|
筑波大学図書館情報メディア系 |
著者所属(英) |
|
|
|
en |
|
|
College of Knowledge and Library Sciences, School of Informatics, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Library, Information and Media Science, University of Tsukuba |
著者名 |
野沢, 健人
若林, 啓
|
著者名(英) |
Kento, Nozawa
Kei, Wakabayashi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
グラフ構造におけるコミュニティ発見手法は,ソーシャルメディアや共著関係,商品の購買データなどから機能的・構造的にまとまりをもったノード群を抽出し分析することを可能にする重要な技術である.特に近年では,非常に大規模なグラフを解析する機会が多くなってきているため,グラフの規模に対してスケーラブルなコミュニティ発見手法が求められている.本研究では,あるノードからの距離が一定以下のノードの集合を文書と見なしてトピックモデルを学習し,トピックごとのノードの予測分布を用いてコミュニティ発見を行う手法について論じたうえで,トピックモデルの学習に確率的変分ベイズ法を適用することで,データの規模に対して高いスケーラビリティを持つ重複コミュニティ発見手法を提案する.実験により,提案手法は6,000万ノード,18億エッジからなる大規模ネットワークに対しても,既存手法と比較して高速なコミュニティ発見を実現できることを示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Community detection in graph is an important technique to be able to extract and analyze social media, co-authorship, co-purchase data, etc. In recent years, there are many possible applications that deal with large-scale graph data, so it is necessary to develop a scalable community detection method for network size. In this paper, we apply training of topic models to graph data by regarding a set of nodes that its distance to a node is less than a certain distance as a document, and use the predict distribution of node by each topic as the community membership probabilities. We propose a method to use stochastic variational Bayes algorithm for training topic models, which makes the overlapping community detection efficient with high scalability for network size. In the experiment, we show that our proposed method is remarkably faster than previous methods and capable to detect communities even in a huge network that contains 60 million nodes and 1.8 billion edges. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464847 |
書誌情報 |
情報処理学会論文誌データベース(TOD)
巻 9,
号 2,
p. 1-10,
発行日 2016-06-29
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7799 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |