WEKO3
-
RootNode
アイテム
スプログ検出におけるHTML構造の類似性の有効性の評価
https://ipsj.ixsq.nii.ac.jp/records/66699
https://ipsj.ixsq.nii.ac.jp/records/666991ad6f6cc-4160-4207-abcf-577c5a077898
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-11-13 | |||||||
タイトル | ||||||||
タイトル | スプログ検出におけるHTML構造の類似性の有効性の評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Evaluating Effects of Similarities of HTML Structures in Splog Detection | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | セッション:ブログ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
東京電機大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
(株) ナビックス | ||||||||
著者所属 | ||||||||
東京大学人工物工学研究センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tokyo Denki University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Navix Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research into Artifacts, Center for Engineering, University of Tokyo | ||||||||
著者名 |
片山, 太一
芳中, 隆幸
宇津呂, 武仁
河田, 容英
福原, 知宏
× 片山, 太一 芳中, 隆幸 宇津呂, 武仁 河田, 容英 福原, 知宏
|
|||||||
著者名(英) |
Taichi, Katayama
Takayuki, Yoshinaka
Takehito, Utsuro
Yasuhide, Kawada
Tomohiro, Fukuhara
× Taichi, Katayama Takayuki, Yoshinaka Takehito, Utsuro Yasuhide, Kawada Tomohiro, Fukuhara
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では,ブログにおいてアフィリエイト収入を得ることを目的とするスパム (スパムブログ,スプログ) のうち,特に,同一のスパムブログ作成者が自動的に大量生成したと推測されるスプログの検出において,HTML 構造の類似性が効果的であることを示す.具体的には,ブログの HTML ファイルにおける DOM ツリーから,コンテンツの最小単位に相当するブロックを抽出し,複数のスプログの間でブロック構造の類似性を測定する.その結果,同一ブログホストにおけるスプログのうち,同一のスパムブログ作成者が自動的に大量生成したと推測されるスプログ同士では,ブロック構造が類似する傾向があることを示す.また,ブロック構造の類似性を素性として用いることにより,SVM によるスプログ検出の性能が向上する場合があることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Spam blogs or splogs are blogs hosting spam posts, created using machine generated or hijacked content for the sole purpose of hosting advertisements or raising the number of inward of target sites. Among those splogs, this paper focuses on detecting a group of splogs which are estimated to be created by an identical spammer. We especially show that similarities of html structures among those splogs created by an identical spammer contribute to improving the performance of splog detection. In measuring similarities of html structures, we extract a list of blocks (minimum unit of content) from the DOM tree of a html file. We show that the html files of splogs estimated to be created by an identical spammer tend to have similar DOM trees and this tendency is quite effective in splog detection. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
研究報告データベースシステム(DBS) 巻 2009-DBS-149, 号 19, p. 1-8, 発行日 2009-11-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |