WEKO3
-
RootNode
アイテム
HTML要素に基づく有害サイト検出手法
https://ipsj.ixsq.nii.ac.jp/records/75773
https://ipsj.ixsq.nii.ac.jp/records/7577375bc99c3-4e80-4aa0-bb81-93d968abe7af
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-08-15 | |||||||
タイトル | ||||||||
タイトル | HTML要素に基づく有害サイト検出手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Detection of Malicious Web Pages Based on HTML Elements | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者名 |
池田, 和史
柳原, 正
服部, 元
松本, 一則
小野, 智弘
滝嶋, 康弘
× 池田, 和史 柳原, 正 服部, 元 松本, 一則 小野, 智弘 滝嶋, 康弘
|
|||||||
著者名(英) |
Kazushi, Ikeda
Tadashi, Yanagihara
Gen, Hattori
Kazunori, Matsumoto
Chihiro, Ono
Yasuhiro, Takishima
× Kazushi, Ikeda Tadashi, Yanagihara Gen, Hattori Kazunori, Matsumoto Chihiro, Ono Yasuhiro, Takishima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では高速かつ高精度に有害サイトを検出するため, Webサイトの背景色やリンク先, ブラウザに特定の動作をさせるスクリプトなど, 有害サイトに特徴的に見られる傾向をHTML要素から検出する手法を提案する. 提案手法では有害サイトのHTMLに偏って出現するような文字列を自動的に抽出し, SVM(Support Vector Machine)を用いてこれらの特徴を組み合わせて有害サイトの検出を行う. 提案手法はWebサイトの本文の情報を利用しないため, 既存のキーワードベース方式によって検出が困難なサイトも検出が可能である. このため, 既存のキーワードベース方式と組み合わせて利用することで検出精度を向上させることも可能である. 大規模なWebサイトデータを用いた性能評価実験を行い, 既存のキーワードベース方式と比較して, 適合率を9.3ポイント向上するなどの性能向上を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose high-speed and accurate algorithms for detecting malicious Web pages. Our algorithms detect the features of malicious Web pages from their HTML elements such as the background colors of Web pages, the server names related to malicious Web pages, or the name of javascript functions that makes browsers perform unusual actions in response to malicious Web pages. Strings that appear especially in HTML elements of malicious Web pages are automatically chosen. SVMs (Support Vector Machines) combine these strings and detect malicious Web pages. Since our algorithms do not rely on the text parts of Web pages, they can detect Web pages that existing text-based algorithms have difficulty in detecting. By conducting a large-scale performance evaluation with real malicious Web pages, we showed that the hybrid algorithms of our algorithms and existing text-based algorithms increase the precision of existing text-based algorithms alone by 9.3 points. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 52, 号 8, p. 2474-2483, 発行日 2011-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |