HTML要素に基づく有害サイト検出手法

池田, 和史; 柳原, 正; 服部, 元; 松本, 一則; 小野, 智弘; 滝嶋, 康弘; Kazushi, Ikeda; Tadashi, Yanagihara; Gen, Hattori; Kazunori, Matsumoto; Chihiro, Ono; Yasuhiro, Takishima

WEKO3

インデックスツリー

RootNode

アイテム

HTML要素に基づく有害サイト検出手法

https://ipsj.ixsq.nii.ac.jp/records/75773

名前 / ファイル	ライセンス	アクション
IPSJ-JNL5208014.pdf (1.5 MB)	Copyright (c) 2011 by the Information Processing Society of Japan
オープンアクセス

Item type

Journal(1)

公開日

2011-08-15

タイトル

HTML要素に基づく有害サイト検出手法

タイトル

言語

タイトル

Detection of Malicious Web Pages Based on HTML Elements

言語

jpn

キーワード

主題Scheme

Other

主題

一般論文

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_6501

資源タイプ

journal article

著者所属

株式会社KDDI研究所

著者所属

株式会社KDDI研究所

著者所属

株式会社KDDI研究所

著者所属

株式会社KDDI研究所

著者所属

株式会社KDDI研究所

著者所属

株式会社KDDI研究所

著者所属(英)

KDDI R&D Laboratories Inc.

著者所属(英)

KDDI R&D Laboratories Inc.

著者所属(英)

KDDI R&D Laboratories Inc.

著者所属(英)

KDDI R&D Laboratories Inc.

著者所属(英)

KDDI R&D Laboratories Inc.

著者所属(英)

KDDI R&D Laboratories Inc.

著者名

池田, 和史柳原, 正服部, 元松本, 一則小野, 智弘滝嶋, 康弘

著者名(英)

Kazushi, Ikeda Tadashi, Yanagihara Gen, Hattori Kazunori, Matsumoto Chihiro, Ono Yasuhiro, Takishima

論文抄録

内容記述タイプ

Other

内容記述

本稿では高速かつ高精度に有害サイトを検出するため， Webサイトの背景色やリンク先，ブラウザに特定の動作をさせるスクリプトなど，有害サイトに特徴的に見られる傾向をHTML要素から検出する手法を提案する．提案手法では有害サイトのHTMLに偏って出現するような文字列を自動的に抽出し， SVM（Support Vector Machine）を用いてこれらの特徴を組み合わせて有害サイトの検出を行う．提案手法はWebサイトの本文の情報を利用しないため，既存のキーワードベース方式によって検出が困難なサイトも検出が可能である．このため，既存のキーワードベース方式と組み合わせて利用することで検出精度を向上させることも可能である．大規模なWebサイトデータを用いた性能評価実験を行い，既存のキーワードベース方式と比較して，適合率を9.3ポイント向上するなどの性能向上を確認した．

論文抄録(英)

内容記述タイプ

Other

内容記述

In this paper, we propose high-speed and accurate algorithms for detecting malicious Web pages. Our algorithms detect the features of malicious Web pages from their HTML elements such as the background colors of Web pages, the server names related to malicious Web pages, or the name of javascript functions that makes browsers perform unusual actions in response to malicious Web pages. Strings that appear especially in HTML elements of malicious Web pages are automatically chosen. SVMs (Support Vector Machines) combine these strings and detect malicious Web pages. Since our algorithms do not rely on the text parts of Web pages, they can detect Web pages that existing text-based algorithms have difficulty in detecting. By conducting a large-scale performance evaluation with real malicious Web pages, we showed that the hybrid algorithms of our algorithms and existing text-based algorithms increase the precision of existing text-based algorithms alone by 9.3 points.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00116647

書誌情報

情報処理学会論文誌

巻 52, 号 8, p. 2474-2483, 発行日 2011-08-15

ISSN

収録物識別子タイプ

ISSN

収録物識別子

1882-7764

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 21:04:13.155178

Show All versions

Cite as

滝嶋, 康弘, 2011: 2474–2483 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

HTML要素に基づく有害サイト検出手法

× 池田, 和史柳原, 正服部, 元松本, 一則小野, 智弘滝嶋, 康弘

× Kazushi, Ikeda Tadashi, Yanagihara Gen, Hattori Kazunori, Matsumoto Chihiro, Ono Yasuhiro, Takishima

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

HTML要素に基づく有害サイト検出手法

× 池田, 和史 柳原, 正 服部, 元 松本, 一則 小野, 智弘 滝嶋, 康弘

× Kazushi, Ikeda Tadashi, Yanagihara Gen, Hattori Kazunori, Matsumoto Chihiro, Ono Yasuhiro, Takishima

Versions

Share

Cite as

エクスポート

× 池田, 和史柳原, 正服部, 元松本, 一則小野, 智弘滝嶋, 康弘