WEKO3
-
RootNode
アイテム
ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
https://ipsj.ixsq.nii.ac.jp/records/66700
https://ipsj.ixsq.nii.ac.jp/records/667001163ac49-3ae8-4cc6-9285-43cf12c0e80d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-11-13 | |||||||
タイトル | ||||||||
タイトル | ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Extraction for Blog Posts and Comments using a Set of Blog Pages | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | セッション:ブログ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者名 |
吉田, 光男
乾, 孝司
山本, 幹雄
× 吉田, 光男 乾, 孝司 山本, 幹雄
|
|||||||
著者名(英) |
Mitsuo, Yoshida
Takashi, Inui
Mikio, Yamamoto
× Mitsuo, Yoshida Takashi, Inui Mikio, Yamamoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年のブログの普及により,ブログのコンテンツを利用するサービスや研究が盛んになってきている.ブログのコンテンツは,ポストと呼ばれるブログの書き手によるコンテンツと,コメントと呼ばれるブログの読者によるコンテンツに大分する事ができる.ブログのコンテンツを利用する場合は,それらが別々に抽出できている事が望ましい.本論文では,ブログ記事集合を用いる事により,ポストとコメントを自動的に分離抽出する手法を提案する.本手法は,ポストはブログ記事集合全てのブログ記事に出現するが,コメントはいずれかのブログ記事にしか出現しないというアイデアが基になっている.また,本手法のアルゴリズムを実装したソフトウェアを用いて実験を行い,日本語ブログサイトに対しての有効性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In recent years, with the increase in the number of Blog (Weblog) pages in the Web, the contents of which have attracted a lot of attention from many researchers. Most of the Blog contents are texts, and those can be divided in two parts, posts and comments. A post is a content written by the Blog owner and a comment is piece of text written by readers in response to the owner's post. In this paper, we propose a simple method to extract the posts and comments separately from series of Blog pages, whose posts are all written by the same owner. The proposed method is based on the assumption that although posts appear in all Blog pages, comments do not. We describe experimental results to show good performance of the proposed method using real Web pages of the Blog sites in Japanese. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
研究報告データベースシステム(DBS) 巻 2009-DBS-149, 号 20, p. 1-8, 発行日 2009-11-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |