WEKO3
-
RootNode
アイテム
ニュース記事に関連するTwitterの投稿の収集手法の提案
https://ipsj.ixsq.nii.ac.jp/records/96139
https://ipsj.ixsq.nii.ac.jp/records/96139c39e8b46-3d16-4e7a-a850-c3ca44805df9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-11-19 | |||||||
タイトル | ||||||||
タイトル | ニュース記事に関連するTwitterの投稿の収集手法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Method for Collecting Twitter Posts Related to News Articles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | マイクロブログ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京学芸大学 | ||||||||
著者所属 | ||||||||
東京学芸大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Gakugei University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Gakugei University | ||||||||
著者名 |
邱, 起仁
櫨山, 淳雄
× 邱, 起仁 櫨山, 淳雄
|
|||||||
著者名(英) |
Qiren, Qiu
Atsuo, Hazeyama
× Qiren, Qiu Atsuo, Hazeyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,Twitter からニュース記事に関連する tweets を収集することを目的とし,Twitter の投稿とニュース記事の類似度の計算手法を提案する.Twitter の投稿には 140 文字という長さの制限がある.従来の TF-IDF 法だけでは比較的に短文である Twitter の投稿の特徴語を抽出するのが困難である.そこで本論文では,確実にニュース記事に関連する Twitter の投稿 (そのニュース記事への URL を引用する投稿) に出現した語は,同じニュース記事を言及する他の Twitter の投稿にも使用される可能性が高いと考え,それらの語を特徴語として抽出する.また,Twitter の投稿とニュース記事の内容類似度のみではなく,時間類似度も考慮することで,類似度計算の精度を向上させる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we intend to collect the posts related to news from Twitter. We propose a method for calculating the similarity of the news articles and Twitter posts. A length limit of 140 characters to Twitter posts exists. Therefore it is difficult to extract the characteristic words of Twitter posts that are relatively short by just using the conventional TF-IDF method. In this paper, we consider there is high possibility that the terms appeared in Twitter posts related to the news article for sure (posts to quote the URL to the news article), can be also used in the other Twitter posts that mention the same news article. These terms will be extracted as characteristic words. Moreover, taking into consideration not only the contents similarity of Twitter posts and news articles, but also the time similarity is expected to improve the accuracy of similarity calculation. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
研究報告データベースシステム(DBS) 巻 2013-DBS-158, 号 22, p. 1-6, 発行日 2013-11-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |