WEKO3
-
RootNode
アイテム
ニュース記事に関連するツイート収集手法の提案とその評価
https://ipsj.ixsq.nii.ac.jp/records/99096
https://ipsj.ixsq.nii.ac.jp/records/9909643737e59-9feb-4286-b4ad-af746cfc61bd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-03-06 | |||||||
タイトル | ||||||||
タイトル | ニュース記事に関連するツイート収集手法の提案とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Proposal and Evaluation of a Method for Collecting Tweets Related to News Articles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京学芸大学大学院 | ||||||||
著者所属 | ||||||||
東京学芸大学大学院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Gakugei University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Gakugei University | ||||||||
著者名 |
邱, 起仁
櫨山, 淳雄
× 邱, 起仁 櫨山, 淳雄
|
|||||||
著者名(英) |
Qiren, Qiu
Atsuo, Hazeyama
× Qiren, Qiu Atsuo, Hazeyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Twitter には,ニュース記事の話題に対する意見や感想を含む投稿が多数存在している.そこで本研究では,それらの意見や感想を抽出するため,ニュース記事に関連するツイートを収集する手法を提案する.ツイートはリンク付きツイート,リンクなしツイートに分類できる.提案手法では,まずリンク先のテキストを利用し,リンク付きツイートとニュース記事を関連づける.次に,リンク付きツイートがニュース記事を言及する際に,ニュース記事から引用した語を重要語とし,それらの語の重要度を考慮し,リンクなしツイートとニュース記事の関連づけを行う.また,ニュース記事の作成時刻とツイートの投稿時刻が近ければ近いほど,同じ話題に関連する可能性が高いと考えられる.そこで本研究では,ニュース記事とツイートの内容的類似性のみではなく,時間的類似性を合わせて考慮することで,関連づけの精度を向上させる.評価実験により,提案手法は 88.1%の適合率を保ちながら 98.1%の再現率でニュース記事に関連するリンク付きツイートを抽出することができ,65.2%の適合率を保ちながら 93.8%の再現率でニュース記事に関連するリンクなしツイートを抽出することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Many tweets including opinions and comments regarding the topic of news articles exist in Twitter. In order to extract these opinions and comments, this paper proposes a method for collecting the tweets related to news articles. We classify the tweets into ‘tweet with urls' and ‘tweet without urls.' In the proposed method, at first, we associate news article with ‘tweet with urls' by using texts that are linked to the tweet. Next, if ‘tweet with urls' refers to a news article, the words quoted from the news article are regarded as important, and then the association of ‘tweet without urls' with the news article is performed in consideration of the importance of those words. Moreover, we take not only the contents similarity between tweets and news articles, but aslo the time similarity into consideration to improve accuracy of the association. The evaluation experiment shows that our method can extract ‘tweet with urls' related to news articles on the ratio of recall of 98.1% while maintaining the ratio of precision of 88.1%, and extract ‘tweet without urls' related to news articles on the ratio of recall of 93.8% while maintaining the ratio of precision of 65.2%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1155524X | |||||||
書誌情報 |
研究報告グループウェアとネットワークサービス(GN) 巻 2014-GN-91, 号 57, p. 1-6, 発行日 2014-03-06 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |