WEKO3
-
RootNode
アイテム
Twitterにおけるコンテキストと単語の相関関係分析
https://ipsj.ixsq.nii.ac.jp/records/69013
https://ipsj.ixsq.nii.ac.jp/records/69013c4cbd202-45ab-4d89-b5a7-d4b4cd34113e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-03-19 | |||||||
タイトル | ||||||||
タイトル | Twitterにおけるコンテキストと単語の相関関係分析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Relational Analysis between User Context and Input Word on Twitter | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | コンテキスト解析/ユビキタス通信 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者名 |
荒川, 豊
田頭, 茂明
福田, 晃
× 荒川, 豊 田頭, 茂明 福田, 晃
|
|||||||
著者名(英) |
Yutaka, Arakawa
Shigeaki, Tagashira
Akira, Fukuda
× Yutaka, Arakawa Shigeaki, Tagashira Akira, Fukuda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では,コンテキストアウェアIME実現へ向けて,コンテキストと入力文字列との相関関係を明らかにするために,Twitter (ツイッター) のつぶやきを収集し分析を行った.ツイッターを分析対象とした理由は,位置情報が付加された文字列が大量に得られることと幅広いユーザ層の文字列が得られることからである.2009 年 12 月 15 日から 2010 年 2 月 1 日の位置情報付きの 13590 件のツイートに対して,位置情報から得られるランドマーク情報と,時間情報から得られるテレビ番組情報とのマッチングを行ない,取得したツイートのうち,4.83% が発言した位置を元に得られるランドマーク情報を含み,8.16% が発言した時間を元に得られるテレビ番組情報を含んでいることを明らかにした.また,一致した文字列は,2~3 文字であることや Web 検索結果の上位 10 件に約 45% が含まれていることを明らかにした. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The objective of this paper is to clear out the relation ship between user's context and really used words in order to realize the context-aware IME. In this paper, we target public tweets of Twitter, because it includes various user's real sentences with geocode (latitude and longitude). We analyze 13590 tweets that have collected from 15 December 2009 to 1 February 2010 for specifying the relationship to landmark information and TV program. As a result, we show that 4.83% of tweets include landmark words, and 8.16% of tweets include TV program words. Additionally, we bring out that average length of concerted words is about 2.5 words, and 45% of them are included in top 10 of web search results. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11451459 | |||||||
書誌情報 |
研究報告システムLSI設計技術(SLDM) 巻 2010-SLDM-144, 号 50, p. 1-7, 発行日 2010-03-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |