WEKO3
-
RootNode
アイテム
GPUのキャッシュを考慮した疎行列ベクトル積計算手法の性能評価
https://ipsj.ixsq.nii.ac.jp/records/101401
https://ipsj.ixsq.nii.ac.jp/records/101401b0f42e52-186a-4f98-a120-d287356e4dfc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-05-19 | |||||||
タイトル | ||||||||
タイトル | GPUのキャッシュを考慮した疎行列ベクトル積計算手法の性能評価 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 疎行列計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者名 |
長坂侑亮
額田彰
松岡聡
× 長坂侑亮 額田彰 松岡聡
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 巨大な疎行列を係数行列として持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占める.GPU などのメニーコアプロセッサはキャッシュ容量が小さいため,入力ベクトル要素へのランダムアクセスによって多数のキャッシュミスが生じる.そのため疎行列ベクトル積計算性能は著しく低い.我々はメニーコア環境においても高いキャッシュヒット率を達成するために,行列を列方向で分割することで各処理内での入力ベクトル要素の再利用性を向上させたフォーマットと疎行列ベクトル積カーネルを新たに提案する.Florida のデータセットから選出した行列に対して既存手法との比較を行った.その結果,疎行列ベクトル積計算について 2.0 倍,CG 法について 1.12 倍の性能向上を果たした. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2014-HPC-144, 号 5, p. 1-9, 発行日 2014-05-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |