WEKO3
-
RootNode
アイテム
疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法
https://ipsj.ixsq.nii.ac.jp/records/145091
https://ipsj.ixsq.nii.ac.jp/records/1450911c8bf96b-7dbd-49ef-8062-6d5a23a194e4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2015-09-23 | |||||||||||
タイトル | ||||||||||||
タイトル | 疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | メモリ | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
東京工業大学 | ||||||||||||
著者所属 | ||||||||||||
東京工業大学 | ||||||||||||
著者所属 | ||||||||||||
東京工業大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tokyo Institute of Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tokyo Institute of Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tokyo Institute of Technology | ||||||||||||
著者名 |
長坂, 侑亮
× 長坂, 侑亮
× 額田, 彰
× 松岡, 聡
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 科学技術計算において巨大で疎な問題行列を持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占めている.疎行列ベクトル積計算の GPU 向けの高速化も数多く行われてきているものの,疎行列ベクトル積計算がメモリバウンドなカーネルであることや入力ベクトルへのランダムアクセスによって発生する局所性低下等が要因となって性能向上が妨げられている.我々は GPU での疎行列ベクトル積計算時のメモリアクセス量とアクセス頻度を効果的に削減する疎行列フォーマットである AMB(Adaptive Multi-level Blocking) フォーマットを提案する.16bit integer の利用と種々のブロッキング手法によって,列インデックスの圧縮を行い,メモリアクセス量の削減を図っている.Florida 大学の疎行列データセットから選出した 40 個の行列に対して,既存手法との比較を行い,cuSparse と比較して最大で 2.81 倍,平均で 1.77 倍の性能向上を果たし,また,近年提案された高速な疎行列ベクトル積ライブラリである yaSpMV と比較して最大で 1.38 倍,平均で 1.13 倍の性能向上を果たした. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10463942 | |||||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2015-HPC-151, 号 8, p. 1-7, 発行日 2015-09-23 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8841 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |
Share
Cite as
長坂, 侑亮, 額田, 彰, 松岡, 聡, 2015, 疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法: 情報処理学会, 1–7 p.
Loading...