疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法

長坂, 侑亮; 額田, 彰; 松岡, 聡

WEKO3

インデックスツリー

RootNode

アイテム

疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法

https://ipsj.ixsq.nii.ac.jp/records/145091

名前 / ファイル	ライセンス	アクション
IPSJ-HPC15151008.pdf (372.7 kB)	Copyright (c) 2015 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2015-09-23

タイトル

疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法

言語

jpn

キーワード

主題Scheme

Other

主題

メモリ

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

東京工業大学

著者所属

東京工業大学

著者所属

東京工業大学

著者所属(英)

Tokyo Institute of Technology

著者所属(英)

Tokyo Institute of Technology

著者所属(英)

Tokyo Institute of Technology

著者名

長坂, 侑亮
額田, 彰
松岡, 聡

論文抄録

内容記述タイプ

Other

内容記述

科学技術計算において巨大で疎な問題行列を持つ連立一次方程式を解く際，疎行列ベクトル積計算が実行時間の大部分を占めている．疎行列ベクトル積計算の GPU 向けの高速化も数多く行われてきているものの，疎行列ベクトル積計算がメモリバウンドなカーネルであることや入力ベクトルへのランダムアクセスによって発生する局所性低下等が要因となって性能向上が妨げられている．我々は GPU での疎行列ベクトル積計算時のメモリアクセス量とアクセス頻度を効果的に削減する疎行列フォーマットである AMB（Adaptive Multi-level Blocking）フォーマットを提案する．16bit integer の利用と種々のブロッキング手法によって，列インデックスの圧縮を行い，メモリアクセス量の削減を図っている．Florida 大学の疎行列データセットから選出した 40 個の行列に対して，既存手法との比較を行い，cuSparse と比較して最大で 2.81 倍，平均で 1.77 倍の性能向上を果たし，また，近年提案された高速な疎行列ベクトル積ライブラリである yaSpMV と比較して最大で 1.38 倍，平均で 1.13 倍の性能向上を果たした．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10463942

書誌情報

研究報告ハイパフォーマンスコンピューティング（HPC）

巻 2015-HPC-151, 号 8, p. 1-7, 発行日 2015-09-23

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8841

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-20 18:29:12.912123

Show All versions

Cite as

長坂, 侑亮, 額田, 彰, 松岡, 聡, 2015, 疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法: 情報処理学会, 1–7 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法

× 長坂, 侑亮

× 額田, 彰

× 松岡, 聡

Versions

Share

Cite as

エクスポート