WEKO3
-
RootNode
アイテム
GraphCNN向けの疎行列積計算Batch最適化
https://ipsj.ixsq.nii.ac.jp/records/192832
https://ipsj.ixsq.nii.ac.jp/records/1928329adaae17-b6ae-4863-89a1-86f8ed96e12f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2018 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2018-12-10 | |||||||||||||
タイトル | ||||||||||||||
タイトル | GraphCNN向けの疎行列積計算Batch最適化 | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
キーワード | ||||||||||||||
主題Scheme | Other | |||||||||||||
主題 | アクセラレータ | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
資源タイプ | technical report | |||||||||||||
著者所属 | ||||||||||||||
東京工業大学 | ||||||||||||||
著者所属 | ||||||||||||||
東京工業大学 | ||||||||||||||
著者所属 | ||||||||||||||
京都大学 | ||||||||||||||
著者所属 | ||||||||||||||
(国立研究開発法人)理化学研究所計算科学研究センター/東京工業大学 | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
Tokyo Institute of Technology | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
Tokyo Institute of Technology | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
Kyoto University | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
RIKEN Center for Computational Science (R-CCS) / Tokyo Institute of Technology | ||||||||||||||
著者名 |
長坂, 侑亮
× 長坂, 侑亮
× 額田, 彰
× 小島, 諒介
× 松岡, 聡
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | バイオインフォマティクス等における深層学習的手法の適用として,高い認識精度を得ることが可能である Graph Convolutional Network (GCN) が近年注目を集めている.グラフ構造を持つデータに対する畳込み演算が可能である GCN の処理では,疎行列計算 (SpMM) を含む膨大な演算を処理するために GPU が用いられている.しかしながら,GCN で扱われるデータのグラフ構造にはノード数が数十程度の小さいものが含まれており,小行列に対する SpMM は GPU の並列性の活用が困難であるために,疎行列計算が GCN の学習や推論の性能のボトルネックとなっている.GCN の処理性能向上のために,複数のデータに対する SpMM 計算を一つのカーネルで行うことで GPU の高い並列性と演算能力を活用可能にする Batched SpMM と,GPU のメモリ階層を活用した Batched SpMM Dynamic を提案する.NVIDIA Tesla P100 GPU を搭載する TSUBAME 3.0 にて評価実験を行い,GCN アプリケーションに Batched 手法を適用することによって学習と推論の双方において高速化を実現し,学習性能は最大 1.64 倍,推論性能は最大 1.38 倍の性能向上を達成した. | |||||||||||||
書誌レコードID | ||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||
収録物識別子 | AN10463942 | |||||||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2018-HPC-167, 号 7, p. 1-9, 発行日 2018-12-10 |
|||||||||||||
ISSN | ||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||
収録物識別子 | 2188-8841 | |||||||||||||
Notice | ||||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |
Share
Cite as
長坂, 侑亮, 額田, 彰, 小島, 諒介, 松岡, 聡, 2018, GraphCNN向けの疎行列積計算Batch最適化: 情報処理学会, 1–9 p.
Loading...