WEKO3
-
RootNode
アイテム
GMPI:GPUクラスタにおけるGPUセルフMPIの提案
https://ipsj.ixsq.nii.ac.jp/records/145095
https://ipsj.ixsq.nii.ac.jp/records/1450953645c4f8-ebe7-4fb1-969b-ac12024fd716
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2015-09-23 | |||||||||||
タイトル | ||||||||||||
タイトル | GMPI:GPUクラスタにおけるGPUセルフMPIの提案 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | GPU | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
筑波大学大学院システム情報工学研究科 | ||||||||||||
著者所属 | ||||||||||||
東京大学情報基盤センター | ||||||||||||
著者所属 | ||||||||||||
筑波大学大学院システム情報工学研究科/筑波大学計算科学研究センター | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Graduate School of System and Information Engineering, University of Tsukuba | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Information Technology Center, The University of Tokyo | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Graduate School of System and Information Engineering, University of Tsukuba / Center for Computational Sciences, University of Tsukuba | ||||||||||||
著者名 |
桑原, 悠太
× 桑原, 悠太
× 塙, 敏博
× 朴, 泰祐
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年,GPU クラスタでは,GPU プログラミング環境として CUDA (Compute Unified Device Architecture) が標準的に用いられている.GPU クラスタ上での並列アプリケーションでは,CUDA 環境おいて,ノードを跨ぐ GPU 間通信が発生し,MPI などによりホスト CPU が処理するのが一般的である.そのため,通信が発生する毎に GPU 上の CUDA カーネルからホストに一旦制御を戻す必要があり,カーネル関数の起動や同期に伴うオーバーヘッドが生じる.特に並列処理における通信粒度が細かいほど,カーネル関数の起動回数も増え,オーバーヘッドも増加する.それだけでなく,プログラミングのコストが高く,CPU 向け MPI プログラムを GPU 並列化する場合にソースコードが煩雑になりやすいといった生産性の低下も問題となっている.これらの問題を解決するために,本研究では GPU カーネル内から MPI 通信の起動を可能とする並列通信システム “GMPI” を提案・開発する.これにより,並列 GPU プログラミングを簡単化し,GPU カーネルの起動や同期に伴うオーバーヘッド削減による並列処理効率の向上を目指す.本稿では,GMPI の実装と,Ping-Pong 通信および姫野ベンチマークの性能評価を行う.現状では性能最適化やチューニングが十分でなく,Ping-Pong 通信では従来方式とほぼ同等の性能であるが,姫野ベンチマークでは従来手法の約半分の性能が得られている. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10463942 | |||||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2015-HPC-151, 号 12, p. 1-8, 発行日 2015-09-23 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8841 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |