WEKO3
-
RootNode
アイテム
MPI_Allreduceの「京」上での実装と評価
https://ipsj.ixsq.nii.ac.jp/records/82204
https://ipsj.ixsq.nii.ac.jp/records/822040595590b-1315-49d7-b229-417e5d0e6c08
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-05-09 | |||||||
タイトル | ||||||||
タイトル | MPI_Allreduceの「京」上での実装と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Implementation and Evaluation of MPI_Allreduce on the K computer | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | HPCシステム | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
九州大学 | ||||||||
著者所属 | ||||||||
九州大学 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN | ||||||||
著者名 |
松本, 幸
安達, 知也
住元, 真司
曽我, 武史
南里, 豪志
宇野, 篤也
黒川, 原佳
庄司, 文由
横川, 三津夫
× 松本, 幸 安達, 知也 住元, 真司 曽我, 武史 南里, 豪志 宇野, 篤也 黒川, 原佳 庄司, 文由 横川, 三津夫
|
|||||||
著者名(英) |
Yuki, Matsumoto
Tomoya, Adachi
Shinji, Sumimoto
Takeshi, Soga
Takeshi, Nanri
Atsuya, Uno
Motoyoshi, Kurokawa
Fumiyoshi, Shoji
Mitsuo, Yokokawa
× Yuki, Matsumoto Tomoya, Adachi Shinji, Sumimoto Takeshi, Soga Takeshi, Nanri Atsuya, Uno Motoyoshi, Kurokawa Fumiyoshi, Shoji Mitsuo, Yokokawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,82,944台の計算ノードをTofuインターコネクトと呼ばれる6次元の直接網で結合した「京」におけるMPI集団通信の高速化について述べる.従来のMPIライブラリには,トポロジを考慮したアルゴリズムが存在しないため,「京」のような直接網において性能を出すことができない.そのため,Trinaryx3と呼ばれるAllreduceを設計し,「京」向けのMPIライブラリに実装した.Trinaryx3アルゴリズムは,トーラス向けに最適化されており,「京」の特長のひとつである複数RDMAエンジンを活用することができる.実装を評価した結果,既存のトポロジを考慮していないアルゴリズムと比較して,5倍のバンド幅の向上を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper reports a method of speeding up MPI collective communication on the K computer, which consists of 82,944 computing nodes connected by a 6D direct network, named Tofu interconnect. Existing MPI libraries, however, do not have topology-aware algorithms which perform well on such a direct network. Thus, an Allreduce collective algorithm, named Trinaryx3, is designed and implemented in the MPI library for the K computer. The algorithm is optimized for a torus network and enables utilizing multiple RDMA engines, one of the strengths of the K computer. The evaluation results show the new implementation achieves five times higher bandwidth than existing one. | |||||||
書誌情報 |
先進的計算基盤システムシンポジウム論文集 巻 2012, p. 245-253, 発行日 2012-05-09 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |