多数の仮想GPUを用いた際の計算性能モデルの構築

瀬戸口, 幸寿; セトグチ, ユキトシ; Setoguchi, Yukitoshi

インデックスツリー

RootNode

アイテム

多数の仮想GPUを用いた際の計算性能モデルの構築

https://uec.repo.nii.ac.jp/records/1964

名前 / ファイル	ライセンス	アクション
1431065.pdf (1.6 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2016-03-25

タイトル

多数の仮想GPUを用いた際の計算性能モデルの構築

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_46ec

資源タイプ

thesis

著者

瀬戸口, 幸寿

ja	瀬戸口, 幸寿
ja-Kana	セトグチ, ユキトシ
en	Setoguchi, Yukitoshi

Search repository

抄録

内容記述タイプ

Abstract

内容記述

GPUを科学計算などの汎用的な目的で使用する技術はGPGPU(General-Purpose computing on Graphics Processing Units)として知られている.DS-CUDA(Distributed Shared CUDA)はネットワークを通じたサーバ上のGPUを仮想化するミドルウェアで,クライアント側でソフトを書き換えることなくGPU資源を用いたGPGPUが可能である.ただし，クライアントとサーバー間の通信がボトルネックになり易い.そこで本研究ではMDシミュレーションと行列の乗算を題材に,最大8つのGPUを用いて計算時間の測定を行い,DS-CUDAによる仮想GPUを用いた場合と,物理GPUをPCI Express拡張Boxを用いて直接扱う場合とで,性能モデルを構築し実際の時間と比較した.MDシミュレーションを通じて,DS-CUDAはPCI Express拡張Boxと比較して,GPU内の演算であるkernel関数の発行による通信に多くの時間がかかることがわかった.このことが,計算データ量小,GPU並列数大の条件下(1000粒子,8GPU)では,仮想GPUと物理GPUとの計算時間に高速なネットワーク(Infiniband)で1.5倍,低速なネットワーク(GigabitEthernet)では6倍の差が生じることがわかった.一方でGPU内での計算量が増大するに従って相対的に通信時間が占める割合は小さくなり,計算性能の向上のためにGPU並列数を大きくすることの有効性を示すことができた.行列の乗算においても同様の傾向が得られた一方で,計算データ量に対する通信量が多いことから通信スループットの影響により,GPU並列数を増やすことによる計算性能の向上は通信性能が十分,かつ計算データ量が十分大きい場合に限られることを示した.低速なGigabitEthernetネットワークではGPU並列数を大きくすることによる計算性能の向上を,測定実験の計算データ量領域内(最大8,190次行列,8GPU)で確認することはできず,構築したモデルもその事実を示した.以上の測定実験とモデル構築から,計算データ量が十分大きくGPU並列数が小さい場合は,仮想GPUがパフォーマンスを発揮できることを示した.

学位授与機関

学位授与機関名

電気通信大学

学位授与年度

内容記述タイプ

Other

内容記述

2015

学位授与年月日

2016-03-25

戻る

views

See details

	Views

Versions

Ver.1

2023-05-15 11:30:44.238371

Show All versions

Cite as

瀬戸口, 幸寿, n.d., 多数の仮想GPUを用いた際の計算性能モデルの構築.

エクスポート

OAI-PMH

JPCOAR 2.0
JPCOAR 1.0
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

多数の仮想GPUを用いた際の計算性能モデルの構築

× 瀬戸口, 幸寿

Versions

Share

Cite as

エクスポート