Item type |
Trans(1) |
公開日 |
2016-07-14 |
タイトル |
|
|
タイトル |
スーパーコンピュータ「京」上でのエクソーム解析パイプラインの開発 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Development of Exome Analysis Pipeline on the K Computer |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[スーパーコンピュータ] スーパーコンピュータ「京」,エクソーム解析,パイプライン,Genomon-exome,MPI,MPIDP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
東京工業大学大学院情報理工学研究科計算工学専攻/東京工業大学情報生命博士教育院 |
著者所属 |
|
|
|
東京工業大学大学院情報理工学研究科計算工学専攻 |
著者所属 |
|
|
|
東京工業大学情報生命博士教育院 |
著者所属 |
|
|
|
東京工業大学大学院情報理工学研究科計算工学専攻/東京工業大学情報生命博士教育院 |
著者所属 |
|
|
|
東京工業大学大学院情報理工学研究科計算工学専攻/東京工業大学情報生命博士教育院 |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology / Education Academy of Computational Life Sciences, Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Education Academy of Computational Life Sciences, Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology / Education Academy of Computational Life Sciences, Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology / Education Academy of Computational Life Sciences, Tokyo Institute of Technology |
著者名 |
青山, 健人
角田, 将典
松崎, 由理
石田, 貴士
秋山, 泰
|
著者名(英) |
Kento, Aoyama
Masanori, Kakuta
Yuri, Matsuzaki
Takashi, Ishida
Yutaka, Akiyama
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,次世代シーケンサなどに代表される実験技術の向上による爆発的な生物学データの増加に対応するため,スーパーコンピュータを用いた効率的なデータ解析,処理技術の開発は喫緊の課題となっている.ゲノム情報のうちタンパク質に翻訳されるエクソン領域の配列のみを網羅的に解析するエクソーム解析は,ゲノム配列全体を対象とする場合と比べて処理量は大幅に削減されるため効率的な解析が可能となるが,一方で将来の個別化医療に向けた解析では,数百人から千人規模のデータを現実的な時間で処理する必要があり,小型のPCクラスタでは処理が追いつかない大規模な解析が必要である.本研究では,理化学研究所のスーパーコンピュータ「京」上にエクソーム解析パイプラインを開発し,大規模エクソーム解析を目的とした生命情報解析環境を構築した.「京」上で実際に動作するエクソーム解析パイプラインの構築に加え,パイプラインの各処理でMPIによるMaster-Workerモデルでタスク分散処理を行うことで投入ジョブ数を軽減し,さらにタスクの分割などを改良することで,並列性能を改善して処理の高速化を図った. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, development of efficient biological data analysis systems on a supercomputer has been highly required in order to tackle the vast amount of biological data generated by the latest experimental techniques such as a next-generation DNA sequencer. Exome analysis, which analyzes the regions in a genome that will remain in a matured RNA, is useful because it targets only exonic sequences in a genome and enables effective search for important mutations throughout the genome. On the other hand, to meet the demands of current medical researches such as application to personalized genome analysis, we need to deal with the situation in which hundreds to thousand exome sequences are needed to be analyzed in realistic time. It is of significant importance to develop a high-performance large-scale sequence analysis environment. In this study, we developed an exome analysis pipeline on the K computer. We not only developed a pipeline useful for biologists on a supercomputer but also improved the parallel performance of the pipeline using a master-worker model task distribution framework implemented by MPI and efficient task partitioning strategy. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11833852 |
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS)
巻 9,
号 2,
p. 15-33,
発行日 2016-07-14
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7829 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |