Item type |
Symposium(1) |
公開日 |
2020-11-26 |
タイトル |
|
|
タイトル |
TSifter:マイクロサービスにおける性能異常の迅速な診断に向いた時系列データの次元削減手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
TSifter: Dimention Reduction of Time Series Data for Quick Diagnosis of Performance Issues in Microservices |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
学生セッション1 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
さくらインターネット株式会社さくらインターネット研究所/京都大学情報学研究科 |
著者所属 |
|
|
|
さくらインターネット株式会社さくらインターネット研究所 |
著者所属 |
|
|
|
株式会社はてな |
著者所属(英) |
|
|
|
en |
|
|
SAKURA internet Research Center, SAKURA internet Inc. / Graduate School of Infomatics, Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
SAKURA internet Research Center, SAKURA internet Inc. |
著者所属(英) |
|
|
|
en |
|
|
Hatena Co., Ltd. |
著者名 |
坪内, 佑樹
鶴田, 博文
古川, 雅大
|
著者名(英) |
Yuuki, Tsubouchi
Hirofumi, Tsuruta
Masahiro, Furukawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Web サービスのソフトウェア規模は,長年の機能開発により日々増大しており,ソフトウェア開発者によるソフトウェアの変更が難しくなっている.そこで,変更を容易にするために,一枚岩のアプリケーションを分解して分散させるマイクロサービスアーキテクチャが普及している.しかし,マイクロサービス化によりシステムの構成要素数が増大するにつれて,システムの性能を示す時系列データ形式の指標であるメトリックの個数が増大する.そのため,システムの性能に異常が発生したときに,網羅的にメトリックを目視できず,システム管理者がその異常の原因を診断することが難しくなっている.先行手法では,複数の構成要素を横断したメトリック間の因果関係を推定することにより,システム内の異常の伝播経路を推論する.しかし,診断に利用できるメトリックの個数は限定されるため,より原因に近いメトリックが推論結果から除外される可能性がある.本論文では,性能異常の診断に有用なメトリックを網羅的に抽出するために,観測されたすべてのメトリックの次元数を削減する手法である TSifter を提案する.TSifter は,定常性を有するメトリックを除外したのちに,類似の形状をとるメトリックをクラスタリングすることにより,異常の特徴を強く表すメトリックのみを抽出する.本手法により,メトリック数が膨大であっても,その異常の診断に適した有用なメトリックを都度抽出できる.マイクロサービスのテストベッド環境に故障を注入する実験の結果,TSifter は,ベースラインとなる手法に対して,正確性と次元削減率の指標では同等程度の性能を有しながらも,270 倍以上高速に動作することを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The scale of Web services is growing day by day due to the development of functions over the years, making it difficult for software developers to change the software. Therefore, microservices architecture that decomposes and distributes monolithic applications has become widespread to facilitate software changes. However, as the number of system components increases due to the adoption of the microservices architecture, the number of metrics, which are indicators of system performance in time-series format, increases. This makes it difficult for system administrators to diagnose the cause of the anomalies because of the lack of comprehensive visibility of metrics when the system performance issues occur. In the prior methods, the propagation path of anomalies in the system is inferred by discovering causal structure between metrics across multiple components. However, since the number of metrics used for diagnosis is limited, metrics closer to the cause may be excluded from the inference results. In this paper, we propose TSifter, a method to reduce the dimensionality of all observed metrics to extract useful metrics for the diagnosis of performance issues comprehensively. TSifter extracts only metrics that strongly represent the characteristics of anomalies by clustering metrics based on their shape similarity after excluding stationary metrics. With this method, even if the number of metrics is large, useful metrics suitable for diagnosing anomalies can be extracted each time. Experiments injecting failures into a microservices testbed environment confirmed that TSifter performed more than 270 times faster than the baseline method while having comparable performance in terms of accuracy and dimension reduction rate. |
書誌情報 |
インターネットと運用技術シンポジウム論文集
巻 2020,
p. 9-16,
発行日 2020-11-26
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |