google大规模分布式系统的监控系统Dapper常用工具 - 新闻中心 - 福州哈唐网络-福建IDC企业!专注云主机及服务器租用托管13年!

新闻中心

首页 > 新闻中心 > 行业新闻 >

google大规模分布式系统的监控系统Dapper常用工具

时间:2016-12-07 10:35:05   阅读:

1. Dapper存储API
 
  Dapper的“存储API”简称为DAPI,提供了对分散在区域Dapper存储库(DEPOTS) 的监控记录的直接访问。一般来说,有以下三种方式可以对这些记录进行访问。
 
  (1)通过监控id访问(Access by Trace id):利用全局唯一的监控id直接访问所需的监控数据。
 
  (2)块访问(Bulk Access): DAPI可以借助MapReduce来提供对数以十亿计的Dapper监控数据的并行访问。用户覆写一个将Dapper监控作为其唯一参数的虚函数(virtua Function),在每次获取用户定义的时间窗口内的监控数据时架构都将引用该函数。
  
  (3)索引访问(Indexed Access):Dapper存储库支持单索引(Single Index),因为监控id的分配是伪随机的,这是快速访问同特定服务或主机相关监控的最好方式。
 
  根据不完全的统计,目前大约有三个基于DAPI的持久应用程序,八个额外的基于DAPI的按需分析工具及大约15~20个使用DAPI框架构建的一次性分析工具。
 
2. Dapper用户界面
 
  大部分的用户在使用Dapper时都是通过基于web的交互式用户界面,图2-34~图2-38显示其一般性的使用流程。
 
  (1)首先用户需要选择监控对象,包括监控的起止时间、区分监控模式的信息(图2-34中是区间名)及一个衡量开销的标准(图2-34中是服务延迟)。
 
\
 
  (2)如图2-35所示,一个大的性能表给出了所有同指定监控对象有关的分布式执行模式的简要情况。用户可以按其意愿对这些执行模式进行排序并选择某一个査看更多的细节。
 
\
 
  (3)图2-36是某个选中的分布式执行模式,该执行模式以图形化描述呈现给用户。
 
\
 
  (4)根据最初选择的开销度量标准,Dapper会以频度直方图的形式将步骤(3)中选中的执行模式的开销分布展示出来,如图2-37所示,同时呈现给用户的还有一系列特殊的监控样例信息,这些信息落在直方图的不同部分。用户可以进一步的选择这些监控样例。
 
\
 
  (5)在用户选择了某个监控样例后,就会进入所谓的监控审査视图(Trace Inspection View)。图2-38是部分的监控审查视图,在这个视图中,最顶端是一条全局的时间线 (Global Time Line)。每一行是一个监控树,选择“+”或能够展开或折叠监控树。 每个监控树用嵌套的彩色长方形表示的。每个RPC区间又被进一步的分成花在服务器处理上的时间和花在网络通信上的时间。用户注释并未在图中显示出来,但是它们可以按照逐个区间被选择包含在全局时间线上。
 
\
 
  根据统计,一个普通的工作日内大概有200个不同的Google工程师在使用Dapper用户界面。因此,在一周的时间里,大约有750~1000个不同的用户。


闽公网安备 35010002000114号