性能度量指标及数据平台

性能和稳定性系统化提升方案

高可用平台的定义及指标,自动化测试框架和性能稳定性数据平台

高可用的定义及度量指标

移动端高可用定义

移动端高可用旨在通过设计关键的度量指标,以期望能够客观反映和量化用户再使用过程中的真是感受,同时通过指标,建⽴一系列的工具和平台,从线下到线上快速发现、分析、定位和解决包括稳定性、性能、功能等各类问题,以进一步提升用户体验的系统化解决方案。

可高勇度量指标

高可用度量指标由 性能稳定性 两大度量指标组成。性能度量指标有七个维度,分别是卡顿率、启动时长、页面秒开率、帧率、ANR率、流量、耗电;稳定性度量指标主要是Crash率,分为Java Crash率和Native Crash率。

tips-solution-1-201935105618

自动化测试框架及性能稳定性数据平台

自动化测试框架
性能稳定性数据平台

性能稳定性数据平台,由四个模块组成,用来展示各个维度的监控数据。 tips-solution-1-201935111941

1.崩溃分析

主要是Java Crash和Native Crash分析,Java Crash包含了Crash当时调用栈,当前页面、用户历史访问页面、当前内存水位以及logcat信息,帮助开发同学快速分析Java崩溃的原因,从而快速解决问题。Native崩溃主要包含了崩溃的信号量、崩溃使用的调用栈、其他线程的调度栈、logcat信息以及已加载的so信息,通过这些信息,可以让开发同学快速地发现Native崩溃原因。

2.异常分析

各个性能维度的指标会在这里展示,主线程卡顿主要是哪条消息超过了阈值,它的调用栈是什么样子的。ANR展示的主要是/data/anr下的文件信息,发生ANR的现场是什么样子的。主线程IO这块展示的是主线程操作IO的一些调用栈以及它的耗时。内存泄露这块分两部分,Java泄露组件的名称,Native泄露的so名称,通过这两部分可以快速地定位内存泄露的原因。资源泄露这块主要展示开发同学调用资源open时的调用栈信息。

3.性能APM

启动性能监控了用户点击图标到真正进入页面可视可交互的时间。页面性能是从点击页面图表到下一个页面真正可视可交互的时间。系统监控启动所有阶段子任务的耗时,通过数据变化决策版本的发布是否符合质量标准。如果符合质量标准,可以发布;如果不符合,再进一步分析子任务耗时,具体是哪些任务导致不能正常发布。快速地定位分析,最终解决问题。手淘把数据能力开放给各个业务,通过他们个性化的需求自定义配置性能报表。

4.远程工具

远程工具主要是针对特殊用户的特殊案例。当线上用户向舆情平台反馈设备存在某一个性能问题时,通过这个工具,快速地从用户那里获取远程日志、Dump内存和每个方法的耗时,快速分析原因,从而给出解决方案。

坚持原创技术分享,您的支持将鼓励我继续创作!