做APM领域德国队,笃信技术和极简体验的听云打造历程

版权声明:此文章转载自CSDN

如需转载请联系听云College团队成员阮小乙,邮箱:ruanqy#tingyun.com

时下,APM领域异常火爆,国内从事APM的企业也越来越多,国外APM领域的主要技术提供者是New Relic、AppDynamics等,但是由于本土化问题以及用户体验差,上手难度大等问题也从一开始限制了这些国外厂商落地中国。今年,很多国内APM厂商纷纷开始发力,其中听云平台由于其绝对领先的技术能力、极简的用户体验吸引了众多重量级厂商的青睐,服务客户包括Google、 IBM、 BAT等超过500家大型企业,同时也是全球领先技术资讯公司Gartner在APM领域国内唯一研究关注的公司。

低调,是采访听云产品负责人给笔者最深的印象,创立于2007年的基调网络,已经在性能大数据与挖掘领域积累了8年的经验,而之前一直没有在市场上进行过推广,但是在国内IT运维领域有着非常领先的实力和深厚良好的口碑,正如他们CEO所说,他们是德国队,成员非常优质,没有国际顶尖耀眼的球星,充分相信技术,细节打造与团队协作。本期的云先锋栏目,我们专访了听云副总裁Moca,以下是采访整理。

12121.jpg

听云副总裁 Moca

CSDN:首先介绍你自己和公司? 公司现在的结构是如何的?

Moca:大家好,我是Moca,负责听云SaaS化的产品搭建与公司市场推广工作。今年7月创立发布了听云这个专注于应用性能监控分析管理,端到端SaaS型产品。从之前只面向大型客户开放使用到全方位开放给中长尾客户。

公司创立于2007年,已经有近8年的时间,一直专注于性能监控领域。虽然一直没有在市场上进行过推广,但在国内IT运维领域有着非常领先、深厚良好的口碑,服务客户包括Google、 IBM、 BAT等超过500家大型企业。也是全球领先技术资讯公司Gartner 在APM领域国内唯一研究关注的公司。公司团队目前有150人左右,70%是研发团队。我们是一支非常有使命感、团结高效务实的团队,激情与梦想更多用代码与产品表达。用我们CEO的话来说,我们是德国队,成员非常优质,没有国际顶尖耀眼的球星,充分相信技术,细节打造与团队协作。

CSDN:目前听云平台的用户规模如何?有无一些重量级的用户?

Moca:听云上线以来快速吸引到广大开发者的青睐,短短3个月,已经有近万名用户。其中包括公司既有的重量级客户,如BAT等国内Alexa排名前100的网站就有81家在使用听云,以及在移动领域着重发力的如美丽说、汉庭、易车、平安、聚美优品也都是我们服务的客户。而随着听云App 2.0 以及听云Server的最新上线,相信在年底之前还会迎来更多需要听云的开发者及大型客户。

CSDN:目前国内外市场做APM这一块的公司很多,而且也是基于SaaS平台,你的优势在哪?都有哪些产品?

Moca:听云的优势我就说两点吧:第一说技术领先性;第二说极简体验。

从技术领先性来看,听云拥有国内绝对领先的技术能力。

听云App中,我们实现了对App内慢交互的追踪,我们自主研发的监测引擎会为用户保留详细的慢交互追踪数据。包括本次慢交互产生的具体页面,在其过程中CPU、内存的变化,以及详细的前后台线程中方法的调用堆栈和网络的访问情况,这是任何国内相同领域的产品所做不到的。难点在于如何在不增加SDK大小的前提下溯源到具体页面交互性能的分析。另外,对于App内性能监控来说,嵌入式SDK是必不可少的,而如何实现小体积大能力也是一项技术难点。听云App的SDK只有几十K,同比国内外同类公司也是绝对领先的,我们比国际上知名的某家做APM的公司在这方面做的还要好,iOS的SDK同比是其二分之一的大小。其实上面说的这两点技术优势也是针对Native App性能监控所必不可少的,否则会无法具体定位问题,也会影响本身App的用户体验。其实是希望广大开发者在使用同类型产品时也需要着重关注这两点。

听云Server的技术优势也十分明显,我们在国内优先支持了PHP。PHP语言一般是在移动应用的Server端和网站中使用较多的,这也说明听云在互联网方面的技术积累十分的雄厚。另一大技术亮点就是听云Server可以对问题进行代码级定位。我们可以了解到用户访问应用满意度低是因为代码执行慢,或是SQL语句查询时间长,还是因为数据库结构不合理。代码行级的定位是十分有技术难度的,国内除了听云还没有看到其他公司有同样的能力上线。

而对于网络监控的长期经验更是在这方面让我们听云Network的技术更加垂直和深入,主要在于服务的数据质量以及支持网络性能监控的多维指标层面。监测性能指标要比同类产品多20%-30%。这里特别重点说一下首屏时间这个指标,其实是我们率先提出并推广的,并被工信部采纳认可,作为其长期评判网民访问质量的一个重要参考项。其实现在大多数技术人员也深度认可该指标,但不知道是听云提出的。听云Network在某些层面来说是业界的技术标准。再来说数据质量,我们自主研发的数据点监控与健康优化体系能够最高程度地保障数据的干扰排除,以及最终数据结果的客观性,这对于客户来说至关重要。很多同类型公司也可以实现相同的功能,但往往数据的客观性会存在很大偏差,只可供参考,有时甚至会给出错误判断,从而造成客户损失。

第二再来说极简体验。传统APM产品国内也好国外也好,都是多维度报表供用户查询的模式,这就要求使用者对技术了解十分深入与专业,并且需要花很长时间熟悉产品以及定义自己关注的报表,发现问题后还要在自己去做分析(比如NewRelic)。听云创新性的提出了综合诊断器这个概念,让听云的用户可以不用看报表,先得到性能综合诊断评分,并给出具体问题,方便用户再具体追踪。这里的优势在于,我们对性能的各项指标通过长期大数据的分析与挖掘进行了具体指标定义,不用再需要用户自己去定义,也更加的简单易懂,我们一直希望把技术型SaaS产品做成让不同程度的用户都可以使用的产品。而这背后的优势也是我们8年专注于对性能大数据长期积累与挖掘的经验,是不可复制的。

 2345.jpg 

以上图为听云即将在11月发布的听云Index

听云产品目前拥有听云App、听云Server及听云Network三条重要产品线。从移动客户端到服务器端再到网络层面,全方位帮助客户实时监控定位从崩溃、报错、代码效率质量低下、交互过慢、第三方API调用失败、到网络环境出错等多维度复杂的性能问题(据我们观测与计算应用性能问题组合总量超过1亿零700万种)。

一款应用出现性能问题导致延时响应10秒后,有近5%的用户会放弃使用。对于电商类型的业务来说就是日成交量的下降,对于游戏来说就是用户ARPU的直接损失,而对于其他企业级或CRM类型应用来说,也意味着服务的中断、用户满意度的丢失。我想,不管是手机端还是服务器端,每款应用都需要听云来给你提供一套完善的听诊机制,不要让以上这种情况在未有充分准备的情况下发生。

听云分为免费、专业以及企业版本,为不同需求的企业提供贴心配套服务。对于一家创业小微开发移动App的企业来说,前期团队小、技术积累且资金有限,App要靠创意与速度拼杀进入市场,实现梦想,那么就可以用听云免费版本就可以充分满足他们在App上线后第一时间定位解决性能问题的需求,不用他们再耗费成本雇佣专门的工程师排查问题,也不需要为了一个问题排查1-2周错过发展最佳时机。对于已经有一定用户规模,且需要更加深度专业性能管理服务的企业,则使用专业版就好了,用合适的价格获得超值的体验,而企业版则会提供更加灵活定制化贴身24小时管家式服务,切实满足复杂性能管理。

CSDN:针对App的性能监测,目前最新的产品及功能是什么?

Moca:我们最新上线了针对移动Native App的听云App 2.0版本。听云App2.0除了对原有的崩溃、错误、网络情况、第三方调用API等进行多种维度的监控以外,还主要增加了对App交互性能的监测。App交互性能监测通过SDK引擎来监测最终用户与App进行人机交互时各App视图(俗称页面)的时间消耗,由此来帮助App开发人员了解App在与最终用户交互时的代码执行效率,为App代码优化和用户体验的改善提供非常有价值的参考数据。

另外,还会从交互角度给开发者提供很多有价值的信息,如热门视图Top5、视图访问次数、执行时间、总耗时等等。可以说对于一款Native App来说,1.0能解决70%的App性能问题,2.0可以解决90%以上的App性能问题,而同比国内其他少数几家做此类服务的公司,还没有任何一家可以超越我们听云App1.0的能力,很多还只停留在简单层次崩溃问题的监控。

CSDN:目前客户最关心的问题有哪些,你们有哪些应对之策?你认为这对客户最大的价值是什么?

Moca:对于客户来说,使用性能管理类的服务会比较关心其隐私与数据安全保护。

我们从技术手段上会默认最终用户参数加密隐藏,数据传输也会进行加密,充分保护客户业务隐私。我们目前已经获得绿盟的安全评估认可。

从听云服务角度看,对于一个企业来说,不同角色的人所关心的问题有所不同。业务负责人比较关注性能对业务业绩直接产生的影响,如用户流失、用户活跃、用户满意度、最终交易的损失等。比如对于社交、提供信息服务类的应用来说,应用本身的慢交互行为会直接影响活跃与用户留存;而对于电商与O2O的应用来说,其实他们更关注关键业务的实际性能问题,如支付问题,由于网络问题、资源加载、接口调用所带来的支付失败可能会导致总成单失败率达5%。

如果是企业版客户,我们会分不同行业结合客户的业务有针对性地与客户一起确定性能关联业务指标,并进行24小时监控,定期帮助客户在性能方面的进行分析,指出关键问题,提出优化建议。后续我们也会考虑按照行业属性定向在产品上进行性能指标定义。

使用听云对于客户来说通常有两方面最为显著的价值,其一是能够无需用户反馈:第一时间发现性能问题,直接通过不断对其应用进行性能问题的发现与快速优化提升关键业务指标,如日活、月活、ARPU、GUV等。另一方面就是听云能够大大提升客户的研发迭代效率、降低产品优化成本。对于初创企业与中小团队很难有人力、财力来进行专门的运维监控。在有限的能力下,又能加快产品迭代,这是听云能够为开发者做的,而对于成熟企业,公司内部流程部门复杂,通常定位及解决一个性能问题要多部门联动,就算流程再通畅也是一个较长的周期。而听云可以做到秒级发现问题并报警,1分钟定位问题所在,对于成熟企业来说也是非常可贵。

我们拿使用听云Server产品如何改变定位一个SQL性能问题的流程来举例,从传统的9步流程直接简化至5步。

3456.jpg

CSDN:目前国外的APM领域的发展情况如何,你觉得未来APM会向哪个方向发展?

Moca:目前国外APM领域的主要技术提供者是New Relic、AppDynamics以及Compuware。New Relic面向开发者提供应用性能管理服务,而AppDynamics则是面向传统企业进行定制化服务。对于国内用户来说,还很难接触到这些服务,一是国外产品本土化十分不足,产品设计第一对于中国开发者来说不够友好、体验偏复杂、上手比较难;第二,对于中国互联网与移动互联网发展进程并不够了解,可用性有限、落地较难。

对于性能的实时数据的解读,听云作为在过去10年里最成功的本土化第三方性能监控平台,见证了中国互联网与移动互联网的发展变换,更懂中国互联网,对于性能数据的解读与分析也更加符合中国的实际情况(比如复杂的运营商网络,2G/3G/4G更替、3线4线小城市地域等复杂情况)。第三是速度问题,实时的性能数据对于第一时间发现定位问题至关重要,时间对于开发者与企业来说就是财富,国外的APM企业在这点上无法满足国内客户需求。关于未来的APM,或许我们可以重新定义它。这个M,国际知名IT咨询公司Gartner解读为Monitoring,即监控。我认为APM未来会大不一样,有几方面:

  1. 从单纯监控到发现与定位一站式解决,我们现在已经在此层面前进了一大步。

  2. 传统APM更多从运维角度来看这个问题,更多的是一些基础性能问题,不知哪些需要更深入哪些可以保持现状。未来我认为会向业务驱动的角度来发展。根据不同企业的业务,对性能的管理维度也需要深挖。

  3. 性能数据其实是大数据,大数据的分析与价值挖掘将起到很重要的作用,进而可以进一步预测将要发生的性能问题。听云提供了8年的性能监控服务,累积了大量有价值的数据,前面提到,在这方面已经有一些实质进展。

CSDN:听云未来有什么规划?

Moca:首先是继续踏实专注做好听云产品,领先并不代表100分,我们还可以做得更好。曾经有人跟我说,对于技术型产品,使用的都是开发人员,体验可以比用户产品差点没关系。我反而不这么认为,我真的希望做出更好的产品功能体验与界面给开发人员使用,让他们在使用我们产品的时候除了满足其需求外,也能有那么点愉悦感。

另外说点鸡血的,我们希望在几年内耀升国际舞台,成为世界公认一流的应用性能研究管理平台,这也需要更多优秀人才的加入,欢迎大家加入我们。

想阅读更多技术文章,请访问听云技术博客,访问听云官方网站感受更多应用性能优化魔力。

关于作者

小孟德

职业写手的前途真的断了,千万不要轻易入行。

我要评论

评论请先登录,或注册