听云亮相阿里云云栖大会：如何做好云端应用性能监控与管理

8月4日，由阿里云在武汉光谷希尔顿酒店举办的云栖大会圆满落幕，阿里云总裁胡晓明，资深总监刘松等五十余位云计算领域中的先锋、以及听云等合作伙伴齐聚一堂进行了多领域行业的技术分享，共同交流“互联网＋”时代的无限可能。听云作为阿里云合作伙伴出席了本次大会，听云研发总监杨金全先生为在场上千名参会者带来《如何做好云端应用性能监控与管理》的技术分享。

云时代的到来，服务器从机房托管迁移到了云端，产品的可用性，价值性，可获得性，以及满意度都影响着用户的体验。在这个用户为王的时代，性能问题是影响用户体验的重要因素之一，其中客户端渲染能力例如页面内容加载，样式、图片加载等，以及网络传输、服务端性能问题都是影响用户体验的重要指标。

在这种状况下，业务级运维应运而生，它是端到端以真实用户体验为基准的从上到下的运维体系。而业务级运维面临着最主要的两个挑战：

业务中断

业务中经常会出现的异常、崩溃的现象反映在代码里面就是错误，听云Server通过对错误的采集，场景复现，来提供错误管理的堆栈，从而当一个用户发生错误的时候，听云Server会及时发出警报，来更快的解决问题，通过散点看到哪一个用户出现了问题，当时的用户场景，取决的参数，以及当前的堆栈具体是什么样子的。

性能缓慢

当数据库执行时间过长，通过分析来看很有可能是其中一个表的操作有问题，听云Server通过对表的查询追踪，可以看到具体的SQL语句，执行计划并且具体定位哪一行代码出现了问题。同样，应用代码执行缓慢，听云Server通过追踪也可以定位到是哪一行代码的问题。

异构的环境下，在大型服务的背后一定是众多微服务来为应用做支撑，这时应用与应用的调用关系就会变的非常复杂，那么听云Server如何实现端到端的监控呢？首先是应用多级拓扑，应用调用了哪些组件，组件表现怎么样，应用与应用之间的关系和响应是什么样的，通过自动识别在拓扑级上可以展现每一个应用之间的响应。具体到当某个用户投诉反映慢，通过还原当时用户情景原因是一次访问调用另外一个服务时出现了瓶颈，听云Server可以告诉我们代码耗费在了哪些方面，是Redis响应慢，还是MongoDB或者是数据库的问题，通过对性能瓶颈的钻取，就可以展现出另一个服务的代码消耗。

作为阿里云的合作伙伴，听云同样对阿里云的一些开源项目也做了支持，如Dubbo的服务，在国内RPC服务领域用Dubbo的比较多，听云对服务提供方(Provider)和服务消费方（Consumer）两个角色进行一系列的监控，通过听云Server的平台可以看到Provider和Consumer的表现情况。

云时代的到来，听云可以将运维可视化价值无限放大，将真实用户的体验来作为产品优化的依据。作为阿里云“云合计划”的合作伙伴，听云旨在构建云端应用性能监控和管理、提升用户体验，与阿里云一道共建云端生态。

想阅读更多技术文章，请访问听云技术博客，访问听云官方网站感受更多应用性能优化魔力。