咱们都知道,当今的时代是一个新技术蓬勃发展的时代;大数据、云计算、移动互联网、物联网……做为应用服务开发者的咱们,有了不少很好的选择;咱们的传统的应用基础架构也开始向云端迁移;咱们看一下,如今企业应用IT架构是什么样?前端
很典型,从用户一直到硬件,很立体的六个层面,从用户到CDN,到防御墙,防御墙内有一堆的服务器,跑的是你的代码,还有一堆的硬盘作数据存储,这是我们传统企业的应用架构。到了云的时代,由于我要讲的是云时代的APM,架构就变成这样了,后端防火墙的一些东西都隐化了,到了云时代背后的通常都变成一种资源,包括网络,可能不少人也不必定知道,网络怎么把它变成一种资源,有一种技术叫SDN,把全部东西变成资源之后在云上咱们看到的状况会很不同。到了云的时代,不少东西都在云上,为何会发生这样的变化呢?后端
既然是一种技术趋势上升带来的变化,确定是有不少的好处;就拿青云的服务为例,给咱们技术部门有哪些帮助呢?安全
秒级调度 全部计算、存储、网络资源都是秒级响应。若是初始资源不够用,能够弹性扩展伸缩。不须要的资源能够随时销毁。随需应变,无需等待。服务器
按秒计费,最大限度下降总拥有成本 由于青云的资源可在秒级建立和销毁,为了鼓励你们按需使用资源,咱们在计费上只根据您实际使用的时长收费,并精确到秒。让您能够随时调整业务规模,无需考虑计费周期的限制。微信
私有云,搭建属于本身的私有云环境 经过 SDN 实现的虚拟路由器和交换机,您能够快速搭建属于本身的私有云环境,并提供 100% 的网络隔离,确保安全。还能与现有的计算环境经过安全隧道链接,造成公私兼顾的混合云(hybrid cloud)。网络
最大程度保障您的数据安全 私有网络提供100%二层隔离,在这个环境里,你的内部数据是很是安全的,黑客没法嗅探或者截获到你的数据。多重实时副本和备份能够保障即便在物理硬件完全损坏时,数据也不会丢失,而且能够很快恢复业务。 都用云了,是否是就不用担忧咱们的业务系统了呢?一切就完美了吗? 咱们的业务必定能向咱们指望的那样,快速,稳健增加吗?架构
咱们能够从另一个角度来思考这个问题;不知道何时开始,咱们都听过“用户体验”这个名称;什么是用户体验呢?运维
百度里是这样解释的:用户使用产品和服务过程当中创建起来的纯主观感觉;性能
那么这种纯主观感觉实际上包含不少的要素;好比说漂亮的视觉设计、贴心专业的服务、快速的用户响应、极致简洁的交互界面等等。大数据
可想而知,上面的这些要素都会影响到用户的纯主观感觉,那其实咱们今天还要分享一个要素,就是性能;固然性能这块,有不少的数据,好比说网络延迟每增长0.4秒,亚马逊每一年将损失16亿美圆,性能每减小0.4秒,雅虎访问量就会增长9%,还有移动App里面很是经典的五秒钟定律;若是你的App应用的响应时间大于5秒钟;那么50%移动应用用户会放弃,30%用户会卸载,33%失望的用户会转向竞争对手的应用。
因此小米的雷军也在说一句比较经典的话:抛开性能谈体验,都是耍流氓。
固然他说这句话时候是在小米手机发布会上针对手机跑分是这样,针对咱们线上的业务系统实际上也彻底适用;咱们不由思考,为何性能这样重要呢?
很简单,性能影响用户体验,用户体验影响的是咱们的业务营收,业务营收就是白花花的金钱;因此这个等式就成立了,即咱们的系统性能就等于金钱!既然和钱有关系,咱们固然要很好的解决掉。
那咱们说了这么的性能,对于性能咱们应该如何理解呢?
实际上云智慧对性能的抽象理解很简单,只有两点:
第一个挑战是业务中断,确实对企业来讲这是最大的挑战,业务中断有再多的用户没用。因此对企业来说,业务是永远不能断的。
第二个挑战是什么?性能缓慢,咱们回想中国GDP增加曲线,从1978年的3650到2014年的636463,保持平均每一年8%的快速增加,经济发展速度是至关的快。中国经济的发展不能慢,为何?慢了挣钱就少了,挣钱少了中国经济就要崩溃陷入中等收入陷阱,咱们也不能慢,慢了说明用户要跑了,钱也就没了,企业也就发展不了,因此天下武功惟快不破。慢表明什么?慢表明性能,性能的好和坏。因此说对于在线提供产品和服务的咱们,性能就表明一切!
那咱们也在思考,性能影响是经过什么表达给咱们;响应时间、吞吐率、延迟、丢包率、慢查询、代码堆栈、崩溃率等等——这是一大堆技术参数,很难理解;而偏偏,咱们的IT系统运行产生的指标都是很数据化的;传统作APM的方法作到了必定层面的数据可视化,可是对解决问题实际的用户体验问题我以为还不够直观,为何?
其实咱们最指望看到的是,用户在作什么的时候怎么样了?每个他在下单的时候是开怀大笑仍是愤怒无边?而这一切,经过用户行为性能分析的层面,咱们是可以作的。
当咱们的身体出现问题时,只有CT才能在几分钟内给患者完成从头到脚的全身扫描,从而准确发现病灶,为后续的治疗提供准确的依据。
今天的互联网就像人体同样强大而复杂,一款看似简单的网络应用,须要服务器、存储、系统、应用环境、网络和用户电脑/手机设备的一系列支持,才能顺畅运行。当应用发生故障时,好比用户没法登陆、页面打不开、搜索没结果,谁来帮助咱们快速而准确的定位应用的问题?
APM就像是部署在互联网上的CT扫描设备,经过SDK采集用户端数据,经过监控点采集网络数据,经过探针采集服务器上各类软硬件环境数据,而后利用大数据技术把采集到的数据进行快速诊断分析,发现影响应用性能的“病灶”,并给出诊断建议。
参考和分析市场上国内外的应用性能管理的解决方案;云智慧独创面向业务的基于用户行为性能的方法;这是基于真实的用户行为角度来分析应用的性能表现;分析的维度包括行为的维度和用户的维度。
行为的维度,是从影响业务的各类行为入手来分析行为背后的影响;好比有一个行为叫“支付”,在一段时间内,有1000人支付,其中有400人由于性能问题受到了影响;他们没有支付成功,那么这400人就给业务形成了很大的影响,平均每一个人100元的支付额,那就是40000元的业务损失;接下来咱们分析400人中有多少人是由于前端的Crash问题,可能有150人,咱们接下来再分析这150人都用什么样的手机,系统,运营商,这样一步步有助于咱们定位问题;也可能有250人是由于后端的服务质量问题形成影响,体如今加载缓慢上,那么咱们能够分析后端的各类服务服的质量。
咱们还原一个需求的场景;有一天忽然有个用户投诉支付缓慢,支付不成功;这个时候咱们技术部门如何快速定位到这个用户的问题,当时的历史快照是什么?目前没有很好的办法;用透视宝的用户分析,咱们能够定位到系统的每一个用户的每次操做的性能问题上;简单的搜索就能够查到当时这个用户操做时发生了什么,包括前端和后端的总体记录均可以定位到;
另外有的时候咱们也关心一类用户的问题,好比说某个区域的联通运营商用户,好比都用了某款国产手机;经过透视宝的用户筛选功能,咱们能够针对特定人群进行问题分析,快速找到这类瓶颈。
真正的端到端应该是从用户端到后端的物理服务器以及代码端的完整穿透;
并且应该是基于细化到每一个用户的每一个真实行为操做层面来看待;
化到每一个操做层面的端到端,让深刻定位问题有了可能;经过标记在每一个行为操做上的Unique ID,透视宝将整个操做背后全部相关环节“拍照”;这样很是有助于咱们真实还原问题细节;
透视宝可以帮助运营人员实时分析业务,明确业务性能问题以快速适应市场变化;帮助开发人员基于问题事件定位架构及代码瓶颈,以实现快速构建及改进持续交付;提供端到端全技术栈监控,帮助运维人员快速定位、预测IT系统问题,确保运维SLA与服务质量;面向管理层,提供多维报告与数据决策支持,帮助企业实现用户满意度及运营效率持续提高、企业营收不断提升。
本文做者:陆兴海(Yak)
2007年硕士毕业于西北工业大学,信息化技术研究方向。工做从事软件产品设计开发多年,现任云智慧产品总监,致力于面向大数据的IT系统监控软件以及应用性能管理(APM)平台的规划、设计与传播。热爱互联网,专一产品设计,喜欢云计算,关注大数据,对一切新鲜事物都抱有好奇心。微信号:yak1982。