微服务SpringCloud之zipkin链路追踪

时间 2019-11-06

标签微服 springcloud zipkin 链路追踪繁體版

原文原文链接

随着业务发展，系统拆分致使系统调用链路愈发复杂一个前端请求可能最终须要调用不少次后端服务才能完成，当整个请求变慢或不可用时，咱们是没法得知该请求是由某个或某些后端服务引发的，这时就须要解决如何快读定位服务故障点，以对症下药。因而就有了分布式系统调用跟踪的诞生。html

Spring Cloud Sleuth前端

通常的，一个分布式服务跟踪系统，主要有三部分：数据收集、数据存储和数据展现。根据系统大小不一样，每一部分的结构又有必定变化。譬如，对于大规模分布式系统，数据存储可分为实时数据和全量数据两部分，实时数据用于故障排查（troubleshooting），全量数据用于系统优化；数据收集除了支持平台无关和开发语言无关系统的数据收集，还包括异步数据收集（须要跟踪队列中的消息，保证调用的连贯性），以及确保更小的侵入性；数据展现又涉及到数据挖掘和分析。虽然每一部分均可能变得很复杂，但基本原理都相似。java

服务追踪的追踪单元是从客户发起请求（request）抵达被追踪系统的边界开始，到被追踪系统向客户返回响应（response）为止的过程，称为一个“trace”。每一个 trace 中会调用若干个服务，为了记录调用了哪些服务，以及每次调用的消耗时间等信息，在每次调用服务时，埋入一个调用记录，称为一个“span”。这样，若干个有序的 span 就组成了一个 trace。在系统向外界提供服务的过程当中，会不断地有请求和响应发生，也就会不断生成 trace，把这些带有span 的 trace 记录下来，就能够描绘出一幅系统的服务拓扑图。附带上 span 中的响应时间，以及请求成功与否等信息，就能够在发生问题的时候，找到异常的服务；根据历史数据，还能够从系统总体层面分析出哪里性能差，定位性能优化的目标。mysql

Spring Cloud Sleuth为服务之间调用提供链路追踪。经过Sleuth能够很清楚的了解到一个服务请求通过了哪些服务，每一个服务处理花费了多长。从而让咱们能够很方便的理清各微服务间的调用关系。此外Sleuth能够帮助咱们：react

耗时分析: 经过Sleuth能够很方便的了解到每一个采样请求的耗时，从而分析出哪些服务调用比较耗时;
可视化错误: 对于程序未捕捉的异常，能够经过集成Zipkin服务界面上看到;
链路优化: 对于调用比较频繁的服务，能够针对这些服务实施一些优化措施。
spring cloud sleuth能够结合zipkin，将信息发送到zipkin，利用zipkin的存储来存储信息，利用zipkin ui来展现数据。git

测试github

1.启动zipkin server算法

因为是参考纯洁的微笑的博客http://www.ityouknow.com/springcloud/2018/02/02/spring-cloud-sleuth-zipkin.html，但在我建立zipkin-server项目引入注解@EnableZipkinServer时提示已不能使用。建议使用默认的zipkin的jar包，具体使用方法能够查看github的文档。这里直接下载下了jar，而后使用内存方式存储，java -jar zipkin-server-2.17.0-exec.jar.spring

/**
 * @deprecated Custom servers are possible, but not supported by the community. Please use our
 * <a href="https://github.com/openzipkin/zipkin#quick-start">default server build</a> first. If you
 * find something missing, please <a href="https://gitter.im/openzipkin/zipkin">gitter</a> us about
 * it before making a custom server.
 *
 * <p>If you decide to make a custom server, you accept responsibility for troubleshooting your
 * build or configuration problems, even if such problems are a reaction to a change made by the
 * OpenZipkin maintainers. In other words, custom servers are possible, but not supported.
 */

2.项目中添加zipkin的支持sql

在SpringColudZuulSimple、EurekaClient中引入依赖spring-cloud-starter-zipkin。

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-zipkin</artifactId>
    <version>2.1.3.RELEASE</version>
</dependency>

而后在application.properties中设置属性

spring.zipkin.base-url=http://localhost:9411
spring.sleuth.sampler.probability=1.0

spring.zipkin.base-url指定了Zipkin服务器的地址，spring.sleuth.sampler.percentage将采样比例设置为1.0，也就是所有都须要。
Spring Cloud Sleuth有一个Sampler策略，能够经过这个实现类来控制采样算法。采样器不会阻碍span相关id的产生，可是会对导出以及附加事件标签的相关操做形成影响。 Sleuth默认采样算法的实现是Reservoir sampling，具体的实现类是PercentageBasedSampler，默认的采样比例为: 0.1(即10%)。不过咱们能够经过spring.sleuth.sampler.percentage来设置，所设置的值介于0.0到1.0之间，1.0则表示所有采集。

3.验证

依次启动EurekaServer、EurekaClient、SpringColudZuulSimple，而后在浏览器中输入http://localhost:8890/spring-cloud-producer/hello?name=cuiyw&token=123，刷新几回，而后在http://localhost:9411页面点击查询，能够看到以下信息。

点击每项记录都能看到每项的具体耗时信息和顺序。

点击依赖分析，能够看到项目之间的调用关系

总结

这里使用的内存的方式来存储数据，生产环境通常会使用消息队列RabbitMQ、Kafka或者数据库mysql存储，具体使用方法能够查看zipkin的官方文档。

参考:http://www.ityouknow.com/springcloud/2018/02/02/spring-cloud-sleuth-zipkin.html