Amazing Arch运维监控微服务

zipkin,pinpoint和skywalking对比

2018-10-31  本文已影响44人  superlee01

APM(Application Performance Management)理论模型

Dapper,大规模分布式系统的跟踪系统

zipkin

简介

Zipkin是一种分布式跟踪系统。它有助于收集解决微服务架构中的延迟问题所需的时序数据。它管理这些数据的收集和查找。Zipkin的设计基于Google Dapper论文。

zipkin架构

使用和配置

zipkin-collector项目zipkin-ui项目
Spring Cloud Sleuth是spring推出的分布式链路追踪工具,借鉴了 Dapper, ZipkinHTrace.可以和spring-cloud项目完美契合。下面是zipkin-collector的pom依赖

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <artifactId>zipkin-collector</artifactId>

    <name>zipkin-collector</name>

    <parent>
        <groupId>io.choerodon</groupId>
        <artifactId>choerodon-framework-parent</artifactId>
        <version>0.8.0.RELEASE</version>
    </parent>
    <properties>
        <choerodon.starters.version>0.6.3.RELEASE</choerodon.starters.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-eureka</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-zipkin</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-zipkin-stream</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-stream-kafka</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-stream-binder-kafka</artifactId>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-aop</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.retry</groupId>
            <artifactId>spring-retry</artifactId>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin</artifactId>
            <version>1.31.3</version>
        </dependency>
        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-storage-elasticsearch-http</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>

        <dependency>
            <groupId>io.choerodon</groupId>
            <artifactId>choerodon-starter-hitoa</artifactId>
            <version>${choerodon.starters.version}</version>
        </dependency>
    </dependencies>

    <build>
        <finalName>app</finalName>
    </build>
</project>

zipkin的通信方式支持http和message queue(kafka,rabbitMQ),但是http通信方式影响到主程序,所以这里采用kafka异步消息的方式通信。


image.png

使用elasticsearch存储客户端发送来的数据
接下来是配置zipkin-ui服务,pom依赖和配置如下

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <artifactId>zipkin-ui</artifactId>

    <parent>
        <groupId>io.choerodon</groupId>
        <artifactId>choerodon-framework-parent</artifactId>
        <version>0.7.0.RELEASE</version>
    </parent>

    <properties>
        <choerodon.starters.version>0.5.4.RELEASE</choerodon.starters.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-ui</artifactId>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-server</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>io.zipkin.java</groupId>
            <artifactId>zipkin-autoconfigure-storage-elasticsearch-http</artifactId>
            <version>1.31.3</version>
        </dependency>

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>io.choerodon</groupId>
            <artifactId>choerodon-starter-hitoa</artifactId>
            <version>${choerodon.starters.version}</version>
        </dependency>
    </dependencies>

    <build>
        <finalName>app</finalName>
    </build>

</project>
bootstrap.yml配置

客户端服务需要加入如下依赖

        <dependency><!--如果服务需要zipkin监控功能则需要此依赖-->
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-sleuth-stream</artifactId>
        </dependency>

然后客户端作如下配置,配置kafka以及采样率


客户端配置

启动服务后发请求,访问zipkin-ui(http:localhost:9030)的服务端口即可查看可视化调用链了


zipkin调用链

pinpoint

简介

Pinpoint是一个APM(应用程序性能管理)工具,适用于用Java / PHP编写的大型分布式系统。有如下特性:

pointpoint概述与技术细节以及中文翻译
中文翻译图片丢失,但在英文文档里面可以找到对应图片

本地搭建

本地使用docker部署pinpoint-docker,版本为1.8.0
执行如下命令一键搭建,镜像比较大

git clone https://github.com/naver/pinpoint-docker.git
cd pinpoint-docker
docker-compose pull && docker-compose up -d

docker-compose会启动如下服务

pinpoint架构

配置应用代理

下载release-1.8.0的pinpoint-agent包并解压
在JVM启动脚本增加下列三行代码

-javaagent:$AGENT_PATH/pinpoint-bootstrap-$VERSION.jar #绝对路径
-Dpinpoint.agentId=test #必须在pinpoinit安装的全部服务器集群中全局唯一. 最简单的让它保持唯一的方法是使用hostname($HOSTNAME),因为hostname一般不会重复. 如果需要在服务器集群中运行多个JVM,请在hostname前面增加一个前缀来避免重复
-Dpinpoint.applicationName=api-gateway#服务名称,在ui界面显示
pinpoint代理原理图

代理会在应用程序启动前,用字节码增强技术注入Interceptor,然后代理使用UDP/TCP+Thrift发送数据到collector,collector负责持久化和处理数据,然后web ui从HBase中拿到数据进行展示

采样率

在pinpoint-agent-1.8.0/pinpoint.config配置采样率

#采样率为数字的倒数,1即1/1=100%,2表示1/2=50%
profiler.sampling.rate=1

使用

ui界面访问http://localhost:8079
pinpoint的功能还是很强大的,可以监控Jvm内存使用情况,Jvm永久带使用占用空间,Cpu使用情况,每秒处理的消息数(S标识操作系统,U标识此应用),Jvm线程情况,单请求平均响应时间等,颗粒度很细,缺点是环境搭建比较繁琐,高并发情况下,代理对吞吐量的影响比skywalking和zipkin都大,后续会介绍性能的对比

调用链明细 应用检查器 主界面

skywalking

简介

SkyWalking是一个开源的APM系统,包括监控,跟踪,诊断Cloud Native架构中分布式系统的功能。
核心功能如下。

SkyWalking支持从多个来源和多种格式收集遥测(痕迹和指标)数据,包括
1.SkyWalking格式的Java,.NET Core和NodeJS自动仪器代理
2.Istio遥测格式
3.Zipkin v1 / v2格式

skywalking架构

5.x版本文档

部署

配置agent

1.拷贝agent目录到所需位置. 日志,插件和配置都包含在包中,请不要改变目录结构.
2.增加JVM启动参数, -javaagent:/path/to/skywalking-agent/skywalking-agent.jar. 参数值为skywalking-agent.jar的绝对路径。
3.支持插件,插件全部放置在 /plugins 目录中.新的插件,也只需要在启动阶段,放在目录中,就自动生效,删除则失效.
4.可以在/agent/config/agent.conf 配置每个应用的agent.application_code,也可以通过vm参数来覆盖代理配置-javaagent:/path/to/skywalking-agent/skywalking-agent.jar -Dskywalking.agent.application_code=gateway-helper

配置成功后,ui界面访问:http://localhost:8080,使用admin/admin登陆

集群部署

https://github.com/apache/incubator-skywalking/blob/5.x/docs/cn/Deploy-backend-in-cluster-mode-CN.md

性能

探针性能

UI界面

dashboard 应用拓扑图 VM指标 服务指标
调用链

采样率

在/agent/config/agent.config文件里配置,skywalking默认的采样率是100%

# 每3秒取样的次数,负数的含义是尽可能多的取样,即100%取样
agent.sample_n_per_3_secs=-1

zipkin,pinpoint和skywalking的比较

性能(摘自https://juejin.im/post/5a7a9e0af265da4e914b46f1

选用了一个常见的基于Spring的应用程序,他包含Spring Boot, Spring MVC,redis客户端,mysql。 监控这个应用程序,每个trace,探针会抓取5个span(1 Tomcat, 1 SpringMVC, 2 Jedis, 1 Mysql)。这边基本和 skywalkingtest 的测试应用差不多。

模拟了三种并发用户:500,750,1000。使用jmeter测试,每个线程发送30个请求,设置思考时间为10ms。使用的采样率为1,即100%,这边与生产可能有差别。pinpoint默认的采样率为20,即50%,通过设置agent的配置文件改为100%。zipkin默认也是1。组合起来,一共有12种。下面看下汇总表:


性能对比图

从上表可以看出,在三种链路监控组件中,skywalking的探针对吞吐量的影响最小,zipkin的吞吐量居中。pinpoint的探针对吞吐量的影响较为明显,在500并发用户时,测试服务的吞吐量从1385降低到774,影响很大。然后再看下CPU和memory的影响,在内部服务器进行的压测,对CPU和memory的影响都差不多在10%之内。

collector的可扩展性、 全面的调用链路数据分析、对于开发透明,容易开关等

参阅这篇文章

上一篇 下一篇

猜你喜欢

热点阅读