高效利用Sentry追踪日志发现问题

时间 2019-11-09

标签高效利用 sentry 追踪日志发现问题繁體版

原文原文链接

面临的问题

程序运行的日志是一个必不可少的东西，多是一些系统信息，好比 gc 的状况；多是一些正常的模块处理信息，好比最近更新的配置；还多是一些在程序运行中，咱们不但愿出现的错误所带来的信息。经过日志，能够知道咱们的程序是否是在正常地运行，看到错误日志，咱们还须要利用日志排查错误。前端

咱们知道日志如此重要，并乐于记录日志，然而在发现并解决问题的过程当中，日志并无想象中的高效率。java

01文件过于分散

通常会将不一样模块的日志以文件的形式分开保存。即便是将日志写在统一的目录下，不论是系统正常运行仍是出现问题的时候均可能须要检查多个日志。redis

02内容过于繁杂

不太同于代码崇尚简洁，特别是遇到问题的时候，日志更是越详细越好，恨不得日志能记录下全部上下文信息和关联的代码。可是在查看日志的时候却每每不得不反复先后翻看错误的关联日志信息，同时还要略过大量无关信息，还没开始解决问题脑细胞就死了好多。sql

03解决问题的被动性

极可能在程序刚开始运行起来的时候，咱们会检查一下状况，看看日志是否正常。可是更多的时候咱们根本不会想去看那些冗长的日志。过了一段时间，忽然有人告诉咱们问题出现了，便又怀着沉重的心情慌张地检查日志开始排查错误。数据库

如何解决

考虑传统的解决方案，规定好统一的日志格式，将全部模块的日志进行适配以后统一管理起来，并创建相应的日志分类与报表，在检查到问题的时候经过邮件的形式通知运维。这样的解决方案对于小公司来讲，须要的时间和技术成本仍是很大的，真正能提升日志利用的效率，还须要很长的规划与不断的总结。segmentfault

而咱们这样的小公司就中意这样的简单粗暴的方案： 1 个小时搭建整个平台！日志聚集、聚合、主动报警、漂亮的界面，都有了—— Sentry 。app

那么 Sentry 到底如何帮助咱们有效利用日志发现并解决程序问题的呢？框架

Sentry 初试

Server 的安装教程官网已经很是详细了，若是不要求 HA ，只须要额外肯定依赖的 redis 和 postgresql 安装好了就行。运维

支持多种语言与框架的客户端

Sentry 不但有多种语言的客户端，还直接支持大量的日志框架，好比 java 的 log4j ，logback 。这就意味着咱们以前的代码几乎能够不用作任何修改，而仅仅加一点配置便可。分布式

官方 saas

若是想要快速欣赏一下 Sentry 的芳容，能够如今就尝试一下官方的 saas （固然它是免费的）：

Sentry 团队很贴心地让你能够快速创建一个本身的 demo 尝试它的运用。

简单的使用示例

拿官方的 saas 快速认识 Sentry ：

注册好你的帐户后，会有提示帮助你创建好本身的项目，并选择想要使用的客户端平台或框架（这里以 logback 为例）：

到这里为止，咱们就差一步就能够看到效果了：添加一个依赖和一个 logback 的 appender 到你的项目配置里，其余的代码能够一点不变，记日志仍是熟悉的配方。

配置好依赖和 appender ，运行一些写入日志的代码后，你就会收到两方面的反馈：

01面板上出现待解决的 issues ：

02收到新 issues 的邮件：

怎么样，对 Sentry 已经有了一个直观的感觉了吧。

Sentry 如何解决问题

咱们使用 Sentry 就是为了解决日志利用的低效率问题，那么 Sentry 是怎么帮助咱们解决的呢。答案就在几个重要的概念中，固然 Sentry 有详尽的官方使用说明和文档。

dsn（data source name）：

示例中是加在 appender 中的标签。这个就是 Sentry 的实际链接地址， Sentry 经过这个来知道到底将日志发送到哪里。

issues & events：

从上面的图能够发现有 3 个 error 标记的 issue 标签，实际上代码里面发送了 5 条 error 的日志。这是 Sentry 很重要的一点：

咱们须要看的不是单单一条日志，而是一类日志。

一些汇集的日志才能尽量地反映整个错误的状况，即一个 issue ，而这些有关联的日志在 Sentry 这边就转化为这个 issue 的关联的 events 。

回想一下咱们经过日志文件来排查错误的时候，是否是就是本身耐心地运用肉眼过滤掉一系列无关的日志，而后大脑中聚合好这些有关联的日志，尽量全面地了解一个错误呢。

除了帮咱们省掉这些事情，Sentry 提供了更丰富的数据来充实这些 events ，点击一个 issue ，便会进入这个 issue 的详细信息：

不只能够看到咱们主动加上的 message ， stacktrace ， Sentry 还帮咱们加上了一些额外的 tags （咱们也须要本身去定义一些有用的 tags ），尽量多的展示一个 issue 发生前的情况。另一个亮点在右边，展现了这个 issue 的一些统计信息。

Sampling

Sentry 不是为了日志存储，也不会将全部日志都记录下来（毕竟使用关系型数据库做为持久化存储）。每一个发送到 Sentry 的日志都是一个提供 issue 信息的事件（event），而每一个项目发送到 Sentry 的事件都有一个数量上限，一旦超过这个上限 Sentry 就会忽略掉重复的内容。

Sentry 是咱们全部日志的一个关于错误，问题的分析子集。体如今界面上的 events 信息，也是 Sentry 聚合以后的样本。

聚合策略

Sentry 按照策略将日志事件进行聚合，从而提供一个 issue的events 。这么作就是为了智能地帮助咱们组合关联的日志信息，减小人工的日志信息的提取工做量，关注一个 issue 首先关注这些聚合的事件。可是这个策略分组并不会那么智能，Sentry 主要按照如下几个方面，优先级从高到低进行日志事件的聚合：

Stacktrace
Exception
Template
Messages

要注意的是，若是日志记录比较随意，聚合的效果可能不尽如人意。例如：两个无关的事件可是 stacktrace 相同，那么 Sentry 会将它们分到同一个 issue 下。

alerts digest & limit

默认 Sentry 的 alerts 会发送邮件（你也能够推送 slack！）。当一个 issue 产生或者一组 issue 产生时，项目相关的成员都会受到邮件。可是并非每次 issue 有更新就会产生 alert 。

考虑到用户也不但愿被一箩筐的报警邮件给轰炸，由于过多至关于没有， Sentry 除了对重复的报警进行抑制，还会追加一段时间内更新 issue 的摘要（digest）到下一个报警，这样，用户邮件上接收到的信息会充分压缩，不用苦恼于过多的邮件。另外，每一个用户能够根据本身的喜爱自行配置报警的时间间隔。

总结

Sentry 还有有不少亮点，好比敏感信息过滤， release 版本跟踪，关键字查找，受影响用户统计，权限管理等（部分可能须要咱们经过代码提供内容）能够经过 Sentry 进行问题分配与跟踪。Sentry 的 plugin 模块还能够集成大量的第三方工具如： slack ， jira 。

对咱们来讲最大的便利就是利用日志进行错误发现和排查的效率变高了。

01及时提醒

报警的及时性：不须要本身再去额外集成报警系统，一旦产生了 issue 便以邮件通知到项目组的每一个成员。

02问题关联信息的聚合

每一个问题不只有一个总体直观的描绘，聚合的日志信息省略了人工从海量日志中寻找线索，免除大量无关信息的干扰。

03丰富的上下文

Sentry 不只丰富还规范了上下文的内容，也让咱们意识到更多的有效内容，提升日志的质量。

最后，彻底依赖Sentry？

虽然 Sentry 让咱们在使用日志上的效率提升了，可是有几点仍是须要注意。

01不是日志的替代

Sentry 的目的是为了让咱们专一于系统与程序的异常信息，目的是提升排查问题的效率，日志事件的量到达一个限制时甚至丢弃一些内容。官方也提倡正确设置 Sentry 接收的日志 level 的同时，用户也能继续旧的日志备份（用 logback 的同窗仅仅是保留本身之前的 appender 就好）。

02不是排查错误的万能工具

Sentry 是带有必定策略的问题分析工具，以样本的形式展现部分原始日志的信息。信息不全面的同时，使用过程当中也可能出现 Sentry 聚合所带来的负面影响，特别是日志记录质量不够的状况下。

03不是传统监控的替代品

与传统的监控系统相比，Sentry 更依赖于发出的日志报告，而另一些隐藏的逻辑问题或者业务问题极可能是不会获得反馈的。

做者简介

Daisy 岂安科技框架研发负责人
主导底层框架系统和 Warden java 服务端的研发工做。擅长 Java 研发、分布式系统、监控系统以及各种开源项目的引入和改造。

反爬虫

你会感兴趣的内容：

十分钟解决爬虫问题！超轻量级反爬虫方案
 Python工具分析风险数据
 当咱们在谈论前端加密时，咱们在谈些什么