写点什么

不可忽视的日志

  • 2013-11-28
  • 本文字数:2381 字

    阅读完需:约 8 分钟

在软件开发中,日志是一项必不可少又不是那么重要的“功能”,毕竟,产品的业务逻辑模块对客户来说才是最有价值的。但是,随着软件开发和部署模式的变化发展,日志的重要性正在不断提高。软件架构师 Vlad Mihalcea解释了其中的缘由。

Vlad 认为日志应当得到比我们现在给予它的更多的关心:

我认为当设计一个应用的时候,很大一部分精力都投入到了构建客户业务逻辑模型上。这个业务模型将映射到一个持久化存储上(作为一个 RDBMS 或 NoSQL 解决方案)。日志模块有以下框架可供选择:web、中间件、批处理任务、或者可能是通过 log4j logback 实现的 SLF4J (Simple Logging Facade for Java)。这几乎是我参与的所有的应用出现的现象,并且日志一直都是个二等公民,且依赖于良好的旧的字符串日志框架。

但是最近我开始意识到现在的字符串日志系统还有更多的东西需要记录,特别是如果我的系统被部署到云端并且利用了自动伸缩的优势时,然后收集文本文件并且将它们聚集到一个公共的地方——这种做法看起来就像是骇客的行为。

他谈到了自己最近在日志开发方面的变化,在其最新的应用程序中,Vlad 实现了一个拥有更复杂信息的通知机制,因为只有基于字符串的日志是不够的。

我得感谢和我一起工作的一个同事,当他说“通知机制是我们应用程序的核心”时,他开启了我的视野。我之前还从未想过将日志作为任何一个应用程序的核心。业务逻辑才是应用程序的核心,而不是日志。但他的话中也有很多事实,因为如果你没有一个好的机制了解你的系统是否真的在做那些期望的事,你没法部署任何东西。

Vlad 设计的通知都是些比较复杂的对象(调试通知比错误通知的数据更少),并且 NoSQL 文档数据库是一个存储我们日志的绝佳数据库。一个通知包含了以下各种类型的数据:

  • 当前正在执行的任务
  • 数据的来源
  • 日志起源的组件
  • 抛出的异常
  • 输入的参数
  • 承载着我们请求的 Spring 集成消息的历史记录

他提到,既然能够在一种少模式的方式下存储复杂的对象,那么也能够查询日志,并且日志查询结果到达的顺序并不要紧。因为可以依据来源和创建时间来给它们排序。这样就可以拥有一个安排好的任务,便于在检测到太多错误条目时生成警报和报告。这是一个客户定制的日志的实现,因为还没有为通知使用专有的框架,但 Vlad 从中得到了更多的价值,比从经典的基于字符串的日志文件中得到的多得多。

Vlad 依然认为 log4j 和 logback 是很棒的实现方案,并且还没有替换它们。

我们只是加了一些额外的日志特性来克服它们的局限性。但即使是用着最新的 logback 存放器,我依然认为当前的基于字符串的日志对于生产系统需求来说还是太过简单了。如果你使用它们更多目的是为了调试,并且在生产环境中有额外的监控方法的话,那么也许是时候用一个能同时为开发和生产环境工作的智能日志解决方案了。

如果说十年前,当关系型数据库(RDBMS)统治着存储世界时,这是很难实现的,并且基于文件的日志系统是个很好的折中方案。但 Vlad 认为现在已经有方法实现更好的日志框架了。

现在的基于字符串的文件日志模型也许已经很有效率了,尤其是当我们的服务器在单个机器中垂直缩放时。但在一个有着很多水平分布的服务器的世界中,这种状况需要额外的处理方案。

大公司们已经采用了这种新一代日志系统了,比如 Facebook Scribe LinkedIn Kafka 日志处理系统。我真的很喜欢 LinkedIn 的解决方案,并且它激励了我去探寻一个工作在 CQRS 模式下的新的日志系统。在这个日志系统中,日志整体像一个事件一样存储在日志数据库中,并且每个事件通过一系列的处理程序来更新当前系统状态。这种方法结合了日志和监视器,并且监视器命令直接进入缓存中的最新系统状态,这些系统状态包括:警报、状态报告、当前系统状态的监控视图。

软件工程师成富在" Java 日志管理最佳实践”中也谈到了日志的重要性:

对于现在的应用程序来说,日志的重要性是不言而喻的。很难想象没有任何日志记录功能的应用程序运行在生产环境中。日志所能提供的功能是多种多样的,包括记录程序运行时产生的错误信息、状态信息、调试信息和执行时间信息等。在生产环境中,日志是查找问题来源的重要依据。应用程序运行时的产生的各种信息,都应该通过日志 API 来进行记录。很多开发人员习惯于使用 System.out.println、System.err.println 以及异常对象的 printStrackTrace 方法来输出相关信息。这些使用方式虽然简便,但是所产生的信息在出现问题时并不能提供有效的帮助。这些使用方式都应该改为使用日志 API。使用日志 API 并没有增加很多复杂度,但是所提供的好处是显著的。

对于 Java 在日志方面的 API,成富指出,尽管记录日志是应用开发中并不可少的功能,在 JDK 的最初版本中并不包含日志记录相关的 API 和实现。相关的 API(java.util.logging 包,JUL)和实现,直到 JDK 1.4 才被加入。因此在日志记录这一个领域,社区贡献了很多开源的实现。其中比较流行的包括 log4j 及其后继者 logback。除了真正的日志记录实现之外,还有一类与日志记录相关的封装 API,如 Apache Commons Logging 和 SLF4J。这类库的作用是在日志记录实现的基础上提供一个封装的 API 层次,对日志记录 API 的使用者提供一个统一的接口,使得可以自由切换不同的日志记录实现。比如从 JDK 的默认日志记录实现 JUL 切换到 log4j。这类封装 API 库在框架的实现中比较常用,因为需要考虑到框架使用者的不同需求。在实际的项目开发中则使用得比较少,因为很少有项目会在开发中切换不同的日志记录实现。

成富认为记录日志只是有效地利用日志的第一步:

更重要的是如何对程序运行时产生的日志进行处理和分析。典型的情景包括当日志中包含满足特定条件的记录时,触发相应的通知机制,比如邮件或短信通知;还可以在程序运行出现错误时,快速地定位潜在的问题源。这样的处理和分析的能力对于实际系统的维护尤其重要。当运行系统中包含的组件过多时,日志对于错误的诊断就显得格外重要。

2013-11-28 06:193452
用户头像

发布了 501 篇内容, 共 254.6 次阅读, 收获喜欢 59 次。

关注

评论

发布
暂无评论
发现更多内容

凝心聚力 开源共建 | 统信软件参与成立OpenKunlun开源固件社区

统信软件

开源 开源社区 开源技术

Flink CDC 2.3 发布,持续优化性能,更多连接器支持增量快照,新增 Db2 支持

Apache Flink

大数据 flink 实时计算

「Go易错集锦」正确使用defer避免代码重复

Go学堂

golang 程序员 个人成长 defer 11月月更

华为云桌面Workspace,让云上工作更高效!

路过的憨憨

读《程序是怎样跑起来的》体会

听风go

读书笔记 后端 计算机 计算机原理 读书总结

基于 Apache Flink Table Store 的全增量一体实时入湖

Apache Flink

大数据 flink 实时计算

“后 Hadoop 时代”,大数据从业者如何应对新技术趋势带来的挑战?

Apache Flink

大数据 flink 实时计算

企业办公新模式,随时随地云上协同!

秃头也爱科技

深度学习-浅谈keras的扩展性

AIWeker

深度学习 keras 11月月更

【web 开发基础】PHP中的数组 (41)

迷彩

php 数据结构 11月月更 关联数组 索引数组

《2022开源大数据热力报告》发布,Flink 摘得「流处理」领域热力值 TOP1

Apache Flink

大数据 flink 实时计算

【web 开发基础】PHP 中数组的定义 (42)

迷彩

数据结构 数组 11月月更 数组的定义

赫夫曼树编码实验报告

我是一个茶壶

数据结构 哈夫曼树 11月月更

制造业要用龙头带动整条产业链发展,阿里云智能制造加速器首次集结

B Impact

融云全球社交泛娱乐洞察,老资格的「游戏社交」还有哪些想象空间

融云 RongCloud

社交 泛娱乐社交

华为云大数据平台,助力企业数字化转型成效明显

路过的憨憨

一文了解 Go 标准库 strings 常用函数和方法

陈明勇

Go golang 字符串 11月月更 strings

支持向量机-SVC的模型评估指标

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

Python 操作Excel(xlrd和XlsxWrite)

度假的小鱼

11月月更 Python xlrd读取Excel Python xlrd

【React技术】JSX在企业级项目的运用and一个元素渲染demo

恒山其若陋兮

前端 11月月更

Linux yum 命令

芯动大师

yum源 11月月更 Linux系统指令

2022-11-29:查找重复的电子邮箱。以下数据中a@b.com是重复的,请写出sql语句。 DROP TABLE IF EXISTS person; CREATE TABLE person (

福大大架构师每日一题

数据库 福大大

支持向量机-ROC曲线中的概率和阈值

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

细说值传递、引用传递和地址传递

闫同学

编程语言 计算机基础 11月月更

Python 操作mongodb库

度假的小鱼

mongodb 11月月更 Python 操作mongodb库

xxj-job服务端架构流程

IT巅峰技术

单一职责原则详解

杨充

开闭原则详细介绍

杨充

研发管理如何度量「人效」

feijieppm

项目管理 研发效能 技术管理 文化 & 方法 效能度量

python版本管理工具DVC

AIWeker

人工智能 版本管理 11月月更 dvc

Python 操作Mysql

度假的小鱼

pymysql 11月月更 Python操作Mysql

不可忽视的日志_语言 & 开发_崔康_InfoQ精选文章