基于资产配置业务场景下的全链路监控平台_行业深度_头哥侃码_InfoQ精选文章

基于资产配置业务场景下的全链路监控平台

每年夏秋交错之时总会非常的忙碌，也许是因为久违的那一丝丝凉意秋风，也许是……今年的年度规划来的稍早了一些……

和往年一样，在这个季节里，也是各大盛会聚集的时刻，就在刚刚过去的 CNUTCon 中，亲身感受了圈内运维伙伴们的热情洋溢，除此之外，我也在互金专场中为大家分享下好买财富在全链路监控上的那些事

未来已来

无论是《终结者系列》中那些震撼的场景，还是 AlphaGo 击败人类的那一刻画面，相信没有人会怀疑人类已进入了智能时代

那么，智能化资产配置是啥意思？

利用 AI 技术，将投资金额分散在不同理财中，从而最终达到预期收益的方式

好买已在今年发布了基于智能投顾业务场景的机器人：

测试风险偏好
选择资产配置（定制化）
买入与卖出再平衡
波动平衡
观点平衡
拉杆平衡

既然未来已来，咱们运维，该如何面对？

我们为什么需要全链路监控？

从去年开始，为了应对互联网特性的与日俱增，我们将策略调整为「快速交付」与「快速排障」，并针对其开展全维度的执行

某某大神说过： “梦想总是伟大的，现实总是残酷的”

先来说说「快速交付」：

老板：怎么才能快？

运维：松耦合

老板：怎么才能把现在的系统变为松耦合？

运维：拆！拆！拆！

老板：最终，耦合是越来越松了，系统数量却越来越多了，当然链路也就随之加长了，怎么办？

运维：………………老板，你好懂

甚至最后变成……

某某大神又说过： “不能给业务带来价值的技术都是耍流氓，快了，老出问题有毛用”

再来说说「快速排障」：

随着系统越来越多，链路越来越长，当故障出现的时候，那么多系统，谁有能力一眼看出究竟是哪个系统在捣鬼？

靠人品？还是拼技术？

这套全链路监控的实现原理是什么？

和大多数公司一样，所谓的全链路监控，无非就是「基于网络调用日志的分布式跟踪系统」罢了

在与其他公司交流中，发现大多数公司都采用 ELK 来进行日志收集与分析，由于 “历史性” 原因，我们选择自研收集器与分析引擎，整体架构可分为「五个层次+四个模块」：

日志结构与如何埋点：

UUID 含义是通用唯一识别码 (Universally Unique Identifier)，整个链路的 TraceId 都是围绕 UUID 展开的

来一张 Log Sample：

这套全链路监控的长啥样？

下面是系统的部分截图与注释说明：

展望未来，还有很长的路要走……

从年初的第一个版本上线至今，无论在「快速交付」或在「快速排障」中，都极大地提升了效率

无论从金融的视角，还是从互联网的视角，大部分系统的发展都是从一个坑跳到另外一个坑，然后再把原来的坑填满，填着填着，架构就这样奇妙的产生了

在第二个版本研发过程中，会对以上四点进行增能：

血缘分析：从错误点推导全链路，并分析出导致本错误点的原因

调用还原：增加快照功能，支持上一节点的调用回放功能

容量评估：暂定位日志存储容量的评估（本功能未考虑清晰）

原因定位：目前只能定位到某个接口失败或错误，并将错误与异常的信息打印出来，本功能将支持失败归因，后期将考虑自动修复

全自研的 PaaS 运维平台

其实，实现这些功能也好，迈向 FT 也罢，所谓平台化，是一种体系，也是一种目标，好买在 DevOps 的路程中只能称得上刚刚起步，但是梦想必须要远大，万一成功了？那不是挺好玩吗？

本文转载自头哥侃码公众号。

原文链接：https://mp.weixin.qq.com/s/6z0i-nFUnJe8fKWK8NAstA

评论

发布

暂无评论

实现macOS热门功能，我只用了60行代码！

解决问题

[Pulsar] Pulsar Resources介绍

Apache Pulsar 12月日更

分析一下微信朋友圈的高性能复杂度

「架构实战营」

云原生新边缘：火山引擎边缘计算最佳实践

火山引擎边缘云

云计算云原生边缘计算

什么是Kubernetes？Kubernetes是怎样工作的？

云计算 Kubernetes

数据库牛人是如何进行SQL优化的？

数据库 sql SQL优化

如何在 AWS 云中从 Amazon EC2 启动 RHEL 8？

云计算 AWS RHEL 8 Amazon EC2

TCP/IP的底层队列

程序员历小冰

网络 TCP/IP 28天写作 12月日更

重磅｜火山引擎边缘计算节点服务正式发布！

火山引擎边缘云

边缘计算网络云计算，

15. 《重学JAVA》--Lambda表达式

Java 25 周年 28天写作 12月日更

电脑安全小知识

黑客网络安全安全计算机基础

46 K8S之集群高可用

穿过生命散发芬芳

k8s 28天写作 12月日更

2021的科技卦象·震·到元宇宙玩“躲猫猫”

链路分析 K.O “五大经典问题”

阿里巴巴云原生

负载均衡阿里云云原生流量链路分析

【Redis核心原理专题】（1）「技术提升系列」分析探究如何实现LFU的热点key发现机制以及内部的Scan扫描技术的原理

redis 12月日更 Redis Scan Redis 热点key Redis服务

东数西算，风起中原

工业机器视觉系统的构成与开发过程（理论篇—1）

不脱发的程序猿

计算机视觉机器视觉图像处理 LabVIEW 工业自动化

Hystrix Dashboard

微服务 28天写作 12月日更

低代码助推生物制药企业CDMO的“数字化转型”之路

低代码制药企业CDMO

5分钟认识802.11标准，言简意赅！

网络技术无线技术网络技术联盟站 802.11

LabVIEW软件、驱动安装及编程方法（理论篇—2）

不脱发的程序猿

机器视觉 LabVIEW 工业自动化

读《思辨与立场》-04自我理解

28天写作批判性思维思辨与立场

Go+ XML 编码和解码处理教程（5.5）

28天写作 12月日更

【架构师训练营】模块二作业

樰巳-堕~Horry

架构实战营「架构实战营」

设计模式的提出

28天写作 12月日更

架构模块二作业

「架构实战营」

增长方法论：五步验证法

产品经理 28天写作产品增长 12月日更

开源轻量级 IM 框架 MobileIMSDK v6.1.2 发布

TCP websocket 即时通讯 IM MobileIMSDK

JavaScript操作 DOM 的这些事件基础

JavaScript 前端 DOM BOM WebApi

Holos: 我来了，我是个大块头。