写点什么

基于资产配置业务场景下的全链路监控平台

  • 2020-04-17
  • 本文字数:1308 字

    阅读完需:约 4 分钟

基于资产配置业务场景下的全链路监控平台

每年夏秋交错之时总会非常的忙碌,也许是因为久违的那一丝丝凉意秋风,也许是……今年的年度规划来的稍早了一些……


和往年一样,在这个季节里,也是各大盛会聚集的时刻,就在刚刚过去的 CNUTCon 中,亲身感受了圈内运维伙伴们的热情洋溢,除此之外,我也在互金专场中为大家分享下好买财富在全链路监控上的那些事

未来已来

无论是《终结者系列》中那些震撼的场景,还是 AlphaGo 击败人类的那一刻画面,相信没有人会怀疑人类已进入了智能时代



那么,智能化资产配置是啥意思?


利用 AI 技术,将投资金额分散在不同理财中,从而最终达到预期收益的方式


好买已在今年发布了 基于智能投顾业务场景的机器人:


  • 测试风险偏好

  • 选择资产配置(定制化)

  • 买入与卖出再平衡

  • 波动平衡

  • 观点平衡

  • 拉杆平衡


既然未来已来,咱们运维,该如何面对?


我们为什么需要全链路监控?

从去年开始,为了应对互联网特性的与日俱增,我们将策略调整为「快速交付」与「快速排障」,并针对其开展全维度的执行


某某大神说过: “梦想总是伟大的,现实总是残酷的”


先来说说「快速交付」:


老板:怎么才能快?


运维:松耦合


老板:怎么才能把现在的系统变为松耦合?


运维:拆!拆!拆!


老板:最终,耦合是越来越松了,系统数量却越来越多了,当然链路也就随之加长了,怎么办?


运维:………………老板,你好懂



甚至最后变成……



某某大神又说过: “不能给业务带来价值的技术都是耍流氓,快了,老出问题有毛用”


再来说说「快速排障」:


随着系统越来越多,链路越来越长,当故障出现的时候,那么多系统,谁有能力一眼看出究竟是哪个系统在捣鬼?



靠人品?还是拼技术?


这套全链路监控的实现原理是什么?

和大多数公司一样,所谓的全链路监控,无非就是「基于网络调用日志的分布式跟踪系统」罢了



在与其他公司交流中,发现大多数公司都采用 ELK 来进行日志收集与分析,由于 “历史性” 原因,我们选择自研收集器与分析引擎,整体架构可分为「五个层次+四个模块」:




日志结构与如何埋点:


UUID 含义是通用唯一识别码 (Universally Unique Identifier),整个链路的 TraceId 都是围绕 UUID 展开的



来一张 Log Sample:


这套全链路监控的长啥样?

下面是系统的部分截图与注释说明:



展望未来,还有很长的路要走……


从年初的第一个版本上线至今,无论在「快速交付」或在「快速排障」中,都极大地提升了效率


无论从金融的视角,还是从互联网的视角,大部分系统的发展都是从一个坑跳到另外一个坑,然后再把原来的坑填满,填着填着,架构就这样奇妙的产生了


在第二个版本研发过程中,会对以上四点进行增能:


血缘分析:从错误点推导全链路,并分析出导致本错误点的原因


调用还原:增加快照功能,支持上一节点的调用回放功能


容量评估:暂定位日志存储容量的评估(本功能未考虑清晰)


原因定位:目前只能定位到某个接口失败或错误,并将错误与异常的信息打印出来,本功能将支持失败归因,后期将考虑自动修复


全自研的 PaaS 运维平台


其实,实现这些功能也好,迈向 FT 也罢,所谓平台化,是一种体系,也是一种目标,好买在 DevOps 的路程中只能称得上刚刚起步,但是梦想必须要远大,万一成功了?那不是挺好玩吗?


本文转载自头哥侃码公众号。


原文链接:https://mp.weixin.qq.com/s/6z0i-nFUnJe8fKWK8NAstA


2020-04-17 15:05803

评论

发布
暂无评论
发现更多内容

肯耐珂萨D1轮融资资方阵营揭晓,跟投方为中南资本、青发集团

人称T客

怎么写一个超棒的 README 文档

程序员生活志

经验总结 文档

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第7章定位

Geek_8dbdc1

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局

Geek_8dbdc1

面经手册 · 第4篇《HashMap数据插入、查找、删除、遍历,源码分析》

小傅哥

Java 小傅哥 hashmap 面经 红黑树

巴黎世家土味病毒营销,B端创业初期,如何用营销壮大种子用户?

北柯

创业 营销 tob

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第9章FlexBox实战有路网

Geek_8dbdc1

微服务框架 Dubbo

莫莫大人

极客大学架构师训练营

架构师训练营 第 10 周 作业&总结

Jam

核心稳定、易扩展——开放关闭原则(The Open-Closed Principle)

晃来晃去的萨麦尔

编程习惯 架构分析 软件设计原则

HTML5CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第10章有路网PC端主页实战整合

Geek_8dbdc1

神经网络的学习为何要设定损失函数?

王坤祥

神经网络 学习 损失函数

微软看上的Rust 语言,安全性真的很可靠吗

华为云开发者联盟

数据库 开源 rust 安全 代码

超市趣味游戏关卡设计

孙志平

安卓移动应用代码安全加固系统设计及实现

几维安全

android 安全评估 移动应用安全

libuv 异步网络编程之 TCP 源码分析

Huayra

网络编程 libuv libuv 源码分析

Windows AD日志分析告警平台—WatchAD安装教程

BigYoung

监控 windows 日志 AD 告警

智能汽车安全风险及防护技术分析

几维安全

移动应用安全

云图说丨手把手教你为容器应用配置弹性伸缩策略

华为云开发者联盟

Docker 云计算 Kubernetes 容器

SpringBoot 系列(一):SpringBoot项目搭建

xcbeyond

Java 微服务 springboot

拼多多员工曝离职黑幕:要走可以,要离职证明,没有!

程序员生活志

职场 互联网公司

Spark优化之小文件是否需要合并?

华为云开发者联盟

spark 数据 cpu 内存 Spark调优

React TypeScript 项目基本构建2

JackWangGeek

React

Week10总结

熊威

HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第11章有路网移动端主页实战

Geek_8dbdc1

看前谷歌工程师是如何副业赚钱的?

非著名程序员

程序员 个人成长 副业赚钱 提升认知

致远互联A6+Cloud C位出道 赋能中小企业乘风破浪

爱极客侠

工业互联网网络安全渗透测试技术研究

几维安全

网络安全 数据安全;工业互联网 移动应用安全 渗透测试

Week10作业1

熊威

有限数据量如何最大化提升模型效果?百度工程师构建数据增强服务

百度大脑

人工智能 数据 模型训练 百度大脑

《深度工作》学习笔记(6)

石云升

读书笔记 专注 深度工作

基于资产配置业务场景下的全链路监控平台_行业深度_头哥侃码_InfoQ精选文章