速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

有赞精准测试实践

  • 2019-09-24
  • 本文字数:2847 字

    阅读完需:约 9 分钟

有赞精准测试实践

一、背景介绍

有赞早期业务跑在一个单体 php 工程上,随着业务发展,性能拓展性已经满足不了需求,为了后续发展,底层开始微服务化,整体转向 dubbo 框架。从单体转向分布式框架,测试也面临着一系列问题,如下:


  1. 对于分布式系统中的绝大部分应用,随着业务发展,自身应用代码复杂度会不断增加,如何准确、全面判定代码修改影响范围会越来越重要;

  2. 一些领域设计不太合理的业务架构,会发现任一应用接口变动会使多个应用受影响。测试过程中会发现只是自身应用代码一个修改,会导致对外暴露的接口逻辑发生很大变动,此时测试人员需要判定出这个对外暴露的接口对上层应用到底有多大影响;

  3. 业务快速迭代导致测试时间不断压缩,全量回归是一个很困难的事情,那么测试范围需要开发测试人员根据代码和业务熟悉程度精确把控,风险容易失控;


基于上述背景,我们研发了精准测试工具,作为应用上线质量的参考维度之一,集成到测试工具平台上供技术部门所有同事使用。

二、整体方案设计

对于上面的痛点,可以分为三步走;第一步修改过的代码如何识别,第二步分析出自身应用有哪些接口受到影响;第三步获取上层业务方受到的影响;设计要点如下:


  1. 识别变更的代码:上线代码和 master 代码采用抽象语法树分析,去除噪音后,比对方法体即可获取到新增/修改/删除的方法;

  2. 分析影响的自身应用对外暴露的接口,采用动静结合。静态分析采用字节码分析,同时补充了桥接来解决部分多态问题;动态分析采用了和主流调用链技术一致的 javaagent 来对代码进行织入,为了防止大量织入导致性能变差,只在 qa 环境进行织入;

  3. 对于应用间链路查询,由于有赞内部很早就有一个调用链系统,可以实时查看应用接口之间调用详情,借助这个系统,使用大数据 spark 或者 MR 进行离线任务,汇总处理所有的链路信息即可获取应用间所有链路信息,上层业务方影响范围只要查询链路即可获得。


PS:对于没有现成调用链的公司可以参考成熟的开源工具 skywalking,github 地址如下:https://github.com/apache/skywalking


三、重点模块

重点模块包含了代码比对,静态分析,动态分析,动静结合,应用间影响分析。

3.1 代码比对

设计思路:影响分析,首先需要判定哪些方法发生变动。传统的 git/svn 会把增加的注释、空白字符、空行等非业务代码认为是代码变动,实际上这类变动对于我们业务来说没有任何影响;而单纯判断编译后的 class 文件,是可以避免这些误判,但判断哪些方法发生变动,需要比对方法体的指令,同时还要处理各种内部类的问题,难度不小;为了解决这个问题我们采用了语法树分析,流程如下:


3.2 静态分析逻辑

设计思路


对于 java 代码,分析字节码可以发现,调用方法是通过 invokestatic,invokespecial,invokeinterface,invokevirtual,invokedynamic 这五个指令,扫描每个方法体指令中的 invoke 指令,获得应用内部调用链中的一系列父子节点。每个应用对外暴露出去的接口都可以认为是一棵内部调用链的根节点,从根节点出发遍历可达的所有节点,那么内部调用链即可生成。要点如下:


  1. 对于字节码分析,有很多字节码操作工具,ASM/bcel/Javassist 都可以,使用方法都类似,随便选择一个就行;

  2. 对于 invokedynamic 指令,单纯按照字节码指令指向的是一个引导方法(Bootstrap Method),需要判定真正执行的方法,进而获取真正的调用链;

  3. 为了加快速度,减少后期处理,需要剔除掉不感兴趣的父子节点,比如调用三方包/jdk 的 API/get 方法/set 方法;

  4. 调用接口指令是 invokeinterface 方法,但实际上真正执行的是接口的实现类代码,如果接口只有一个实现类,那么我们就可以判定执行的就是这个实现类,从而可以进行桥接;

  5. 匿名内部类编译过程中会生成一个类似 A$1 的 class 文件,根据字节码文件中的 EnclosingMethod 字段可以判定上层调用方的类名和方法名,从而可以完成方法和匿名内部类方法的桥接;


动态分析 &动静结合

动态分析


对于代码中存在的 AOP 和多态,静态分析无法很好的解决,采用动态分析将会很好的解决这个问题。使用 javaagent 对内部方法进行代码织入,当执行自动化或者功能测试,可以记录一次请求经过的所有内部方法,这样形成的内部方法调用链将会记录 aop 和多态执行的真正的方法,静态的弱点会得到很大的补充。要点如下:


  1. 性能问题:大量织入会导致性能损耗,首先判定当前环境,是否是 qa 环境,qa 环境再织入,不要对线上有影响;

  2. 织入范围:只对 com.youzan 的包进行织入且排除掉二方包(二方包包名一般也为 com.youzan.*),排除掉所有的 get/set 方法,排除掉 private 方法(子类重写不了父类私有方法),排除掉这些会大大加快代码织入速度,且对分析无影响;

  3. 对于每次请求到结束返回,整个调用过程可以看作是不断入栈出栈的过程,调用一个方法是入栈,方法结束为出栈,当栈为空,即表示请求结束,出入栈的顺序反映了代码的调用逻辑,从而形成内部调用链;



动静结合


动态分析会存在样本不足,内部调用链不能完全反映内部方法调用情况;静态分析存在多态和 AOP 的问题,存在孤立的节点,无法串联起来;为了尽可能分析出受影响的范围,以及避免动静分析两种方式的弊端,采用动静结合,要点如下:


  1. 根据动态分析和静态分析,分别获取了一系列内部调用链,把这些内部调用链的节点打散后重新组合得到包含动态和静态数据的内部调用链;

  2. 根据新增/修改的方法名称和方法入参类型,匹配出包含此方法的内部调用链,内部调用链根节点就是改动点影响的对外暴露接口;


3.3 应用间影响分析

应用间链路采集采用的是 sdk+javaagent,整体方案类比 skywalking,可以参考 skywalking 进行二次开发。此处主要介绍离线分析思路,应用间调用链的数据都是每个应用分批上报,一次请求在各个节点上报的都会包含最上层调用方接口、上层调用方接口以及本接口信息,汇总去重后将反映出整体应用间调用详情。(PS:由于一些异常情况,实时上报的链路数据不一定完整,故离线统计入库之前需要判定是否为一棵完整的调用关系树)


3.4 效果

应用内影响的接口效果如下,主要包含了汇总信息/比对页面/影响点对应的接口:



一个接口可能被多个调用方调用,对于开发和测试人员一般最关注的是接口直属调用方和入口调用方以及整体的拓扑图,如下所示:




某些情况下,单条链路调用链详情也需要展示出来:


3.5 不足

  1. 对于新增代码的影响面大部分都是依靠字节码分析,而字节码分析在多态和 AOP 方面存在天然短板,影响面会有所丢失

  2. 应用内链路跟踪存在大规模代码织入,对性能和内存资源会造成一定损耗,对于代码量很大的工程,损耗尤其严重;

  3. 对于大规模代码重构或者底层公用方法的变动,影响面分析会覆盖很多接口,此时依然需要人工评估是否可以缩小测试范围;

  4. 目前应用内代码分析只支持 java 语言,缺少其他语言的范围评估。


本文转载自公众号有赞 coder(ID:youzan_coder)


原文链接


https://mp.weixin.qq.com/s?__biz=MzAxOTY5MDMxNA==&mid=2455760012&idx=1&sn=07ebcab572db3424c502360d96ce79f0&chksm=8c686aa9bb1fe3bf9622b2049a220e5a2ceef86dcbe276dd52423f647900d4c19ca74720879e&scene=27#wechat_redirect


2019-09-24 08:003732

评论

发布
暂无评论
发现更多内容

软件开发中的防呆方法总结

张明云

DevOps 软件开发 技术架构 防呆 模式

干货分享!用心满满:面试前必知必会的二分查找及其变种

比伯

Java 编程 架构 面试 计算机

为什么阿里人能够快速成长?看完他们Java架构进化笔记,我秒懂!

Java架构追梦

Java 学习 架构 面试 成长笔记

王者级别的Java多线程技术笔记,我愿奉你为地表最强!

Java架构师迁哥

架构师训练营第 1 期 第 11 周作业

李循律

极客大学架构师训练营

多活/多机房的几种实现方式与重点

Justfly

高可用 跨机房 数据同步 异地多活容灾

CloudIDE插件开发实战:教你如何调试代码

华为云开发者联盟

ide 开发 Cloud

K8s 将弃用 Docker;TypeScript 超越 C++ 成第四大语言

京东科技开发者

程序人生

anyRTC 联合 vInClass 打造在线教育上课模式

anyRTC开发者

音视频 WebRTC 在线教育 RTC

架构探索:事务处理一

而立斋

拆解增长黑客之实战(一):获客与激活

懒杨杨

增长 产品运营

鹅厂大佬亲身经历证明,一周上线百万级并发系统

Java架构师迁哥

基于RTMP数据传输协议的实时流媒体技术研究(论文全文)

程序员小灰

音视频 ffmpeg 流媒体 RTMP webrtc、

深度学习在物理层信号处理中的应用研究

华为云开发者联盟

学习 模型 物理层

InfoQ 内容推荐位资源限时开放

乐白

InfoQ 资源

理解Python协程的本质

Justfly

Python 协程 异步 Async 异步编程

揭秘 VMAF 视频质量评测标准

阿里云CloudImagine

视频 图像处理

福利 | 这些网站有免费代理IP!

前嗅大数据

大数据 代理IP 网站反爬 免费代理ip 封ip

大型团队实践敏捷开发管理的挑战与应对

万事ONES

敏捷开发 研发管理 敏捷开发管理 开发管理

一次产品影响地图的探索之旅

Bruce Talk

敏捷 Agile Product Owner 影响地图

研发管理:敏捷研发下周报的价值

云原生实验室

云原生 敏捷 研发管理 周报

苦修月余,斩获bigo、腾讯offer,面经奉上!

艾小仙

Java 腾讯 面试 腾讯大厂

话题讨论 | 用好VSCode这13款插件和8个快捷键,工作效率提升10倍

程序员柠檬

话题讨论

三分钟看懂快速开发,常用软件快速开发平台速览

Marilyn

敏捷开发 快速开发 企业开发 企业应用

全球熵ETV系统APP开发|全球熵ETV软件开发

系统开发

5G多输入多输出技术,到底是个啥东东?

华为云开发者联盟

5G 输入 输出

WebRTC SDP 详解和剖析

阿里云CloudImagine

阿里云 音视频 WebRTC 视频云 流媒体传输

蕃茄田宋姝梦:科技赋能时代,儿童在线艺术教育的思考

ZEGO即构

美女面试官问我:说说你对序列化的理解

田维常

序列化

《图解数据结构》.pdf

田维常

数据结构

深入灵魂的考验,每行注释都是灵魂的单例模式,源码+实例降临

小Q

Java 学习 架构 面试 设计模式

有赞精准测试实践_文化 & 方法_魏士超_InfoQ精选文章