端计算Walle：2235亿次运算，为了无法计算的端智能价值（二）_语言 & 开发_淘系技术_InfoQ精选文章

AICon上海｜与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用了解详情 



 写点什么

登录/注册

端计算Walle：2235亿次运算，为了无法计算的端智能价值（二）

面临的挑战

今年我们加大投入，并联合了算法团队、搜索推荐工程团队、手淘基础链路团队，共建端计算的工程体系。随着端计算体系承载的业务数量与复杂度的快速增加，也对 DAI 等基础设施提出来了更多更严峻的挑战。

▐ 研发效率

初期的设计是算法同学通过控制台下发 TensorFlow 的 pb(protobuffer) 模型文件，所有的逻辑均在 pb 的网络结构中实现。这种模式下，存在如下一些不足的地方。

由于端侧集成的为精简版 TF Mobile ，算法同学编写的 TF 代码在端侧可能存在缺少算子而跑失败的情况。
新增或修改 Op 需要 Native 发版实现，周期长。
if、for 等流程控制在 TF 中难以处理。
TF 的端侧推理耗时较长，业务决策响应不及时。

▐ 稳定性

Android 出于包大小和动态性的考虑，采用了动态下发并加载动态库的模式。但是由于 Android 设备的碎片化，动态加载存在着诸多兼容性的问题，测试也不好验证。同时 JavaScriptCore 本身在 iOS 上是个黑盒，曾在 iOS9 上就出现过大量的 JavaScriptCore 的 Crash 问题。而端计算作为算法处理的基础设施，每日被调用的次数非常庞大。所以任何一个极小的不稳定因素，都有可能被放大。

并且端侧的故障，大部分是由于线上配置发布引起的。手淘对于线上变更有着严格的安全生产流程，涉及发布窗口、验证、灰度、观察等各个环节。而算法同学往往对端侧的指标不熟悉，一些潜在风险未必能及时发现。我们需要在各个环节加强完善设施能力，在风险发生前及时暴露，在发生中将影响减至最低。

▐ 任务治理

在年初的时候，我们进行了一次线上业务梳理。发现手淘环境中有 5+的特征提取任务、4+的曝光任务。很多基础的数据特征，在不同的业务场景下都需要使用到，且对于同一特征的加工方式往往相识。若所有的特征均由各业务方自行进行加工，难免会造成开发成本及端上计算成本的浪费。而且无法高效地将已有能力复用到更多业务和 App 上。

▐ 场景覆盖

在端计算模式快速发展中，我们关注到部分业务域虽然不具备算法资源，但是希望借鉴端计算的思路，在一些输入因素相对比较固定的场景下，对用户特定的行为进行快速的响应与干预。同时初期 DAI 的触达能力比较单一，仅将执行结果以广播的方式通知到业务方，由业务方自行实现通知后的触达响应逻辑。而一些常规的触达途径，在大部分业务域都是相识的。比如 Push、Poplayer（浮窗）、触发其他模型任务联动等。在这个环节需要有一套统一的多样的触达机制，满足不同场景不同定制。

本文转载自淘系技术公众号。

原文链接：https://mp.weixin.qq.com/s/V2QrhvW-F8asXvtyg7i0XA

评论

发布

暂无评论

再记一次业务优化

TiDB 社区干货传送门

TiDB使用场景漫谈

TiDB 社区干货传送门

使用Zabbix监控TiDB（二）

TiDB 社区干货传送门

【精选实践】汽车之家从 SQL Server 到 TiDB 的异构变迁

TiDB 社区干货传送门

使 pt-kill 和 pt-query-digest 工具兼容 TiDB

TiDB 社区干货传送门

PD的时钟服务——TSO

TiDB 社区干货传送门

Elastic Stack处理TiDB慢日志

TiDB 社区干货传送门

TiKV笔记-Raft复制状态机--未完

TiDB 社区干货传送门

TiDB 联合索引是如何工作的

TiDB 社区干货传送门

北京“TiDB 性能调优专场”活动小组讨论结论

TiDB 社区干货传送门

如何理解TiDB允许广义上的幻读

TiDB 社区干货传送门

TiDB 底层架构

同步工具Gravity杂谈

TiDB 社区干货传送门

生态工具原理学习笔记(笔记)

TiDB 社区干货传送门

TiDB 4.0 试玩体验--Tiflash

TiDB 社区干货传送门

基于Drainer的TiDB的闪回实现

TiDB 社区干货传送门

网易游戏 Flink on TiDB 实时数据业务实践

TiDB 社区干货传送门

浅谈 TiDB 初始化系统库过程

TiDB 社区干货传送门

性能调优 TiDB 底层架构

tikv下线Pending Offline卡住排查思路

TiDB 社区干货传送门

故障排查/诊断

体验更简单的 DM —— v1.0.2

TiDB 社区干货传送门

忘记root密码的解决办法具体实现步骤

TiDB 社区干货传送门

管理与运维安装 & 部署

分布式系统 in 2010s

TiDB 社区干货传送门

TiKV架构原理（笔记）

TiDB 社区干货传送门

事务前沿研究丨事务并发控制

TiDB 社区干货传送门

TiDB 底层架构

TiDB备份实现

TiDB 社区干货传送门

管理与运维

【案例】汽车之家 - 一次业务优化解决读写冲突的案例，提升 5 倍性能

TiDB 社区干货传送门

【精选实践】TiDB 在丰巢核心支付平台百亿级数据的深度实践

TiDB 社区干货传送门

TiDB慢日志解析源码解读

TiDB 社区干货传送门

TiDB 在爱奇艺的业务场景及实践

TiDB 社区干货传送门

DM在Docker环境部署安装

TiDB 社区干货传送门

TiDB-v4.0.x支持OLAP场景的一些实践经验

TiDB 社区干货传送门

TiKV 多副本丢失以及修复实践

TiDB 社区干货传送门