【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

像多人实时编辑文档一样编辑图片,钉钉新功能背后的技术解读

  • 2021-01-20
  • 本文字数:3684 字

    阅读完需:约 12 分钟

像多人实时编辑文档一样编辑图片,钉钉新功能背后的技术解读

1 月 14 日,钉钉正式发布 6.0 版本,其中推出的“一起标注”功能可以实现像编辑文档一样多人实时编辑一张图片,引起了不少开发者的注意。其背后正是钉钉自研的协同框架技术,可以让多人实时协同类应用的开发变得像开发单人本地应用一样简单,协同框架也将向钉钉开发者开放。


在企业办公场景中,“打工人”们的工作协作基本离不开 IM 软件,而大家却也常常被图片消息确认难这样一种困境所困扰,比如:当群组里有一个人发了一张技术架构图请其他几位同事做确认时,接收信息的每一个人可能都需要在图片上进行标注,用画笔圈出需要修改的地方,然后保存到手机再发送到群里,还可能要反复修改,整个过程十分不顺畅。在这种需要多人协作的场景中,工作效率就大大降低了。


但现在,情况开始有了转变。


1 月 14 日,钉钉正式发布 6.0 版本,其战略定位也从过去基于 IM 的协同办公平台,升级为企业级协同办公平台和企业级应用开发平台,这是继“云钉一体”战略后,钉钉最重要的版本升级。


而此次钉钉众多上新的能力中,包含了一个叫做“一起标注”的功能,它可以实现像编辑文档一样多人、实时编辑一张图片。只要点击图片进行标注,所有接收到图片信息的协作者就可以看到编辑过程及编辑者的名字标签,很好地解决了我们开篇提到的如何在图片消息的讨论上实现更高效的问题。


可以再设想这样一个场景:团队欢迎新同学加入一起聚餐,合照发到群组中,大家可以一起在照片上涂鸦圈人,新同学将自己圈出来,照片上会自动显示名字标签。“大家看看新来的 UED 同学在哪里?”,通过这种多人实时互动,给工作带来更多的趣味与温度。



“一起标注”功能展示

在“一起标注”功能的背后,钉钉的自研技术:协同框架技术也浮出水面,其目标是希望能够降低多人实时协作应用开发的门槛,通过协同组件、协同数据结构等服务让开发者更专注于其自身业务。“一起标注”只是基于协同框架的其中一个 Showcase,在这套协同框架下,还有更多的协同应用等待大家去开发。

为什么要做这样一套协同框架?多人协同应用开发难在哪?


如 Google Docs、Trello、石墨文档、腾讯文档……各种各样的协同办公工具为什么会受到企业的欢迎?就是因为它们在一定场景中能够解决团队协作的需求,“多人”、“实时”、“协同”是团队协作的关键点。


对于普通开发者来说,开发一个本地的单机版应用很容易,但要从 0 到 1 开发一套支持多人实时协作的应用则要面临底层工程架构、算法相关的复杂问题,技术门槛较高。


在底层工程架构方面,需要关心平台适配、网络、存储等问题,开发者可能需要做 Android、iOS、Windows、Mac、Web 版本、小程序端等多平台的适配;而且还需要关注网络问题的处理,如丢包、无网 / 弱网问题、离线状态恢复问题、网络容灾等等,最终保证信息的实时推送;另外,在数据存储上也需要考虑保证在无网 / 弱网环境下应用的连续性。而在算法方面,如何解冲突?即不同的操作之间的合并、冲突解决等等也是开发者将要面临的问题,因此要设计出满足多人协同的数据结构需要庞大的技术投入。


钉钉面向 To B 的企业级市场,离不开创新产品与技术。因此,钉钉的工程师们开始思考一种方式,如何能够用一套框架解决这个大难题,让开发变得更容易。


钉钉依据技术积累攻克难关

协同框架技术服务架构

在摸索创新的过程中,钉钉工程师们想到:无论多人游戏、多人在线文档编辑还是 IM 聊天等产品,其实都是协同应用,那么是不是有一套通用的协同框架可以被抽象出来?而且能够让上层业务开发者基于这套框架,快速地开发出他自己的协议应用。这是很关键的思考,在这种想法的指引下,最后把协同框架分成三层:协同组件层、协同小程序与数据结构层、协同引擎层。


最上面一层是组件层,叫协同卡片,是可视化的,开发者可以直接拿来用,比如像“一起标注”的画布功能就是一个协同画布组件,本身就具备多端、多人实时协同能力,也已经带有前端的渲染工作。开发者可以用协同组件搭积木式地组装出自己的协同应用。


中间一层是协同小程序与协同数据结构,这是不包含 UI 的数据框架层。提供的小程序 SDK 包含了一系列基础数据结构,类似于 C++ 的 STL、JAVA 的 JDK,SDK 也提供了例如 CoString、CoBoolean、CoMap、CoList 与 CoPixel 这样的基础类型,开发者通过这些数据结构达到多人协同和多端协同的目标。比如开发者想做一个多人协作的 “To Do List”的功能,那么通过使用协同框架,进行简单编程操作即可,并不用关心网络通讯以及复杂的操作合并冲突解决的问题。


最底层是引擎层,如果以上没有开发者想要的能力,也可以根据协同框架开发一个新的数据结构,那么在这层则需要进行很多接口的实现,包括初始化、快照、冲突解决等。相当于依据协同框架开发一个第二层的数据结构,再进行使用。


中间层的小程序框架与数据结构的抽象工作,解决了开发易用性的问题,顶层甚至不用编程直接用组件就可以搭建。协同框架通过上两层的技术服务就可以实现大部分的数字化应用创建,而最底层可能交给高级工程师们去实现。协同框架面向不同的开发者,才能让生态良性发展。

协同框架开放背后,有哪些亮点技术支撑?

攻克这一套协同框架,钉钉采用了很多业界内突破性技术。


数据通道上,协同框架底层的推送通道使用了钉钉的数据同步平台。数据同步平台作为钉钉的基础设施,为钉钉数百个业务提供可靠的服务端到客户端的数据下发通道,提供了统一的海量、可靠、实时、全端覆盖的数据同步服务。数据同步平台同时支持推送实时信令、即时消息、可延时数据等不同时效等级,通过通道隔离、下行数据优先级智能调度、弱网感知优化等多种手段,保障了各个接入业务都能使用到高性能、高可用的数据同步服务。在 2020 年疫情期间,数据同步平台很好地支撑了钉钉的视频会议、IM、DING 等多个重量级产品,每日同步数据数千亿,系统流量高峰时刻 TPS 超过千万。


底层设计上,引擎将协同过程抽象为有限状态机模型,它包括离线工作和跨多设备多用户协同的能力,同时能提高数据的安全性、隐私性、长期保存性和用户控制权,保证在网络状况不佳的环境下,也能够实现无差别协作的工作。比如在弱网、离线情况下,也能保证能够继续进行图片标注,在网络恢复后操作同步。协同框架提供了多平台的 SDK,包括主流移动端、桌面端、Web 端,也包括服务端 SDK。架构设计上基于对等原则,所有接入 SDK 的协同端,不管是客户端、Web 端还是服务端,都是对等 Agent。


同时,多人实时协同问题的本质某种程度上是一个分布式领域的问题,钉钉协同框架结合了操作变换 OT(Operational Transformation)与无冲突复制数据类型 CRDT (Conflict-free Replicated Data Types) 技术,用于实现协同操作合并与冲突解决,并让各个协同端状态达到最终一致。对于不同的协同场景,可以选择其合适的协同算法与协作策略,但这些底层复杂的技术细节,对于使用协同框架的上层业务都是透明的,开发者只需要操作协同数据结构与协同组件即可。


以本次钉钉 6.0 发布的“一起标注”功能为例,这个产品功能的实现是基于名为 CoPixel 的数据结构。CoPixel 本身作为数据层,与 UI 无关,用于承载笔画图形的数据,而 UI 层则通过将 CoPixel 封装为一个协同画布组件。用户在协同画布上每画一笔,都会对 CoPixel 产生对应修改,进而自动协同到所有参与协作的用户端,其他用户端的 CoPixel 会回调 UI 层的画布组件,从而新笔画得到展现。当多名用户同时操作,这些动作会合并并自动解决其中可能产生的冲突。


未来,拓宽边界与开源

协同框架是支持多人、多端、多场景、多应用的,在未来的发展规划中,会不断拓宽边界,发挥协同的最大价值。可以进行跨应用协同工作的打通,实现跨应用、跨设备、跨网络线,实现不同应用的数据共享,比如也许在 CRM 里做某些操作时,ERP 系统也能进行协同,让数据同步。在未来移动开发市场上,也期待协同框架带来的新变革。


协同框架借助了钉钉 IM、文档、小程序、终端研发等团队在以上方面的大量关键技术积累,但也还有很多功能上的问题需要钉钉工程师们持续打磨,对于内部团队来说,还需要修炼内功。未来,协同框架必定会走上开源之路,这也是钉钉在计划内的事情,通过开源,让更多优秀的开发者加入钉钉的生态中来。


写在最后

1 月 14 日的钉钉 6.0 发布会上,宣布了此次战略升级带来的 3 个重要变化:1、推出钉钉宜搭等低代码开发工具,让不懂代码的用户,也能快速开发新应用;2、推出角色工作台,让 CEO、HR、财务、老师等不同角色拥有自己的专属工作台;3、推出全新协同办公套件,让用户可以打破组织边界,进行“以事为中心”的协同。


阿里云智能总裁张建锋也晒出了钉钉的众多成绩单:截止 2020 年 9 月 30 日,有超过 1700 万企业组织、4 亿用户选择用钉钉开启数字化;钉钉开放平台入驻的开发者已超过 27 万,开发应用数 70 万个以上,开发者服务的企业组织数超过 640 万家……


此外,钉钉也将群聊、智能人事、客户管理等核心产品技术深度开放,并总计开放超过 1300 个 API,供开发者、合作伙伴及用户使用。


本文针对钉钉的协同框架技术做了部分解读,管中窥豹,可见此次钉钉战略升级背后的技术也正在向业界深度开放,期待后续协同框架的迭代与完善,我们也将继续关注钉钉技术能力。

2021-01-20 23:282384

评论 2 条评论

发布
用户头像
协同框架开源吗?
2022-10-09 16:26 · 上海
回复
用户头像
1
2021-01-22 16:44
回复
没有更多了
发现更多内容

Python爬虫抢购某宝秒杀商品

弑着去忘记う

后端

tinymce 如何实现动态国际化

Five

插件开发 tinymce 富文本编辑器 8月月更

本周四晚19:00知识赋能第4期直播丨OpenHarmony智能家居项目之设备控制实现

OpenHarmony开发者

OpenHarmony

fastposter v2.9.0 程序员必备海报生成器

物有本末

fastposter 海报生成器 海报编辑器 海报生成 图片生成

超多精美礼品等你来拿!2022年中国混沌工程调查启动

混沌工程实验室

混沌工程

浅谈程序员的职业操守

阿里技术

Tinymce plugins [Tinymce扩展插件集合]

Five

插件开发 tinymce 富文本编辑器 8月月更

安全狗《云原生安全威胁分析报告》首次提出双检测模型

Geek_2d6073

C#/VB.NET 从PDF中提取表格

在下毛毛雨

C# .net PDF 提取表格

Python 教程之输入输出(3)—— 在 Python 中从用户那里获取多个输入

海拥(haiyong.site)

Python 8月月更

mysql进阶(二十四)防御SQL注入的方法总结

No Silver Bullet

MySQL SQL注入 8月月更

《数字经济全景白皮书》金融数字用户篇 重磅发布!

易观分析

金融 数字用户

Mysql重启后innodb和myisam插入的主键id变化总结

知识浅谈

8月月更

什么是研发效能的「黄金三角」?如何助力企业提升效能?

万事ONES

实至名归!九章云极DataCanvas公司荣获智能制造领域多项殊荣

九章云极DataCanvas

智能制造

通过Gitea实现内外网repo管理

DisonTangor

git

深入理解MySQL事务MVCC的核心概念以及底层原理

jiangxl

MySQL 事务 MVCC dba 签约计划第三季

七夕专属限定:1 分钟 Serverless 极速抽盲盒

hum建应用专家

云计算 Serverless

web前端面授培训课程

小谷哥

leetcode 448. Find All Numbers Disappeared in an Array 找到所有数组中消失的数字(简单)

okokabcd

数组 LeetCode 数据结构与算法

Webpack5新特性:使用 Assets Module 处理图片和字体资源

昆吾kw

前端 前端工程化 webpack

SpringBoot如何优雅地进行响应数据封装、异常处理?

程序员小毕

Java 源码 程序员 面试 spring-boot

TiKV & TiFlash 加速复杂业务查询丨TiFlash 应用实践

PingCAP

TiDB

近邻搜索算法浅析

得物技术

深度学习 算法 Faiss 近邻搜索 乘积量化

前端高频面试题

helloworld1024fd

java培训机构与自学的优缺点有什么

小谷哥

易观分析:2022年Q2中国网络零售B2C市场交易规模达23444.7亿元

易观分析

B2C 网络零售

TiFlash 计算层概览

TiDB 社区干货传送门

数据库 分布式数据库 TiDB

下午见!2022京东云数据库新品发布会

京东科技开发者

MySQL 数据库 云计算 安全 数据迁移

Dva.js 新手入门指南

Susie喵~

dva 8月月更

开源一夏 | 分享一款实用的太阳能充电电路(室内光照可用)

矜辰所致

开源 电路设计 8月月更 太阳能

像多人实时编辑文档一样编辑图片,钉钉新功能背后的技术解读_架构_王利莹_InfoQ精选文章