写点什么

面向未来的黑科技——UI2CODE 闲鱼基于图片生成跨端代码

  • 2019-07-08
  • 本文字数:1936 字

    阅读完需:约 6 分钟

面向未来的黑科技——UI2CODE闲鱼基于图片生成跨端代码

DEMO 演示

一直以来,如何从‘视觉稿’精确的还原出对应的 UI 侧代码一直是端侧开发同学工作里消耗比较大的部分,一方面这部分的工作比较确定缺少技术深度,另一方面视觉设计师也需要投入大量的走查时间,有大量无谓的沟通和消耗。


闲鱼团队在去年做了一个很特别的黑科技基于图片直接翻译成对应的 UI 侧代码,具体完成的部分,我们有一个演示的视频。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00

    选型背景

    很多人会比较好奇,为什么我会坚持使用图片做为输入源,一方面基于 sketch 或者 photoshop 等插件相对容易拿到确定性的信息,图片在某些方面容易丢失一些特征;另外基于图片的分析其实挑战更大。我们做这个选择有以下原因,首先图片作为最终的产出物,更直观和确定性,另外这个链路里对上游不会有约束性。最后也是最重要的一点基于图片的应用场景会更普适,类似场景例如自动化测试能力的支持,基于竟品直接截图来套用我们自己的数据源找体感,等场景是其他的方案做不到的。


    上面我们在讲项目本身的意义和选型上的一些判断,后面我们会简单介绍下项目的基本流程。

    流程介绍

    首先我们会使用深度学习的方式,来找到对应的 UI 单元,包括基础的 UI 组件,例如 imgview \ textview 等,接下来是自定义的 BI 组件例如 price 等,最后我们会寻找已经被实现过的业务组件。下面是一个常见的业务场景,我们框选了每个对应的部分,演示上面的业务逻辑。



    接下来我们会基于已经检测出的元素,来做对应的元素提取,这个部分我们会去分析系统渲染的原理并使用 opencv 的方法来做对应的功能。


    项目整体的流程,我们用下面的这个图来表示。



    在整个项目落地的过程中,我们遇到很多的技术困难的点,下面我会讲 2 个有意思的点。

    架构演进

    第一个我们会发现 autoui 的整个流程结构是一个非常典型的上下游的流形式,每个关键的单元都会依赖上游的输出,并且为下游提供标准的输入,我们在项目的开始时候,因为没有特别好的去定义切分的关系,经常会出现当一个同学调整和 PUSH 代码后,会对整个链路造成很大的影响,所以我们对架构设计做了一个关键的升级我们定义叫流式的架构,我们用一个图让大家更好的来理解这一块。



    在这个单元里我们定义了 unti,tasks,server 三个单元,unit 本身是最小粒度的功能切分,tasks 是 unit 的组合,server 会提供具体的服务,每个部分都会为上下游提供输入和输出,架构切分的好处是,所有的模块都有标准的输入和输出的部分,我们可以通过对模块的 MOCK 来解决标准化调试的问题,另外当一些基础的功能完成后,我们可以通过搭积木的方式来组合自己想要的 tasks 和 server,在我们做了架构调整后,因为整体的切分更合理,也减少了上下游的依赖,对项目的快速迭代产生了很大的帮助。


    后续在架构侧我们还做了一个有意思的点,因为我们的服务有些是需要跑在服务端,有些是需要跑在客户端上,所以我们设计了一个可以在客户端和服务端同构的场景,目的是希望开发的人员只需要关系界面和服务的通信,但并不需要关注具体服务的部署关系。


    布局问题分析

    上面我们讲了一个架构的设计,后面我们希望讲一个具体的布局问题具体解法,把静态的 DSL 转成一个合适的布局属性的 TREE,在这个部分我们还是分析了能产生布局的因素,如下图所示。



    这样一个非常常见的布局,我们拆分出了影响布局的部分,通过元素位置、间距、容器位置分析,我们参考了 flex 布局的标准,也参考了新的 grid 的布局标准,通过枚举元素在位置中站位的比例,来得出对应的关系。


    但是我们最后还是遇到一些 Bad Case,如何写出更贴近人写出的 UI 侧代码,我们还是需要去参考类似语意的部分,相似度的部分我们才能得到真正合理的布局,例如上面的这个例子,如果按照枚举的布局去推断的话,我们很容易得到一个四个横列的布局关系,但是通过语意和相似度的部分,我们会很容易的推断出一个 gridview 的布局关系。

    现状和未来

    去年整体我们已经比较好的让整个工程在业务侧开始跑起来开始让大家能解放出来做一些更需要思考的事情,并把我们的项目展示给了 Google 团队,也得到了很多的关注。


    未来,我们还是希望通过更好的分析能力(包括容器识别、复杂的背景识别、精确的语意理解能力),产生出更接近开发人员手写的代码,从而完全取代‘切图’这个工作,另外我们也在看在这个阶段我们已经能够让机器来解放开发链路的最前面一段,后面在一些弱交互、强展示的部分,例如导购或者营销这样的场景,我们其实通过数据模型的抽象和识别、甚至固定的 PRD 的识别有可能我们是能真正的解放整段的人力投入,让大家从偏确定性的需求实现中解放出来。另外我们也开始和 D2C 这样的项目一起共建,希望在闲鱼里已经实现的部分,能够解决更多人的问题,解放更多的生产力。


    本文转载自公众号闲鱼技术(ID:XYtech_Alibaba)


    原文链接


    https://mp.weixin.qq.com/s/hajHNqsy708vfHk1wYUN_w


    2019-07-08 08:005573

    评论

    发布
    暂无评论
    发现更多内容

    Forsage智能合约系统APP开发|Forsage智能合约软件开发(现成)

    系统开发 现成系统

    漫画:什么是 “智能供应链” ?

    京东科技开发者

    云计算 供应链 智能供应链

    甲方日常 61

    句子

    工作 随笔杂谈 日常

    算力 | 手写红黑树

    九叔(高翔龙)

    数据结构 算法 二叉树 红黑树

    Linux常用命令速查

    jiangling500

    linux命令

    深度剖析github star数15.1k的开源项目redux-thunk

    徐小夕

    Java GitHub 大前端 React

    冰河教你一次性成功安装K8S集群(基于一主两从模式)

    冰河

    Docker 云原生 k8s

    智能新时代 安全新未来 首届国网北京电力人工智能数据竞赛正式启动

    极客播报

    有奖讨论|作为程序员,女朋友是怎么吐槽你的?

    Simon郎

    女朋友 话题讨论

    Gradle doesn't run because it can't find tools.jar in JRE

    mengxn

    kotlin Gradle

    深入浅出 Go - sync.Pool 源码分析

    helbing

    Go 语言

    关于Mysql常用数据类型的小抄

    xzy

    MySQL

    架构第十一周作业

    Nick~毓

    GO训练营第2周总结

    Glowry

    创业项目快速分析框架

    boshi

    创业 商业

    《华为数据之道》读书笔记:第 10 章 未来已来:数据成为企业核心竞争力

    方志

    数字化转型 数据治理

    修炼码德系列:简化条件表达式

    Silently9527

    Java 经验分享 代码重构 代码规范

    《穿越数据的迷宫》笔记:第1章 数据管理的重要性

    方志

    数据治理

    为什么边缘计算将终止云计算?

    VoltDB

    数据库 云计算 数据分析 边缘计算

    高速公路二维码定位报警系统搭建解决方案

    t13823115967

    高速公路二维码定位报警 智慧公安

    华为工程师又爆一份“架构师宝典”,价值百万薪“史诗级”操作系统,送你备战金三银四要不要?

    编程 程序员 计算机网络 操作系统

    360OS张焰:AI视觉在教育中的应用

    ZEGO即构

    《穿越数据的迷宫》笔记:中文版序二

    方志

    数据治理

    Appium之测试微信小程序

    清菡软件测试

    App

    整天都在讨论使用SpringBoot,可你居然连缓存都不清楚

    小Q

    Java 缓存 学习 面试 springboot

    线程池 ForkJoinPool 简介

    Java老k

    Java 线程池 forkjoinpool 工作窃取

    EXCEL、图片处理常用技巧

    jiangling500

    Excel 图片处理

    AnyRTC --- Flutter 实现视频通话

    anyRTC开发者

    flutter 音视频 WebRTC 跨平台 sdk

    数据结构与算法系列之跳表(GO)

    书旅

    数据结构 算法 Go 语言

    区块链落地开发,区块链版权应用搭建

    t13823115967

    区块链+ 区块链落地开发 区块链版权应用搭建

    Spring 源码学习 04:初始化容器与 DefaultListableBeanFactory

    程序员小航

    spring 源码 源码阅读

    面向未来的黑科技——UI2CODE闲鱼基于图片生成跨端代码_AI&大模型_青页_InfoQ精选文章