曾经,触屏技术几乎将诺基亚淘汰出手机市场,如今的 AIGC 撼动了谷歌多年的搜索龙头地位地位。就像 API7.ai 联合创始人 & CEO 温铭曾说的,“真正的挑战可能不是来自技术,而是其他完全不同的产品将传统的这些厂商挤出市场。”
每年,Gartner 都会做战略科技的预测,入围的都是当下最流行的技术,也是让各种规模企业、创业者纷纷趋之若鹜的领域。但能改变当下竞争格局的技术并不多。比如 2017 年入榜的区块链,到 2021 时候已经少有人提起;元宇宙也出现了一次后就迅速退出大家视野。
Gartner 近五年战略科技预测,by InfoQ
但人们还是不会放弃追逐每次新出来的技术热点,因为毕竟有 AIGC、云计算这样的例外。大厂们亦是如此。
腾讯云,“卷向”向量数据库
大模型的爆火带红了向量数据库。向量数据库专门用于存储和查询向量数据,业界称之为大模型的“海马体”。
市场方面,根据华福证券推测,到 2025 年,向量数据库将约占非结构化数据处理需求的三成,同时数据向量化后相比传统非结构化数据存储有较大膨胀,因此其价格将会数倍于传统的非关系型数据库产品。
此前,向量数据库赛道仍是创业公司为主。但如今已有不少企业入局,腾讯便是其中之一。
7 月 4 日,腾讯云正式发布 AI 原生向量数据库 Tencent Cloud VectorDB。据介绍,该数据库最高支持 10 亿级向量检索规模,延迟控制在毫秒级,具备百万级每秒查询(QPS)的峰值能力,能够被广泛应用于大模型的训练、推理和知识库补充等场景。
据悉,腾讯云向量数据库提供了接入层、计算层、存储层的 AI 化解决方案,企业原先接入一个大模型需要一个月左右时间,现在可以用三天左右的时间完成。腾讯云向量数据库目前也已经在腾讯视频、QQ 浏览器、QQ 音乐等 30 多款国民级产品中应用。官方数据显示,使用腾讯云向量数据库后,QQ 音乐人均听歌时长提升 3.2%、腾讯视频有效曝光人均时长提升 1.74%、QQ 浏览器成本降低 37.9%。
有统计显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现 10 倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低 2-4 个数量级。
那么,腾讯是如何快速打造出这款向量数据库的呢?
负责向量数据库研发的腾讯云 NoSQL 数据库团队向 InfoQ 表示,他们前后用了两个多月完成了全自研,“走了不少弯路,也踩过很多坑,但最终还是遇见了星辰大海。”期间的更多精彩故事,可以查看《中国卓越技术团队访谈录》(2023年第二季)。
网易伏羲,做个 100%国产的大模型
2022 年,AI 绘画实火。输入三四个形容词,点击“生成”,然后人们就得到了相关的图片。这像不像你给魔术师一张纸,最后他给你“变出”了一张百元大钞?英国科幻小说家 Arthur C. Clarke 曾说过,任何足够先进的技术都等同于魔术。而在 AI 绘画这场“魔术表演”中,大模型就扮演着魔术师的角色。
AI 绘画是 AIGC 重要的应用分支。网易伏羲是从 2018 年开始关注 AIGC 技术在产品中应用可能性的,直到今年的 2023 世界人工智能大会,联合推出了首届 AI 绘画体验,向更多人展示了自己多年的研发成果。对于这次展示,网易伏羲的丹青约提供了技术支持,背后依托于网易伏羲自研的文生图模型“丹青”。
据悉,丹青是网易伏羲自研的中文模型,基于原生中文语料数据及网易自有高质量图片数据训练,为 100%的国产大模型。该模型训练数据经过严格的文本及图片审核,在确保数据来源合规、生成内容合规的同时,使得模型拥有较好的中文理解能力,创作出的作品能更好满足中式审美。
丹青约还充分结合了网易游戏美术设计的工作流,无论是生成图片的美观度,还是满足高质量要求的图片生产(如原画、美术资产等),都做了深入的探索和研发。
丹青模型生成的“天空之城”
网易伏羲 AI 平台团队向 InfoQ 表示,Stable Diffusion 在很大程度上仍是“黑盒”,如果在其基础上进行修改,对模型的优化和控制力是相对有限的。做文生图模型,如果只是简单的重复并无意义,需要走出自己的一条路子。那么,网易伏羲如何摸索出属于自己的路呢?更多精彩内容,可查看《中国卓越技术团队访谈录》(2023年第二季)。
阿里云,做好“提高效能”这件事
讲了 AIGC 的大厂故事,我们再看看云计算的。
作为小型券商,德邦证券面临来自外部市场竞争和内部人员提效的双重压力。在德邦证券内部有多种内部运营系统工具,如 OA 系统、专属钉、工豹等,这些工具在某些情况下是不可替换的。为了深入结合 DevOps,他们需要针对不同场景落地规范协作流程,如确定每个阶段的具体步骤和责任人、要做什么、何时做等问题。
在竞争激烈的现代,高效、持续的交付能力是企业抢占市场先机的重要基础。在多数企业完成上云后,云原生研发效能平台成为越来越多企业和开发团队关注的重点。
云原生研发效能平台建立在云计算基础之上,将现代开发工具、自动化流程和持续交付理念结合在一起。软件开发团队借此能够更加专注于业务创新和功能开发,而不是被繁琐的基础架构和运维工作所束缚。通过云原生研发效能平台,团队可以快速构建、部署和扩展应用程序,缩短产品上市时间,提升市场竞争力。不少企业收益于此,如 Spotify、Airbnb、Pinterest 等。
但国内能建立这样团队的企业并不多。
构建和维护一个完善的云原生研发效能平台需要深厚的技术功底和专业知识。涉及到多种技术栈和开发工具的集成,以及复杂的自动化流程和持续交付机制。这对于许多企业来说是一个巨大的挑战。同时,企业需要大量的资源投入,包括技术团队、硬件设施、云计算资源等。对于一些中小型企业来说,这样的成本可能难以承担。采购成熟的商业产品成了大多企业的选择,德邦证券也是如此。
帮助德邦证券解决难题的阿里云云效团队告诉 InfoQ,这一赛道的工程师往往都带着一些“客服色彩”,“让后端的人,干前端的事,这对团队心性、企业文化是个考验。”那么,阿里云云效团队是如何组建起来的?又是如何随着需求变化而调整策略的?更多精彩内容,可查看《中国卓越技术团队访谈录》(2023年第二季)。
QQ 的一次重构
前端,是非常热闹的一个领域。新的前端框架、库、工具和技术不断涌现,社区里的开发者们积极探讨,共享代码和经验。而前端的技术选型则是备受关注的一点。
今年 4 月底,新版 Windows QQ 正式公测,采用全新 QQ NT 架构,并带来了全新交互界面。至此,QQ 最大的无法跨平台的问题得到了解决。在此之前,Windows QQ 最早用的是 MFC,后来用了 DirectUI、WPF 等,Linux 和 Mac 端则必须使用其他技术,比如 Qt。这三个平台的更新迭代节奏也完全不同。
但引发大家广泛讨论的是,这次重构中,QQ 开发团队使用了 Electron 作为新版 QQ 桌面端 UI 跨平台解决方案。
Electron 是由 GitHub 开发的开源框架,使用 Web 技术(HTML、CSS 和 JavaScript)开发,Web 开发者可以轻松转向桌面应用程序开发,并复用现有的 Web 技能和代码。社区也有许多开源插件和工具。但是,Electron 性能消耗比较大,在处理大规模数据和复杂动画时可能表现不如原生应用。
那么,QQ 是如何考虑这次重构的技术选型的呢?QQ 开发团队向 InfoQ 表示,“我们历史上踩过了很多很多非标准化的坑,一旦某个技术栈热度一过、维护力度不够,它就会成为全新的负债,做选型时必然也是避免再有类似经历。”更多选型细节和过程,查看《中国卓越技术团队访谈录》(2023年第二季)。
活动推荐:
2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。
评论