Linux AI 基金会董事会主席星爵:国产开源需要更多利他主义丨开源创新30人

Zilliz创始人星爵:国产开源需要更多利他主义

2020 年 7 月 07 日

 Linux AI 基金会董事会主席星爵:国产开源需要更多利他主义丨开源创新30人

LF AI 基金会董事会主席星爵:国产开源需要更多利他主义,在技术以及市场均有局部领先优势凸显的情况下,国内基础软件+开源领域真正出现一家具有全球影响力的创新企业的概率极大。


迈入 2020 年,迫于外部环境的变化与调整,一些此前不被看好的开源以及数字化基础设施层项目,也开始迎来了资本市场的重视。


以一级市场上真实的投资案例为例,国内物联网大数据平台涛思数据与云管理软件及服务提供商骞云科技两家企业,均分别在今年各自获得两轮融资。而在国外,开源数据库 CockroachDB、云存储技术服务商 Snowflake 等企业也均有新进融资。


可以说,在全球经济增速下行,科技产业竞争格局日趋加剧的大背景之下,大国之间科技自主可控的需求进一步凸显,而夯实底层技术与产品能力,以开源创新释放新的增长动能,也因此变得极为重要。


近日,InfoQ 特别面向广大新一代信息技术领域的技术中坚群体,正式推出「中国技术力量」之「中国开源创新 30 人」栏目,特别针对国内活跃的开发者社区和企业开源组织生态,重点约访国内主流的开源理念倡导者、企业型开源业务领导者,输出他们对于开源创新、技术前瞻,以及未来企业发展的思考精华。


「中国开源创新 30 人」第 1 期,我们邀请到 Zilliz 创始人星爵以及公司合伙人顾钧接受了我们的采访。2020 年星爵成功当选 Linux 基金会人工智能子基金会董事会主席,这也是中国代表首次担任国际顶级开源 AI 社区的最高职务。


在 Linux 基金会职务之外,星爵于 2017 年创立的 Zilliz 也已先后两次获得资本助力,公司在 2019 年 10 月 15 日正式开源的第一款产品——向量搜索引擎 Milvus,在 7 个月内积累了 300 多家企业级用户。



或许,通过对 Zilliz 以及公司创始人队伍的了解,我们能对国内“基础软件+开源”产业的发展现状有更清楚的认识。


做 AI 时代的 ElasticSearch


在整个 IT 领域,以文本、图像、音频、视频等为代表的非结构化数据,已经牢牢占据了整体数据量超过 80%的比例。而随着 5G、AI、云计算等技术的普及发展,海量数据的爆发已成为必然到来的事实,而非结构化数据所占据的比重与分量,也将越来越重。


可以说,面对海量的互联网数据,如何将越来越重要也越来越基础的非结构化数据进行存储、查询、分析、挖掘和利用,已经成为了 AI 时代极其迫切而又意义重大的事情。


成立于 2017 年的 Zilliz,正是这样一家致力于让机器更快读懂非结构化数据,进而加速产业数智化转型升级的初创型企业。


“在 AI 大数据时代,非结构化的数据必然需要有一些专门的数据处理类企业来做,这就意味着将会有企业发展崛起的机会出现。”这是星爵开始创业的理由。


“我们要做 AI 时代的 ElasticSearch。”提及公司未来发展可能参考的对象,星爵的回答目标性极强。毕竟在美国,ElasticSearch 这家开源从事数据实时搜索与分析的竞对企业,如今已登陆纳斯达克,市值高达 80 亿美元。


在朝着“成为 AI 时代的 ElasticSearch”进发的过程中,Zilliz 所采用的是一种与大多数初创技术型企业都不同的方式——将公司辛苦研发了两年的非结构化向量数据搜索引擎 Milvus 完全开源了。


对于一家初创技术型企业而言,在创业初期就将公司最核心的代码开放出去,无疑是一个非常冒险的决定,毕竟公司技术骨干辛苦研发的代码一下子就这么免费了。要知道,Milvus 研发了 300 多天,在完成 3600 多个 commit、5 次版本迭代和 7 万多行源代码后,才有了 Milvus 的第一个开源版本 Milvus 0.5.1。


除了精力和时间,这一做法在可见范围内的商业回报自然也将大打折扣,看似得不偿失。不过在星爵看来,决定把代码开源,其实是深思熟虑之后的大胆尝试。


一方面,作为被定义为基础软件的产品,一个衡量硬指标就是使用规模。一个基础软件产品或者服务要想覆盖全球数千万家用户,在产品的市场化过程中最重要的方式便是通过开源与用户建立联系与信任,降低营销和获客成本。待用户形成消费习惯再去做服务,这个时候对于新产品的推广会变得更加容易。


另一方面,越是基础层产品,要满足人们普适的需求,长期来看,其成本必须要无限降低并接近于零。当一件产品的成本太高,那么能够使用它的人也势必会减少。


“如果你做一款基础软件,同时还不选择开源,那么你已经输在起跑线上了。”星爵表示。软件正在吞噬世界,而开源则正在吞噬软件。


所幸,由于相比 Facebook 开源的 Faiss 向量搜索库和微软开源的 SPTAG 库,Milvus 能够提供更加完整的向量数据更新、索引与查询框架。开源半年之后,Milvus 已经成功为 Zilliz 带来了 300 多家企业级用户。而一直积极参与 Linux 开源基金会建设的星爵,也于今年 4 月 22 日当选 Linux AI 基金会的新一届董事会主席。


AI 下半场大有可为


在 IT 技术领域,我国在越早期、越基础的层面,往往落后越发明显。反而是在移动互联网、O2O、AI 等新近出现的技术领域,我们已经在一定程度上达到了追赶甚至于齐平国外发达地区的水平。


这一点,市场的反映更为直观。在 PC 时代,我国在操作系统技术层面严重落后,致使国内 IT 产业“少魂”。而到了 4G 时代,“抖音们”已经走出国门,通过技术创新实现了全球市场领先。


在新一轮的智能化产业变革浪潮中,国内市场与海外发达市场站到同一起跑线上竞争,弯道超车的可能性出现,这成为了促使 Zilliz 以更加积极的态度布局 AI 时代非结构化数据的关键。


而在另一方面,在弯道超车的同时,市场领先机会的出现同样坚定了 Zilliz 对于 AI 赛道的押注。


从宏观的经济与科技产业发展哲学角度来看,一个国家和地区经济发展导致的市场需求领先,最后往往能够倒逼技术和产品的领先。“上一轮信息产业发展热潮中,苹果、英特尔等技术公司主要出现在美国,这是有原因的,因为当时的文化、信息技术都是美国领先,市场和需求领先之后倒逼出的产品和技术也是领先的。”


在星爵看来,国内企业的 AI 下半场大有可为。


事实上,在 2019 年计算机领域知名的 CVPR 大会上,来自中国的学者发表的论文数量占总论文数的比例高达 40%,而且最佳论文奖等大奖项几乎全都被华人包揽,这直接证明了我国在 AI 研发以及运用领域的后发优势明显。


受制于教育背景以及环境熟悉等方面的条件限制,人在解决特定问题时,其实并不能够达到 100%精确的程度,大多数在 80%~90%左右。而在这样的辨识度下,目前限定场景下的计算机视觉技术已经能够很好地满足业务处理精度需求,AI 已经局部具备走入真实生活场景并解决问题的能力。


在上一轮以算法和模型为主的产业发展浪潮当中,商汤、旷视等企业取得了先发优势,但随着算法的进步逐渐成为瓶颈,上半场的商业机会和市场红利开始接近尾声;进入下半场,结合具体场景的需求做运用以及进行创新的机会才刚刚浮现,并且势头正旺。


据星爵介绍,目前 Zilliz 有 50 多名员工,其中有 40 多名是工程师,公司正在强化人才以及技术的储备,希望在今年内实现团队人数从 50 多人到 100 人的扩充。然后在 2021 年底突破 1000+用户,达到开源项目的规模效益临界点,并进行商业化探索尝试。


通过开源的方式,Zilliz 正在构建专属于 AI 时代的新型基础设施。


开源需要更多利他主义


对于加在身上的一些职位殊荣,星爵看得很淡。“我更多将它看做是一个责任,期待能够更多的服务于社区,让更多人参与进来,一起创造价值。”在采访过程中,星爵多次提及利他主义这个词。


“在利他主义的驱使之下,前辈们先后开源了 Java、Hadoop、Spark 等一系列项目,让国内企业从中受益。在这种开源利他主义的趋势之下,如果有一天你有机会真正参与到开源项目当中,也把自己的产品开源出去帮助到别人,那会是一件非常有意义的事,同时也是对于前辈利他主义的一个回应。”在星爵看来,积极参与开源,已经上升成为了公司发展的使命。


“开源其实是减少重复造轮子的重要手段,对于一些比较基础的底层技术,如果各家企业都各自闭门研发,必然造成重复投入以及后续市场的恶性竞争。”在 Zilliz 合伙人顾钧看来,通过开源共建的方式促进国内信息技术的创新发展,是产业发展的一剂良方。


但是就目前的情况来看,国内想要真正催生出具有全球性影响力的开源产品,还面临着诸如开源项目商业化模式不清晰,知识产权保护亟需提升,以及市场包容性不强等方面的难题。


长久以来,开源在国内往往被看做是与免费等同的概念,用户对于开源产品的接受度和付费意愿较弱。一旦开源项目得不到市场的认可并形成恶性的商业形态,项目的可持续性就会被打上问号,选择用这一产品的人也就越来越少,于是开源生态想要发展就会变得更难。


“将开源等同于免费本质就是一种开源市场上利他精神缺失的体现,如果你用一家公司的产品,却一直去薅这家公司的羊毛,最后这家公司没能经营下去倒闭了,那其实这对你多少也会带来一些影响。”在星爵看来,开源创新的实现,首先需要建立在一个良性且可持续发展的环境基础上。


结语:国产开源的潜行


目前,国内开源领域的参与者主要可以分为三类:首先是以阿里、百度等大型企业为代表的大型企业开源生态;其次是以鹏城实验室等为代表的,具有一定政府以及产业背景的第三方组织机构;此外才是 Zilliz 这一类由初创型企业组成的开源力量群体。


三类群体中,大企业是开源力量的主力,但他们参与开源的目的更多的在于通过技术能力的外放,提升自身的美誉度,进而达到一定的人才吸引以及企业生态组织的目的。以行业协会或者第三方机构组成的开源群体往往具有一定的行业引导以及治理倾向。而以 Zilliz 这一类初创企业为代表的企业,他们在参与开源的时候往往也伴随着一些获客或者商业化的目的。


在拥有全球最大的用户市场的同时,国内科技产业在新一代的 AI、云计算等智能化技术的发展历程中都具备了充分的技术储备以及先发优势。长远来看,在技术以及市场均有局部领先优势凸显的情况之下,国内基础软件+开源领域真正出现一家具有全球影响力的创新企业的概率极大。


但是我们仍然需要看到的是,在看似一切皆有可能的背后,国产开源开放度与活跃度不高,社区治理以及开发者贡献方面仍然有许多有待于提升的地方。


在国外已经出现了包括 Apache、Linux 开源基金会,以及 GitHub、MongoDB 等不同形态的开源生态参与者时,国内开源生态的形成仍然处于早期发展阶段,后续仍然需要持续耕耘付出,在不断摸索之中潜行。


嘉宾介绍



星爵:Zilliz 创始人兼首席执行官,是一位拥有超过 18 年经验的数据库和 AI 专家,目前还担任 LF AI 基金会的董事会主席。LF AI 是 Linux 基金会旗下的子基金会,支持人工智能、机器学习和深度学习领域的开源创新。 在 Zilliz 之前,星爵在 Oracle 美国总部工作了多年,负责 Oracle 关系型数据库系统研发。他是 Oracle 12c 云数据库项目的创始成员和主要贡献者,目前 Oracle 12c 已累计实现了超过百亿美元的收入。星爵拥有威斯康星大学麦迪逊分校的计算机科学硕士学位和华中科技大学的学士学位。



顾钧:Zilliz 的合伙人、首席布道师,拥有超过 16 年数据库产品经验,他目前还担任 LF AI 基金会的技术咨询委员会投票成员。在 Zilliz 之前,顾钧先后服务过工商银行(数据库工程师), IBM (信息管理产品售前技术专家), Morgan Stanley (副总裁,数据库专家),华为(数据库产品战略规划专家)。顾钧拥有北京大学的计算机科学学士学位。


限量免费采访报道名额推荐[中国新基建50人]、[中国开源创新30人]



「中国技术力量」之「中国新基建 50 人」以及[中国开源创新 30 人]系列专题报道火热进行中,我们长期专注于发现新基建以及技术开源领域内驱动产业数字化转型、智能升级、融合创新的科技型组织机构、企业部门 ,并将重点采访其中的产业发展引领者,技术部门中坚力量等人士,深度传播他们对于新基建、开源创新等方面的技术理解、产业需求以及商业化探索尝试。欢迎大家点击超链接申请免费采访报道名额:>> [中国新基建50人]、[中国开源创新30人]


2020 年 7 月 07 日 08:082678

评论

发布
暂无评论
发现更多内容

阿里巴巴Java开发手册-日志规约

魏杰

第十二周学习总结

赵龙

一文说透"静态代理"与"动态代理"

洋仔聊编程

源码分析 动态代理 静态代理

Android中的特殊攻击面(二)——危险的deeplink

OPPO安全

android 安全攻防 安全

打开 政务上链 应用场景

CECBC区块链专委会

区块链 数字身份 政务

数字货币交易系统应用开发,区块链交易所app

13530558032

收藏!一篇教会你写90%的shell脚本!

洋仔聊编程

Shell shell脚本编写 收藏教程

Android 中的特殊攻击面(一)——邪恶的对话框

OPPO安全

android 安全攻防 安全

隐秘的MySQL类型转换

flyer0126

MySQL

为什么阿里巴巴的程序员成长速度这么快,看完他们的内部资料我明白了

Java迁哥

【架构师训练营】第 12 周作业

花生无翼

大数据

GalaxyCreater

大数据

区块链USDT支付系统,USDT承兑支付软件开发

13530558032

交易所合约跟单系统源码开发,合约跟单平台搭建

13530558032

超声大数据应用

周冬辉

大数据

前端源码宝库

InfoQ_34a83d636158

云小课 | 一份超实用的勒索病毒自救预防指南

华为云开发者社区

勒索病毒 弱密码 云小课 企业主机安全 病毒云查杀

Git技术干货!工作中"Git"的使用实践和常用命令合集!

洋仔聊编程

git git常用命令 git常用实践 工作中git的使用

第十二周作业

赵龙

大数据应用

GalaxyCreater

大数据

释放数据价值:DAYU数据运营新能力解读

华为云开发者社区

大数据 数字化转型 华为云 代码原理 数据运营

Android的特殊攻击面(三)——隐蔽的call函数

OPPO安全

android 安全攻防 安全 函数

加密数字货币钱包APP系统开发,数字货币钱包系统定制

13530558032

大数据作用

SpreadJS 纯前端表格控件应用案例:Teammark知识管理库

Geek_Willie

SpreadJS

非传统的“易观”,和他的技术驱动之路

易观大数据

后疫情时代 数字经济如何大显身手

CECBC区块链专委会

疫情 数字经济 数字技术

图解图库JanusGraph系列-一文知晓“图数据“底层存储结构(JanusGraph data model)

洋仔聊编程

janusgraph 图数据库 存储结构 图解源码分析

不按套路出牌的阿里面试官:“刁难”面试者常用套路,你中招了吗

周老师

Java 编程 程序员 架构 面试

首发!阿里面试官总结从零到架构面试宝典,是时候让面试官懵逼了

周老师

Java 编程 程序员 架构 面试

区块链技术创新应用势在必行 食品药品开启全链条溯源时代

CECBC区块链专委会

区块链 溯源 药品

 Linux AI 基金会董事会主席星爵:国产开源需要更多利他主义丨开源创新30人-InfoQ