写点什么

利好信息不断,国产基础软件的变局到了吗?

  • 2021-02-24
  • 本文字数:5181 字

    阅读完需:约 17 分钟

利好信息不断,国产基础软件的变局到了吗?

对话嘉宾 | 星环科技 CEO 孙元浩

采访 | 极客邦科技 CEO 霍太稳

整理、编辑 | 冯垚


2013 年, 孙元浩离开了就职 10 年的英特尔,同年创办星环科技,正式开启了基础软件国产化之路。英特尔 10 年,他经历了从底层 BIOS 到操作系统内核再到编译器的磨练,创业之后便专注于数据库领域。7 年时间,星环科技已全面覆盖基础软件领域的产品和服务。知名分析机构 Wikibon 更将星环科技评价为“产品策略对西方供应商非常具有指导意义的中国公司”。


孙元浩表示:“颠覆发生时,大家都在同一起跑线上,这正是我们超越的机会。”


随着分布式架构的推广和普及,传统的各 IT 产业的技术栈正在发生颠覆,一个颠覆性的变化,必将产生一个新的领军者,而颠覆的时代也给了星环科技获胜的希望。


2020 年,“新基建”迅速升温,5G 建设、数据中心、人工智能、工业互联网等新兴技术汹涌而至,对于“默默无闻”的基础软件的国产化而言,需要把握时机,并将其变成中国基础软件发展的一个重要节点。



视频观看地址:https://v.qq.com/x/page/m0969oyzbyk.html


极客邦科技 CEO 霍太稳(Kevin) 在采访结束后感慨道:


“星环科技这 7 年的经历,更像是一部国产基础软件的缩影。2013 年孙总从‘外’到‘内’的跨越,开启了星环科技自研的道路;2015 年,重构 Hadoop,代表了星环科技对抗竞争的呐喊;2018 年,通过 TPC-DS 测试,星环科技更是完成了超越。但基础软件国产化之路依旧漫长,长期来看国产基础软件的发展,一方面需要国家的重视与扶持,另一方面则需要科技企业不断的自主创新,拥有属于自己的竞争优势。”


星环科技是一家怎样的企业,其发展过程中经历了哪些重要阶段,现阶段的产品和技术能力如何?关于未来是如何规划的?我们一起从对话中获取一些关键信息,更详细的内容请点击视频查看。


Kevin:给公司取个好名字,是创业的第一步,“星环科技”是否有什么特别的寓意?


孙元浩:因为我是一个资深科幻迷,在创办星环科技之初,刷了三遍《三体》三部曲。中文名字的由来源自《三体》里面的星环集团,英文名字则源自《星际迷航》电影。寓意着公司未来能聚集世界上最优秀的科学家,打造世界上最领先的技术,探索属于未来的技术


并且我自己也留了一点点私心,希望用 Transwarp 这个名字来表示我创业的决心。Transwarp 是《星际迷航》电影中的一种超高速引擎技术,它是所有科幻小说和科幻电影中最快乐的。所以我用这个名字来表示星环科技将会打造最快的大数据处理引擎,他人无法超越。


Kevin:7 年星环,在市场探索和产品创新上,您的经验是什么?


孙元浩:这 7 年,我们一直在调整,无论是技术、市场还是销售。创业初期,我们专注于分布式的内存引擎,但由于内存容量过小,我们放弃了。于是我们又着眼于数据集市,但很快也发现它市场需求较小,不利于星环科技的发展。


再次放眼市场,星环科技发现,用户数据量激增,数据的存储和分析才是未来的重点。2013 年底我们开始调整方向,专注于大规模批处理。2014 年 9 月,我们的产品方向全面转向数据仓库产品,主要参考了大数据的四个 V 来定义产品。即:用分布式的分析数据库来解决数据量大的问题,用 NewSQL 数据库来解决多种数据结构异构数据的问题,用流处引擎来解决实时处理的问题,用机器学习算法来解决价值的问题。


随着时间的更迭,我们发现用户在处理数据时会涉及多种结构,在分析数据时也会涉及多种数据类型。今天,我们看到国外仍然是几十种数据库,于是我们意识到,应该有一个统一的平台。于是从 2015 年开始,我们对产品提出了重大革新,在这个过程中开源 Hadoop 已经完全不能适应这种变化了,就决定做原创的底层架构。


我们原本可以用开源软件去打造个应用,这样可能收益还能高一些。但我们觉得底层的软件如果不能实现突破的话,上层应用还是非常受限的,所以我们还是选择去做自己原创的基础软件。经过数年的实践,公司在技术上树立了自己的技术特色,拥有了 1600 多个高质量用户。所以到今天回过头来看的话,还算比较欣慰!


目前,星环科技全面布局“ABC”领域,分别为人工智能、大数据和云平台。主要产品包括 Transwarp Sophon 人工智能平台,Transwarp Data Hub 大数据平台和 Transwarp Data Cloud 大数据云平台。从底层的容器层到上面的这个大数据层,再到 AI 的工具层我们基本都有覆盖。


Kevin:在星环科技创立之初,搭建初创团队班子时有哪些标准?


孙元浩:创业之初组建的团队,是一群拥有相同梦想的人,大家都是看到了中国基础软件的希望,想拿出自己的产品与国外领先技术一争高下。那个时候招人几乎是靠人品和信念的,没有高工资和优越的工作环境,而且还是拼命的状态。


因此,星环科技树立了自己的企业文化,强调两点:第一,要有坚定的信心,一切敌人和对手都是可以被击败的;第二,认可星环科技追求卓越的企业文化,努力成为世界一流的大数据公司。


当公司步入正轨后,我们就开始关注与开发者和高校师生的互动,甚至我们在高校里开设课程,提前让学生了解行业的最新技术。并且也在招聘大批实习生到公司实习,这样优秀的学生就可以留下了。


Kevin:您怎么看国产基础软件的发展现状?


孙元浩:这是一个技术革命的时代,当颠覆发生,大家全部都在同一起跑线上,这正是我们超越的机会,我认为在未来的十年,将是中国基础软件发展的黄金期。


一方面,中国实的市场需求庞大,特别在大数据领域,数据量更是庞大,单个用户可以达到了 10TB 量级以上。另一方面,国内用户的需求多样,较少存在遗留系统的问题,国产基础软件的发展,将成为大势所趋。


如果我们沿着旧路线走,其他公司已经走了 30 年、40 年了,技术壁垒很难逾越。但随着计算的演进,未来将是分布式的时代,分布式架构将颠覆整个 IT 产业的技术栈,这预示着我们实现超越的机会真的到来了。


Kevin:如今国家层面也开始重视在基础设施上的投入,我觉得对于咱们来讲是一个非常好的契机,星环科技在这样一个大的趋势下,有没有要去做一些顺势而为的事情?


孙元浩:新基建的推行确实将成为中国经济转型的一个重要抓手,国家也将数据作为新型生产要素写入了文件,正在开始逐渐重视基础软件发展。


众所周知,过去多年中国的硬件基础设施得到了飞速发展,但基础软件的技术门槛较高、投入大、周期长,造成整个基础软件领域长期缺少关注度。随着国内 5G、人工智能、工业互联网、物联网技术的成熟发展,企业数字化转型已成为共识,在政府层面确实注意到了新型基础设施的重要性。例如,最近一直都在提的数字化政府、一网统管、一网通办等等,通过电子化手段来实现政府行政审批的简便化。


最重要的是,不仅政府应提高对新基建的重视,还需将这种意识渗透到各个行业中。可以看到,目前各行业的数字化转型是参差不齐的,比如金融行业水平较高,交通、制造业等还处于起步阶段。


星环科技作为专注于大数据和 AI 的基础软件公司,我们希望在这个历史大潮当中能够发挥我们的作用,也能够帮助我们的客户克服这些技术难题,提升他们数字化水平,快速实现转型,进而提升整个社会的数字化水平,助力国家新基建建设。


Kevin:大数据领域未来的技术发展方向有哪些?


孙元浩:首先简单回顾下大数据的发展历程,具体分为大数据 1.0、2.0、3.0 时代。1.0 时代,使用单机 MapReduce 做大规模的数据处理。2.0 时代,Spark 作为为主流的计算引擎成功替代了 MapReduce。3.0 时代,技术上出现五个层面的融合:融合的数据平台,融合的大数据分析语言,BI 和 AI 的融合,大数据、人工智能、云计算的深度融合,应用、数据、服务相互促进,并融合成为生态。


如今跨入到 3.0 时代,作为一家国产基础软件企业,星环科技提出了大数据、人工智能技术与云计算结合的理念。星环科技注意到,一个既实现高并发访问又能做批处理的平台将会成为刚需,用来解决客户多种结构牵扯多种数据库产品的困扰。于是,建立了自研的多模态的异构的数据处理平台。


通过接近 7 年的技术积累,星环科技提出了“四层统一、一层异构”的未来技术趋势。具体分为资源调度层统一、 分布式存储管理层统一、计算引擎统一、接口层统一和存储引擎层异构:


  1. 引擎层与接口层


星环科技认为单个引擎能应该采用动态调度机制,这意味着引擎层要实现统一。重构后的引擎层可以实现图处理、图分析和查询,同时也能达到搜索和 SQL 的目的,当然也可以保证结构化处理。单一的数据平台,从用户角度来看更方便、更易用。


当然星环科技也走过弯路,以前做的数据联邦,因为引擎没有统一,所以只能在接口层 SQL 层统一,然后将 SQL 分发到不同数据库上。但这种发放为静态划分,意味着如果是对两个数据库同时进行 Join,静态划分根本无法实际满足需求,所以动态调度机制已经成为大势所趋。


  1. 分布式存储管理层


星环科技通过 1200 万行软件代码的编写,逃离了原始 Hadoop 框架的束缚突破,抛弃掉 HDFS。我们正是看到了分布式文件系统效率低下,为了降低数据库的时延,摒弃以文件方式的读取形式,采用星环科技自研的存储结构,提高数据的读取效率。实现由不同的操作引擎来决定数据的分片、保障一致性和可靠性。


  1. 调度层


统一资源调度层,弃用通用性不强的 YARN 技术。2014 年底我们就意识到,用 YARN 技术来实现资源调度,不能实现资源有效隔离,只能支持 Hadoop 生态里面的组件,不支持其他应用。我们希望能打造一个通用的资源调度层,能够支持所有的分布式框架的各种计算引擎,同时也能支持单机的应用。


  1. 基础设施层


星环科技基于 Kubernetes 框架,实现了调度层、网络层和存储层的统一,实现了支撑所有大数据的各种计算引擎。而随着企业部署 IT 系统的加速,单个数据中心已无法承载企业的数据和应用,企业需要数据在多个数据中心之间能够互联互通,同时横跨私有云、公有云,为此星环科技提出了联邦云的概念。


Kevin:创新促使星环科技不断前进,6 月 5 日作为星环科技成立七周年的日子,星环科技是否准备了大动作?


孙元浩:2020 年 5 月 15 日,星环科技举行了新产品发布,全面升级“ABC”三条产品线。大数据平台 TDH7.0 首次亮相,主要针对解决用户普遍存在的不同数据库产品切换不便的问题。其中包含了我们称之为叫异构、多元、多模的数据处理平台,我们认为它代表了最新数据处理的研究趋势。


同时,我们发布了联邦云产品,它是能够解决多个数据中心,甚至是跨国数据中心之间的互联互通问题。还有我们的产品组合形成了一系列的解决方案,包括知识图谱、工业互联网、金融风险分析等。


此外,2020 年星环科技将在 AI 领域持续发力,目前提供机器学习的建模工具与知识图谱的构建工具。在知识图谱产品中星环科技将知识图谱和深度学习融合,更易于精准捕捉隐藏的图谱结构。更多星环科技 2020 年全新产品战略的详细资料,可登录星环科技官网或者关注星环科技微信公众号了解。


Kevin:我了解到星环科技在技术研发的投入还是比较大的,想了解一下,星环科技与英特尔成立联合技术创新实验室的目的?


孙元浩:不难看出硬件的变革推动了软件的变革,只有充分了解硬件技术的最新动态,才能更好的进行软件创新,所以我们是非常重视硬件的变化的。又因为我们的创业团队很多人在英特尔工作多年,了解英特尔在硬件上的创新速度,比如最近的存储技术。


当然我们同时也在跟世界其他顶尖的科技公司开展合作,我们的目标还是希望能够保持一个开放的心态,能够促进技术的进步。同时也可以保持星环科技的技术创新频率,让我们能够时刻保持领先的位置。


Kevin:除了技术合作,星环科技还有哪些保持技术独特性和领先性的办法?


孙元浩:从企业的角度来看,保持创新是必要的、必须的,CEO 需要以身作则时刻提醒大家应当不断前进。


第一,以客户为中心。由于实际生产当中,客户的问题都较为复杂,要求一线经理能下一线,真正去了解客户的需求,解决客户的问题。时刻以客户为中心,将解决客户问题做为驱动力才是取胜之匙。


第二,追求卓越的企业文化。我作为 CEO,希望凡事做一件事情,一定要做到完美,不能凑合就结束了,我的要求是一定要做到最好。这样的严于律己,才能将其设定为企业文化,才可以要求所有的员工精益求精。


第三,研发制度的苛刻。星环科技将产品三个维度:功能、性能、易用性三个维度,规定每个季度发布一个版本,并且务必要有功能增强、性能改进或者稳定性提升。从制度上面确保产品的迭代速率,不停实现创新。


Kevin:星环科技发展了七年,孙总觉得有没有达到您理想中的样子。或者说星环科技目前的发展您觉得成功了吗?


孙元浩:我觉得一家企业要成功可能需要十年,七年还不够,我们还要再奋斗。现在只能说我们初步在技术上、市场上有一些成果,但还是远远不够的,我们希望能够瞄准更高的目标实现前进,希望能在十年这个时间点上,我们能够达到一个新的里程碑。


星环科技不仅是孙元浩的个人转型,更是国产基础软件发展的预演。在基础软件国产化成为国家战略竞争制高点的今天,星环科技将顺势而为用 1200 万行软件代码搭建国产基础软件的壁垒,影响着未来国产基础软件的发展之路以及世界对中国技术的认知。

2021-02-24 08:423650

评论

发布
暂无评论
发现更多内容

After Effects 2024 for Mac(AE2024视频特效工具)v24.0.1完整激活版

mac

苹果mac Windows软件 视频特效软件 After Effects 2024 AE2024

什么样的网站才是利于google等搜索引擎优化的营销型网站

九凌网络

今年秋招VS去年秋招!我滴娘啊

王磊

Java

闭包解密:从小白到高手,掌握Python中的闭包技巧

高端章鱼哥

Python

第24期 | GPTSecurity周报

云起无垠

Databend + lakeFS:将数据版本控制嵌入你的分析工作流

Databend

如何使用 NFTScan NFT API 在 BNB Chain 网络上开发 Web3 应用

NFT Research

NFT\ NFTScan API 接口

亚洲专业美发行业领军企业汉高中国签约赛博威,以TPM营销费用管理推进企业业务数字化改革

赛博威科技

测试工作的价值体现

BY林子

软件测试 软件质量 测试的价值 绩效考核

ApeCoin DAO猿岛质押游戏系统DAPP开发

薇電13242772558

NFT

语音识别技术在智能门禁系统中的应用与设计

来自四九城儿

文心一言 VS 讯飞星火 VS chatgpt (126)-- 算法导论11.1 1题

福大大架构师每日一题

福大大架构师每日一题

接上回,如何用 LlamaIndex 搭建聊天机器人?

Zilliz

Milvus 向量数据库 ChatGPT LLM

低代码开发,或许是节约成本更好的选择

树上有只程序猿

软件开发 低代码

外贸业务员必学的外贸推广方式

九凌网络

TDengine 3.2.0.0 重磅发布!S3 存储 + IP 白名单正式上线

TDengine

tdengine 时序数据库

你不知道的ER图秘诀,都在这篇在线教程里了!

职场工具箱

ER图 实体-关系图

初识inBuilder内存计算模块--业务数据同步

inBuilder低代码平台

数据库

语音识别技术在教育领域的应用与挑战

来自四九城儿

nebula-br local-store 模式,快速搭建主备集群实践

NebulaGraph

容灾备份

跨国传输的常见问题与对应解决方案

镭速

跨国数据传输 跨国传输 跨国传输软件

可视化流程编排(Bpmn.js)介绍及实践

ZA技术社区

众安科技 众安保险 ZA技术社区 无界山

外贸建站优化外贸网站推广的四个技巧

九凌网络

专业ER图工具大盘点,哪款是你的菜?

职场工具箱

ER图 设计数据库模型

LeetCode题解:993. 二叉树的堂兄弟节点,BFS,JavaScript,详细注释

Lee Chen

LeetCode

带你认识一下多模态对比语言图像预训练CLIP

华为云开发者联盟

人工智能 华为云 科技 华为云开发者联盟 多模态对比

软件测试/测试开发丨UbuntuServer环境准备

测试人

软件测试

我应该删除低质量页面以提高Google排名吗?

九凌网络

聊点技术|秒级根因定位可能吗?博睿数据将不可能变为可能

博睿数据

运维 监控 可观测性

利好信息不断,国产基础软件的变局到了吗?_大数据_冯垚_InfoQ精选文章