卷首语
作者 | 李冬梅
作为开源大数据项目的发端,Hadoop 兴起至今已经超过十五年。在过去这十数年里,开源大数据领域飞速发展,我们见证了多元化技术的兴起和变迁。
为了从代码托管平台汇聚的海量数据里,通过数据处理和可视化的方式,深刻洞察开源大数据技术的过去、现在和未来,并为企业和开发者在开源大数据技术领域的应用、学习、选型和技术研发等方面提供有益参考,开放原子开源基金会、X-Lab 开放实验室、阿里巴巴开源委员会共同发起了「2022 开源大数据热力报告」项目。
报告从 Hadoop 发展的第 10 年,即 2015 年起,收集相关公开数据进行关联分析,研究开源大数据进入新阶段后的技术趋势,以及开源社区的运作模式对技术走向的助推作用。
经过对最活跃的 102 个开源大数据项目进行研究,报告发现:每隔 40 个月,开源项目热力值就会翻一倍,技术完成一轮更新迭代。在过去 8 年里,共发生了 5 次较大规模的技术热力跃迁,多元化、一体化、云原生成为当前开源大数据发展趋势的最显著特征。
开放原子开源基金会副秘书长刘京娟表示,报告希望重点对如下人群有所帮助:
(1)从事大数据技术研发的企业和开发者。他们可以通过报告,了解大数据技术的发展趋势,从而指引学习方向并提升自身的技能,从技术活跃度的角度为应用开发的技术选型提供一定的参考。
(2)有志于为开源项目贡献代码的开发者。开源大数据细分领域众多、百花齐放,但也存在一些相对薄弱的环节,比如数据安全和数据管理等,开发者可以从多个细分领域切入,帮助这些领域更好地发展。
(3)开源大数据项目的运营者或者维护者。他们能够从优秀项目的热力发展趋势中,获取经验和规律,从而用更成熟的方式运营开源项目。
对于大数据从业者们来说,开源大数据项目热力迁徙背后的技术发展逻辑是怎样的?大家应该如何应对新技术趋势带来的挑战?针对这些问题,近日 InfoQ 与阿里巴巴集团副总裁、阿里巴巴开源委员会主席、阿里云计算平台事业部负责人贾扬清,Apache Flink 中文社区发起人、阿里巴巴开源大数据平台负责人王峰(花名莫问)聊了聊。
目录
热点 | Hot
索赔 649 亿!GitHub Copilot 惹上官司,被指控侵犯代码版权, 是开源社区“寄生虫”
当 Rust 成为“巨坑”:拖慢开发速度、员工被折磨数月信心全无,无奈还得硬着头皮继续
理论派 | Theory
“后 Hadoop 时代”,大数据从业者如何应对新技术趋势带来的挑战?
前端又开撕了:用 Rust 写的 Turbopack,比 Vite 快 10 倍?
推荐文章 | Article
亚马逊将裁员上万人,8 年仍难赚钱的 Alexa 恐面临生死挑战
谷歌计划裁员上万人:利用刚宣布半年的新绩效系统解雇 6%“排名垫底”员工
马斯克开始“整顿”臃肿技术架构?Twitter 工程师叫板:先拿个学位再来指手画脚,技术专家纷纷表示支持
观点 | Opinion
对话 iPod 之父:这不是互联网最坏的年代
构建长久可持续的良性数据库生态,要有个“打持久战”的准备 | 对话沃趣科技联合创始人
专题|Topic
火爆出圈,站上风口的数字人到底是什么“人”?| 十问大咖
十问物联网操作系统:爆发前夜,国内为何加速涌现多种物联网操作系统?
Envoy Gateway 会成为网关现有格局的冲击者吗?| 专访 Envoy 创始人
评论 (2 条评论)