QCon 全球软件开发大会(北京站)门票 9 折倒计时 4 天,点击立减 ¥880 了解详情
写点什么

腾讯开源高性能图计算框架 Plato,十亿级节点图计算仅需数分钟

2019 年 11 月 14 日

腾讯开源高性能图计算框架Plato,十亿级节点图计算仅需数分钟

腾讯开源再次迎来重磅项目,14 日,腾讯正式宣布开源高性能图计算框架Plato,这是在短短一周之内,开源的第五个重大项目。


相对于目前全球范围内其它的图计算框架,Plato 可满足十亿级节点的超大规模图计算需求,将算法计算时间从天级缩短到分钟级,性能全面领先领先于其它主流分布式图计算框架,并且打破了原本动辄需要数百台服务器的资源瓶颈,现在,最少只需要十台服务器即可完成计算。


腾讯 Plato 团队负责人于东海表示:“Plato 已经赋能腾讯内部包括微信在内的众多核心业务,尤其是为腾讯超大规模社交网络图数据的各类计算提供支撑,解决了现有其他计算框架无法在有限资源和有限时间内完成计算的难点。Plato 不仅为腾讯创造了巨大的业务价值,开源后还将持续推动图计算技术和行业的协同发展,加速创新。”


实际上,图计算的“图”并不是指普通的图像和照片,而是用于表示对象之间关联关系的一种抽象数据结构,图计算就是以图作为数据模型来表达问题并予以解决的过程。图计算可以将不同来源、不同类型的数据融合到同一个图里进行分析,得到原本独立分析难以发现的结果,因此成为社交网络、推荐系统、网络安全、文本检索和生物医疗等领域至关重要的数据分析和挖掘工具。


Plato 是腾讯内部图计算 TGraph 团队整合内部资源自主研发的一款高性能图计算框架,取名 Plato 是为了致敬伟大的数学家柏拉图,目前腾讯云大数据团队正在封装 Plato,即将对所有开发者开放使用。


据了解,Plato 的计算性能方面极其强悍,比目前市场上最为领先的图计算框架 Spark GraphX 还高出 1-2 个数量级,它将算法计算时间从天级缩短到分钟级,性能提升数十倍,也标志着图计算全面进入分钟级时代;另外一个巨大优势是,Plato 在内存消耗方面远小于主流的图计算框架,比 Spark GraphX 减少 1-2 个数量级,仅需 10 台服务器左右的中小规模集群,即可完成超大规模图计算,相比此前动辄需要数百台服务器的限制,资源压力和计算成本都得到了极大降低。


目前,Plato 主要提供两大核心能力:腾讯数据量级下的离线图计算和腾讯数据量级下的图表示学习。同时 Plato 天然适配 Kubernetes、YARN 等资源调度平台,并提供支持主流文件系统的多种接口,能为开发者提供更友好的运行环境。


架构设计上,Plato 框架的核心是自适应图计算引擎,它能够根据不同类型的图算法,提供多种计算模式供开发者灵活选择,包括自适应计算模式、共享内存计算模式和流水线计算模式等。另外,还设计了良好的接口支持接入新的计算通信模式。



Plato 整体架构图


在计算引擎之上,Plato 为算法设计者或具体的业务提供多层次接口:从底层的 API,到图算法库,再到为具体业务量身打造的“解决方案”——图工具集。通过这些应用层的接口和工具,Plato 还可以把离线计算结果与其他机器学习算法相结合,共同支撑顶层的不同业务。


值得一提的是,目前 Plato 的算法库中的图特征、节点中心性指标、连通图和社团识别等多种算法都已经开源,未来还将进一步开源更多的算法。


Plato 高性能、可扩展、易插拔的特性在社交网络、推荐系统、生物医疗等领域应用前景广阔,例如定期对网页进行影响力排序以提升用户的搜索体验、分析庞大的社交网络结构以便精准地为用户推荐服务、通过子图匹配等方式了解蛋白质间的相互作用从而研制更有效的临床医药等。


2019 年 11 月 14 日 12:462341

评论

发布
暂无评论
发现更多内容

Docker部署ClickHouse监控平台

wjchenge

在有限的时间里,拿到通才的帐号,登入无限的游戏。

叶小鍵

超干货 (实战经验)结合公司业务分析离线数仓建设实践

五分钟学大数据

大数据 数据仓库 28天写作 3月日更

打造移动版的开发环境

雨夜的博客

php vagrant 移动版开发环境

程序员之禅(五)十条准则

每天读本书

读书笔记 每天读本书

kvm

梅花鹿鹿

kvm

要拥有必先懂失去怎接受——浅谈前景理论

Justin

心理学 28天写作 游戏设计

面试官就是这么欺负人:new Object()到底占用几个字节?

xcbeyond

Java java对象分析 3月日更

旧区块链思维面临淘汰

CECBC区块链专委会

区块链

加快推进数据确权与资产化 发挥区块链技术信用机制优势

CECBC区块链专委会

区块链

《精通比特币》学习笔记(第三章)

棉花糖

区块链 学习笔记 3月日更

文字君和ta的朋友们

InfoQ写作平台官方

新消费品品牌的崛起给户外广告带来了哪些新机遇?

󠀛Ferry

七日更 3月日更

数据库基本操作

在即

数据库 28天写作 28天挑战 3月日更

常见的设计模式原则

一个大红包

设计模式 设计原则 28天挑战 3月日更

翻译:《实用的Python编程》04_00_Overview

codists

Python

常用工具幕布高级会员获取

白程序员的自习室

专访 | 我与毕玄大师的对话

高翔龙

Java 阿里巴巴 中间件 架构师 访谈录

(28DW-S8-Day15) 在线教育的MOT

mtfelix

在线教育 28天写作 峰值体验 关键时刻 MOT

关于 Python 中的字符串,我在补充两点,滚雪球学 Python

梦想橡皮擦

Python 28天写作 3月日更

MySQL 数据查询语言(DQL)& 事务控制语言(TCL)详解

若尘

MySQL

工作中迷迷糊糊,不知道自己想要什么?

一笑

28天写作

工具软件与开源

行人23

开源 SaaS

电商管理系统之发票子系统设计(二)

长沙造纸农

架构设计 高并发系统设计 电商 电子发票 发票

面向业务的高可用架构设计

架构精进之路

架构设计 七日更 3月日更

【LeetCode】分割回文串Java题解

HQ数字卡

算法 LeetCode 28天写作

数据库概述

在即

数据库 28天写作 28天挑战 3月日更

Elasticsearch Mapping Root Object

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

35万一枚的比特币,家里电脑想挖一枚要多长时间?答案只有3个字

CECBC区块链专委会

比特币

能源区块链研究|中国内蒙古自治区为减少能源消耗 禁止比特币采矿

CECBC区块链专委会

比特币

最全Hive SQL语法、Hive函数及使用注意事项(一)

五分钟学大数据

大数据 Hive SQL 28天写作 3月日更

边缘计算隔离技术的挑战与实践

边缘计算隔离技术的挑战与实践

腾讯开源高性能图计算框架Plato,十亿级节点图计算仅需数分钟-InfoQ