如果我们不做自主研发,我们一样可以过的很滋润,然而负重前行的远方只为了一小个可能,独立自主,将一切掌握在自己手中,而这一切的过程归纳总结起来唯“创新”二字而已。
把握不落后于人的资本,就是看清冉冉升起的趋势,最后一往无前。
DB-engines 对于数据库类型流行度排名
进阶的 AI——21 世纪图数据的回春
图论:技术圈都在讲的“图”到底是啥,首先你要知道图论,图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。
图的结构非常多样,可以分为同构图,有向图/无向图,权重图/无权图,稠密图/稀疏图,连通图/连通分量等等。
多样的图结构在表现丰富数据关系方面具有非常强大的优势,其两点之间的边也表示两节点之间的各种丰富多样的关系或者潜在关系。(朋友,家人,消费,运输,负债,高低频,重要程度,受好评度,压力等等一切物理世界的关系)。因此图后来也被用于作为关系分析和挖掘潜在关系的最优载体。
“传统数据库与图数据库的博弈早就已经存在,然而真正做出选择的是适者生存”
我们来看看图数据库:
传统数据库想要发现数据内部的潜在关系,调用次数将会比一般情况下多接近 10 倍,甚至完全无法用数据库表示这些联系,一旦新增一个类型又需要重新设计,开发过程将极其复杂。
在 1 千万点,1 亿边这样的规模下,基于关系数据的 3 跳以上查询通过传统数据库查询,性能完全无法满足查询需求。
华为云图引擎 VS 传统数据库
2 跳查询下,传统关系数据库,反应时间:0.016s,图引擎 0.017s,返回记录条数 231579 条,3 跳之下,传统关系数据库 23.589s,图引擎 0.779s,1031115 条,5 跳之下,图引擎 1.474s,返回记录条数 1230000 条,传统数据库如何:臣妾做不到啊!
这是因为,传统数据库的查询数据依赖性非常强,在各个点之间需要交换大量的数据,其分析流程需要反复迭代,很难实现真正的并行,而图数据结构支持遍历查询,读写快,无需多次重复交换数据,真正实现图形并行。在图计算领域,如果把传统数据结构比作大炮坦克,图数据结构就是高达。
“这些分析都能用在哪儿,能创造价值才是王道,否则只是一个概念优势”
别急,我们先来看看用于关系分析的基础算法有哪些:
戴克斯特拉算法(D.A)
克鲁斯卡尔算法(K.A)
普里姆算法(P.A)
拓扑排序算法(TSA)
关键路径算法(CPA)
广度优先搜索算法(BFS)
深度优先搜索算法(DFS)
“这些都用来干嘛,能解决什么问题呢?”
问得好,很多情况下是为了进行图的遍历搜索,计算最小生成树,计算最短路径,子图相关问题,此外还能处理染色,路径问题,网络流与匹配,覆盖问题等等逻辑和实际性问题。
“图数据库的核心价值是在现实场景中驱动计算效率“
图应用场景:
图在现实场景中的应用非常广泛比如路径规划,城市交通,航空航天,GPS 导航,网络工程,电子电路,航班预订,信号塔频率规划等等,物流网利用最短路径提高客座率,降低出车量的规划。实际生产中,可以参考以下成功案例:如广联达使用图引擎发现项目风险,社交网络中使用关系分析挖掘进行好友推荐,商品推荐使用图来提高商品推荐精准率。
以上共性,当业务需求只要涉及到路径优化,关系数据的分析和挖掘,都能见到图的应用实践。
可为何过去一直小众的图突然变得那么热门,并且覆盖了这么多领域。这是因为大数据 2.0 时代,所有企业面临的是指数级爆炸的信息量,如果不提升数据的使用效率和处理效率,那么就等于在这个数据驱动的时代放弃了这一动力,继续使用人力车与燃油车赛跑。而图数据对新时代需求的高契合度和社会各界对于这种数据结构的高度认可也造就了如今图在当前技术界爆发式的热度。
这是华为云自己的 AI
直到 2018 年,华为累计获得专利授权 74307 件,华为图引擎服务集成自研图引擎内核 Eywa,全自主研发,内含有多项专利,安全可靠,不禁售,提供了从底层图存储和管理、核心的高性能计算引擎,到面向上层的图分析、图查询这样一整套解决方案。向用户、开发者和 ISV 提供全开放的快速建模、高效计算的能力,提升图分析与计算的质效和速度。
我们一直在创新的道路上徐徐前行,昨天,今天,明天并没有什么区别。
本文转载自 华为云产品与解决方案 公众号。
原文链接:https://mp.weixin.qq.com/s/Kj-4ZKl3yzx9pYfVZw4wIQ
评论