写点什么

问答 Datameer 公司 Andrew Brust:大数据在人工智能技术中扮演的角色

  • 2017-08-06
  • 本文字数:1785 字

    阅读完需:约 6 分钟

Datameer 最近发布的 SmartAI 可将大数据与机器学习模型结合在一起提供更深入的数据见解。

SmartAI 意在通过大数据实现人工智能,例如针对大规模的大数据运行人工智能算法,帮助企业中的分析师将人工智能模型融入分析工作流程,以安全合规的方式完成自己的工作。

InfoQ 与 Datameer 公司市场战略和智能部门资深总监 Andrew Brust 一起探讨了大数据在人工智能领域,尤其是 SmartAI 中所扮演的角色。

InfoQ:Datameer 原本一直在大数据领域耕耘,为何如今转战人工智能?大数据过时了吗?

Andrew Brust:Datameer 在大数据领域依然十分专注。实际上,SmartAI 的目的就在于将人工智能与大数据分析工作流程相互融合。对大部分企业来说,面对人工智能技术,最大的障碍依然在于大数据、商业智能,以及其他分析工具和技术之间严重的隔阂。我们希望通过 SmartAI 解决这个问题,将人工智能带入主流分析工作,驾驭人工智能的强大威力。

InfoQ:您觉得大数据和人工智能间的关系是怎样的?SmartAI 如何发挥该特性?

Brust:大数据和人工智能之间有着极强的协同增效关系,然而这个特点尚未得到业界的足够重视。对于 SmartAI,Datameer 意在将两个世界彻底打通。使用机器学习模型对数据计分,原本这主要是一种即席(Ad Hoc)的过程,大部分时候是在数据科学家的工作站上进行的。但计分操作其实也可以针对规模更大的大数据平台,以自动化的方式在 Hadoop 集群的所有节点上进行。这恰恰是我们目前的努力目标。

InfoQ:机器学习需要进行大量的数据准备和操作过程,从广义上来看,这是否可以发挥 Hadoop 的优势,尤其是,能否发挥贵公司的优势?

Brust:没错,数据准备也是我们的重要方向之一,同时也是大数据技术以及人工智能技术的重要一环。如果要实现人工智能,必须首先选择一种算法并训练模型。训练模型所用的数据必须足够“干净”,通过筛选仅包含最基本的输入(特征)列,并在恰当层面上进行汇总。数据的准备过程必须完成上述所有操作。因此也需要针对原始数据中所呈现的值进行复杂计算,得到基于列的数据。Datameer 可以使用 Hadoop 做到所有这一切,并且效果很不错。因此在我们的产品中增加人工智能的相关能力就成了一种很自然的做法。

InfoQ:您所说的人工智能的“运维化”是指什么?能否从广义上,以及 SmartAI 的角度深入介绍一下相关技术细节?

Brust:正如之前所说,原本,数据计分操作是一种纯手工,量身定制的过程,需要由数据科学家在自己的工作站上进行。这一过程的输出结果对业务非常有用。然而这种方式并未在企业中形成标准,更多的只是一种手工点击按钮运行某些重要计算过程的做法。

计分过程需要自动化,需要管理,需要监视,需要在更大尺度下运行。此外还需要实现运维化。至今我们依然没有做到这一切,听起来似乎有些荒谬,但大部分情况下实际情况确实如此。通过使用 SmartAI,计分操作可以实现运维化,该产品可集成在与近年来流行的大数据分析技术相同的数据流程引擎和管理平台中。

这种方式塑造了一些全新用例,例如每天或每小时针对大数据运行流失分析模型,同时还可以完全遵守针对此类分析所设立的各种合规策略。

InfoQ:在深度学习的范围内,SmartAI 能否同时解决训练和推断有关的问题?还是主要解决了与分析有关的问题?

Brust:Datameer 并不涉及实际的训练过程,数据科学家依然需要使用自己惯用的开发环境、语言、工具,和 / 或命令行接口训练自己的模型。

模型训练完成后,即可导入 Datameer 并且可供调用,我们的库中还额外提供了超过 270 种电子表格函数。借此即可将人工智能嵌入到安全、受管控、可调度的数据流程中,将本就很强大的分析能力与人工智能结合在一起,发挥出更大威力。

InfoQ:最后,为何要选择 TensorFlow?该产品的未来规划中是否考虑过解决人工智能领域的其他问题?

Brust:目前 TensorFlow 很流行,很受关注,整个生态的发展非常良好,因此我们也选择了这个技术。人工智能领域的创新速度很快,我们都知道还有其他很多开源的深度学习框架,其中每一个都有可能迎来更大的发展势头。因此我们会密切关注整个行业,及时掌握最新变化,我们针对 TensorFlow 所采取的结构化的方法也可以用于其他库,不过目前来说,对于将 SmartAI 以及 TensorFlow 集成在 Datameer 产品中的决定,我们觉得是非常妥善的。

Datameer SmartAI 很快即将发布技术预览版。

阅读英文原文 Q&A with Andrew Brust of Datameer Regarding Big Data’s Role in AI

2017-08-06 19:001406
用户头像

发布了 283 篇内容, 共 108.9 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

【YashanDB知识库】如何处理yasql输入交互模式下单行字符总量超过限制4000字节

YashanDB

数据库 yashandb

GEP全球供应链波动指数揭示关键趋势

财见

阿里Java权威面试指南:分布式+中间件+大数据与高并发+数据库+设计模式与实践+数据结构与算法+面试题举例!

程序员高级码农

Java 编程 程序员 java面试 Java面试题

jedis使用及注意事项

快乐非自愿限量之名

php

跟着 Datathon 做医疗大数据临床科研,2天搞定一篇 SCI!

ModelWhale

人工智能 大数据 SCI 核心期刊

2024,大模型杀进“决赛圈”

脑极体

AI

VMware Workstation 17.6.2 发布下载,现在完全免费无论个人还是商业用途

sysin

Workstation

EMQX 可观测性最佳实践

观测云

物联网 emqx

【教程】第八章:知识库——学海无涯

NocoBase

开源 项目管理 教程 任务管理 知识库

【活动预告】Pulsar 开发者 2024 大会,快来偶遇我们!

Apache IoTDB

适合多人协作的云盘工具推荐,8款值得尝试

易成研发中心

【YashanDB知识库】误配置SYSTEM级别的STATISTICS_LEVEL参数为ALL导致数据库性能下降

YashanDB

数据库 yashandb

VMware Fusion 13.6.2 发布下载,现在完全免费无论个人还是商业用途

sysin

fusion

BOE(京东方)“向新2025”年终媒体智享会首站落地上海 六大维度创新开启产业发展新篇章

爱极客侠

如何制作管理架构图?10个架构图模板案例盘点!

职场工具箱

在线白板 绘图软件 效率软件 组织架构图 管理架构图

高效项目管理的9款精选软件推荐

易成研发中心

微店API接口深度探索:如何高效获取商品详情及代码示例

代码忍者

微店API接口 微店商品详情API接口

从天谋科技研发到 IoTDB Committer,他的故事值得一听!

Apache IoTDB

Lakehouse is ALL you need

StarRocks

LakeHouse

华为云云原生中间件DCS & DMS 通过中国信通院与全球IPv6测试中心双重能力检测

YG科技

【YashanDB知识库】YCP单机部署离线升级-rpc升级方式详细步骤

YashanDB

数据库 yashandb

腾讯云发布新一代数据智能平台,基于一体化、智能化、高性能、云原生理念打造

Geek_2d6073

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

声网

inBuilder低代码平台特性推荐系列第二十八期——一键生成补丁

inBuilder低代码平台

运维 低代码 补丁

ChatGPT 支持语音实时搜索;Meta Ray-Ban 智能眼镜新增视频识别与实时语音翻译功能丨 RTE 开发者日报

声网

【YashanDB知识库】YCP高可用部署离线升级-rpc升级详细步骤

YashanDB

数据库 yashandb

华为云软件开发生产线(CodeArts)11月新功能特性

YG科技

【YashanDB知识库】用yasldr配置Bulkload模式作单线程迁移300G的业务数据到分布式数据库,迁移任务频繁出错

YashanDB

数据库 yashandb

问答Datameer公司Andrew Brust:大数据在人工智能技术中扮演的角色_大数据_Rags Srinivas_InfoQ精选文章