QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004865
用户头像

发布了 321 篇内容, 共 123.2 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

推动体系建设 助推融合发展|2023开放原子全球开源峰会软件物料清单(SBOM)分论坛即将启幕

开放原子开源基金会

开源 开放原子全球开源峰会 软件物料清单(SBOM)

C语言编程语法—文件读写

芯动大师

C语言 二进制 6 月 优质更文活动

整合开源治理经验,共谋开源社区发展|2023开放原子全球开源峰会开源社区治理与运营分论坛即将启幕

开放原子开源基金会

开源 开放原子全球开源峰会 开源社区治理与运营

几分钟上线一个应用,这个神器我爱了!

引迈信息

低代码 JNPF 办公神器

最近几年,国内好多家实体企业都开始用上低代码了,它有什么好?

优秀

低代码 数字化

初步了解RNN, Seq2Seq, Attention注意力机制

Studying_swz

6 月 优质更文活动

【Netty】「NIO」(一)认识 ByteBuffer

sidiot

后端 Netty java‘ 6 月 优质更文活动

OpenYurt 即将亮相 EdgeX+OpenVINO 开发者生态大会

阿里巴巴云原生

阿里云 开源 云原生

2023-06-06:给你二叉树的根结点 root ,请你设计算法计算二叉树的 垂序遍历 序列。 对位于 (row, col) 的每个结点而言, 其左右子结点分别位于 (row + 1, col -

福大大架构师每日一题

golang rust 福大大

以安全为底线 共迎机遇和挑战|2023开放原子全球开源峰会可信基础设施技术分论坛即将启幕

开放原子开源基金会

开源 开放原子全球开源峰会 可信基础设施技术

如何用Smartproxy住宅代理IP抢购潮牌鞋子?住宅代理抢购限量款式

摘星星的猫

以AI为灯,照亮医疗放射防护监管盲区

飞桨PaddlePaddle

人工智能 深度学习 百度飞桨

java多线程总结

Studying_swz

6 月 优质更文活动

系统稳定性与高可用保障

得物技术

架构 高可用 稳定性

从 PMO 的视角,看如何从 0 到 1 搭建研发效能体系?

思码逸研发效能

研发效能

动态修改coreThread线程池拓展

FunTester

地图实火!断货加印,限时折扣抢购通道开启

融云 RongCloud

社交 融云 泛娱乐 出海 wicc

软件测试/测试开发丨学习笔记之Mark标记测试用例

测试人

程序员 软件测试 自动化测试 测试开发 测试用例

华为云发布面向消费终端的企业云原生白皮书,开辟移动时代的云原生路径

脑极体

云原生

奇点云举办“数据进化论”数智科技大会,发布数据云七大场景

奇点云

业务场景 奇点云 数智科技大会

AWS CodeWhisperer 上手初体验安装与使用

宇宙之一粟

Python 代码编辑工具 CodeWhisperer 6 月 优质更文活动

2个原因解答:为什么网络安全缺口大,招聘却很少?

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

轻量级分布式日志追踪-Tlog快速入门

javalover123

分布式 日志 Skywalking spring-boot Tlog

smartproxy印度住宅IP代理,帮助您的海外业务打造网络无障碍桥梁

摘星星的猫

自动驾驶≠速度与激情

白洞计划

自动驾驶

设计模式总结(二):结构型模式

Studying_swz

6 月 优质更文活动

推动开源与商业共生共赢 | 2023开放原子全球开源峰会开源商业化创新发展分论坛即将启幕

开放原子开源基金会

开源 开源商业化 开放原子全球开源峰会 开放原子

人脸面部表情识别技术的挑战和未来发展

数据堂

Web智慧化工三维可视化管理系统

2D3D前端可视化开发

三维可视化 工业组态 物联网系统 数字孪生技术 智慧化工

Vue-事件基本使用

不觉心动

6 月 优质更文活动

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章