免费下载案例集|20+数字化领先企业人才培养实践经验 了解详情
写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004718
用户头像

发布了 321 篇内容, 共 118.5 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

iZotope RX 11 专业音频修复软件

理理

专业级的音乐制谱软件 Steinberg Dorico Pro for Mac 中文版

理理

鸿蒙实战开发:网络层的艺术——优雅封装与搭建指南(下)

王二蛋和他的张大花

鸿蒙

科大讯飞学习机怎么样 科大讯飞T30pro建议买吗

妙龙

科大讯飞

Native Instruments Guitar Rig 7 Pro for Mac(吉他贝斯效果器)

理理

HyperWorks批处理网格的类型设置

智造软件

CAE软件 hyperworks BatchMesher

平顶山等保测评机构有哪些?电话多少?

行云管家

等保 等保测评 平顶山

堡垒机有远程协助解决难题功能吗?哪家的好用?

行云管家

网络安全 堡垒机

未来已来,软件行业的下一个风口在哪里?

天津汇柏科技有限公司

人工智能 软件

浅谈机器学习,聊聊训练过程,就酱!

蛋先生DX

神经网络 机器学习 深度学习

鸿蒙开发实战:揭秘页面与项目生命周期,实现精准监控

王二蛋和他的张大花

鸿蒙

鸿蒙网络编程系列43-仓颉版HttpRequest下载文件示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙OS创新实践:动态声控话筒开发指南

王二蛋和他的张大花

鸿蒙

经典gba游戏(寂静岭、节奏天国、机兽新世纪等)游戏合集

理理

TDengine 集群能力:超越 InfluxDB 的水平扩展与开源优势

TDengine

tdengine 时序数据库 数据库·

化学绘图 chemdraw 20.0 永久激活码 mac&win

理理

7thonline第七在线7大价值助力品牌实现智能化商品管理

第七在线

管理文档必看:8款企业内部工具介绍

爱吃小舅的鱼

文档管理 文档管理软件 文档管理工具

3D壁纸屏保 Screen Wonders for mac,让屏幕变得如此绚丽!

理理

Resolume Arena 7,打造顶级多媒体演出工具

理理

畅享云边大模型!火山引擎 x 地瓜机器人,大模型网关能力免费开放

火山引擎边缘云

边缘计算 机器人 智能IoT边缘服务 大模型 边缘智能

后勤采购管理系统(源码+文档+部署+讲解)

深圳亥时科技

鸿蒙实战开发:网络层的艺术——优雅封装与搭建指南(上)

王二蛋和他的张大花

鸿蒙

鸿蒙网络编程系列44-仓颉版HttpRequest上传文件示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

FlowJo 10:精准分析,展现细胞奥秘

理理

CST软件如何实现S-parameter随其他参数变化的1D曲线

思茂信息

教程 cst cst仿真软件

IDEA中通义灵码的使用技巧

威哥爱编程

IDEA Java. 通义灵码 AI辅助

SnailSVN Pro for mac SVN客户端

理理

Python淘宝数据挖掘与词云图制作指南

代码忍者

API 接口 pinduoduo API

百度沧海·存储统一技术底座架构演进

Baidu AICLOUD

对象存储 分布式存储 云存储 存储架构

如何提升汽车行业的项目管理效率?

爱吃小舅的鱼

项目管理 管理项目 汽车行业

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章