写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004823
用户头像

发布了 321 篇内容, 共 121.8 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

为何 DevOps 会给开发人员带来压力和倦怠?

SEAL安全

DevOps 策略 企业号10月PK榜 缺点

如何平衡表单设计过程中用户体验与企业管控需求(上)

用友BIP

财务共享

技术筑生态,智联赢未来 第二届OpenHarmony技术大会即将在京启幕

科技热闻

这场研讨会硬件工程师不要错过

华秋电子

降本增效的集成平台

RestCloud

ipaas

数科公司新动向,借助外部力量寻求增长突破

用友BIP

数科公司

关于亚马逊 CodeWhisperer 的测试反馈

亚马逊云科技 (Amazon Web Services)

#人工智能 云上探索实验室 Amazon CodeWhisperer

Python 继承和子类示例:从 Person 到 Student 的演示

小万哥

Python 程序员 软件 后端 开发

Mac电脑专业批量文件重命名 MetaRename中文激活版

胖墩儿不胖y

Mac软件 重命名工具 重命名软件

Mac系统清理和优化软件 CleanMyMac X

展初云

CleanMyMac X Mac软件 系统优化工具

用友BIP,赋能被动元器件行业

用友BIP

数智化转型

“PO高阶精进课程” 12月16-17日 · A-CSPO认证周末班【提前报名特惠】

ShineScrum

数字孪生 重塑世界 ——2023飞渡科技数字孪生行业研讨会深圳站圆满成功

Geek_2d6073

3DCAT+东风日产:共建线上个性化订车实时云渲染方案

3DCAT实时渲染

汽车虚拟仿真 汽车3D可视化

Redis 7.0 源码调试环境搭建与阅读技巧

码哥字节

redis redis 底层原理

国外服务器使用经验分享:这些小技巧让你轻松上手

一只扑棱蛾子

国外服务器

软件开发全文档整理(获取原件)

金陵老街

项目管理 软件文档

EMQ 获第八届 “创客中国” 物联网中小企业创新创业大赛一等奖

新消费日报

释放浏览器潜力:Web Scheduler 背后的系统性能提升

Geek_ianp87

前端 性能 浏览器 js 前端框架

VMware Workstation 17安装教程之创建虚拟机

小齐写代码

自定义过滤器配置 Shiro 认证失败返回 json 数据

emanjusaka

Java shiro

Mac可用的流程图和图形设计软件OmniGraffle Pro 7

展初云

Mac 流程图绘制工具

🎊OpenTiny Vue 3.11.0 发布:增加富文本、ColorPicker等4个新组件,迎来了贡献者大爆发!

Kagol

Mac可用的GTD任务管理软件Omnifocus Pro 3

展初云

Mac软件 任务管理软件 GTD

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章