写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004752
用户头像

发布了 321 篇内容, 共 119.6 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

flomo 浮墨笔记向飞书收购 “幕布”,不卖永久会员、不融资的“反骨”逻辑

B Impact

聚势启新,赢未来!网银互联通航云计算数据中心三期盛大落地!

科技热闻

PHP集成开发:phpstorm2022永久版 激活码

理理

软件 PHP开发 PhpStorm 2022激活码 PhpStorm中文版

Mac万能笔记软件Notion中文版,提高你的工作效率

理理

Mac笔记软件 Notion 中文 Notion 下载

智维数据加入信创工委会,助力国产化智能运维自主创新

智维数据

信创 国产化 智能运维 网络运维 智维数据

干货,在差分对信号的应用中需要注意些什么?

华秋PCB

电路 PCB PCB设计 共模

项目经理问我Tomcat 与 Undertow 怎么抉择?此文教她选

Java你猿哥

Java jdk Spring Boot ssm

谷歌Android things物联网硬件接入阿里云IoT物联网套件实战——设备接入类

阿里云AIoT

物联网 传感器 Android开发

ON1 Sky Swap AI for Mac:出色的 天空替换 照片编辑工具

理理

换天空 ON1 Sky Swap AI 2023 照片编辑软件

何为神经网络卷积层

华为云开发者联盟

人工智能 神经网络 华为云 华为云开发者联盟 企业号 3 月 PK 榜

阿里云IoT物联网平台基础版和高级版数据进入规则引擎的流转详解——普及类

阿里云AIoT

物联网

数字音频编辑|Cockos REAPER最新破解教程

理理

Cockos Reaper破解 音频编辑

京东云总裁曹鹏:安全可控的数字基础设施提升产业链韧性

京东科技开发者

数字化 产业数字化 京东云 国产化替代 京东云峰会

感谢大家对我的捐赠和鼓励

源字节1号

AltCLIP:改变语言编码器,扩展语言功能

Zilliz

计算机视觉 openai

阿里云IoT物模型-属性,服务,事件通信的topic和payload详解——设备管理运维类

阿里云AIoT

物联网

通过HTTP/2通道实时获取IoT设备状态和数据——设备管理运维类

阿里云AIoT

Java 物联网

Trapcode Particular(AE经典粒子插件)绿色破解版

互联网搬砖工作者

直播 | StarRocks 实战系列第四期--查询性能优化

StarRocks

数据库

分布式存储中建立高效回收站的设计思考

焱融科技

文件存储 分布式文件存储 回收站 高性能存储 全闪存储

InstructPix2Pix: 动动嘴皮子,超越PS

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜 文本编辑图像

PS磨皮插件DR5白金版:支持ps 2022

互联网搬砖工作者

获得华为技术认证,智维数据携手华为云初创生态再添新坐标!

智维数据

华为云 智能运维 网络运维 智维数据 技术认证

用图技术搞定附近好友、时空交集等 7 个典型社交网络应用

NebulaGraph

推荐算法 图数据库 社交网络

Dapr实战—RabbitMQ binding

青柚1943

Docker RabbitMQ dapr 发布订阅 Binding

Serverless:基于个性化服务画像的弹性伸缩实践

百度Geek说

云原生 成本优化 Servelress 弹性伸缩 企业号 3 月 PK 榜

10Wqps 超高并发 API网关 架构演进之路

Java你猿哥

Java 架构 微服务 SSM框架 api 网关

智维数据荣获2022金融科技应用创新奖

智维数据

金融科技 智能运维 金融电子化 智维数据

国内首发|焱融科技 YRCloudFile 支持 NVIDIA GPUDirect Storage(GDS)

焱融科技

人工智能 分布式存储 分布式文件存储 全闪存储 GPT-4

现货合约量化机器人开发对冲交易策略

薇電13242772558

量化策略

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章