近期在 Google Cloud Next 大会上,Google 发布了 Cloud Machine Learning API 更新。其中包括用于计算机视觉、智能视频分析、语音识别、自然语言处理、机器翻译和职位搜索等领域的一系列 API,使用户能构建看得见、听得到并能理解非结构化数据的机器学习应用,有助于实现下一代产品推荐、医学影像分析和欺诈检测等用例。
Google Cloud AI 及 Machine Learning 部门首席科学家李飞飞(Fei-Fei Li)撰文介绍了 Cloud Machine Learning API 等内容,其中包括:
- Cloud Datalab
- Cloud Video Intelligence
- Cloud Vision
- Cloud Jobs
Cloud Machine Learning Engine 现已达到了通用(GA),企业可以使用它在云端生产环境中训练和部署自己的模型。它是一个托管服务,用于定制基于 TensorFlow 的机器学习模型。它还集成了 Google Cloud Platform 的数据分析管道,其中包括数据处理( Cloud Dataflow )、数据科学工作流( Cloud Datalab )和 SQL 分析( Google BigQuery )等服务。
Google 团队也与一些技术合作伙伴协作,将他们的解决方案部署到 Cloud Machine Learning Engine,例如 SpringML 和 SparkCognition 。前者使用云平台为终端用户提供实时分析,后者使用云平台检测并阻止零日攻击。
Cloud Datalab 是一个交互式数据科学工作流工具,目前也已达到了 GA。开发人员和数据科学家可使用它对 BigQuery、Cloud Storage 或本地存储中的数据进行探索、分析和可视化。Cloud Datalab 可用于典型机器学习开发生命周期中的各个步骤,即在本地存储的较小规模数据集上构建模型原型,然后在云端使用全部数据集训练模型。这次发布的更新中包括了对 TensorFlow 和 Scikit-learn 的支持,并支持直接使用 Cloud Dataflow 或是通过 Cloud Dataproc 使用 Apache Spark 进行批处理和流数据处理。
Cloud Video Intelligence API 使用了内置 TensorFlow 的深度学习模型,应用于 YouTube 这样的媒体平台。该 API 允许开发人员通过提供视频中实体的相关信息去搜索和发现视频内容。搜索条件可以是“狗”、“花”、“人”这样的名词,也可以是“跑”、“游”、“飞”这样的动词。它还提供对语境的理解,能给出被检索实体在视频中出现的时刻。
该 API 当前处于 Private Beta 开发阶段。媒体公司和消费技术公司可使用该 API 洞悉视频类非结构化数据。用例包括构建媒体编目,以及发现管理众筹内容的方法。
这次新发布中还包括了 Cloud Vision API 1.1 版,一种使用机器学习模型(通过 REST API)帮助理解影像内容的 API。它可将图像分类为多个不同类别,检测影像中的个体及面部信息,发现并阅读影像中包含的打印体单词(OCR)。其用例包括:为图形编目构建元数据、调整图像中的攻击性内容以及使用图像情感分析开发营销场景。例如,在使用了 Cloud Vision API 的 Realtor.com 网站上,客户通过使用智能手机抓拍居所的照片,就能立刻获取房产的相关信息。
Cloud Jobs API 使用机器学习为求职网站提供职位搜索用例。Commute Search 是其中的一个新特性,它能根据用户所需的通勤时间和首选的交通模式,检索并返回适合的职位。该 API 使用机器学习理解各种职位搜索属性,例如职位头衔、职位描述、所需技能和求职意向等,然后基于分类和关系模型给出匹配求职者意向的职位列表。
与此相关的新闻是 Google 将 Kaggle 并入了 Google Cloud 平台。Kaggle 是世界上最大的数据科学家和机器学习爱好者社区,其中提供了对机器学习和数据分析中最新动态的探索、分析和理解。
评论