牛津项目是微软推出的一组数据理解服务,提供了一套 REST API 和 SDK,使开发人员可以利用微软的自然数据理解能力为自己的解决方案增加智能服务。
该项目主要包含以下四项服务:
- Face API :该 API 基于云提供了最先进的人脸检测和识别算法。通过上传一个 JPEG 图像文件或者提供 Web 上现有 JPEG 图像的 URL,它就可以完成人脸检测,提供高精度的人脸定位,最多可以从一副图像中检测出 64 张人脸。 人脸识别 API 则提供了人脸验证、人脸相似搜索、人脸自动分组和身份识别四项功能。微软近日推出的年龄测试网站“看脸识年龄”便使用了其中的技术。有兴趣的读者可以移步这里了解更多技术细节。
- Speech API :该 API 基于云提供了业内领先的文本转语音、语音转文本及语言理解功能。它同 Windows 10 Speech API 一起构成了一个完整的综合性语音处理平台。微软的 Windows 应用 Cortana 和 Skype 翻译以及 Android 应用 Bing Torque 均使用了牛津项目提供的语音功能。开发人员可以用它为自己的应用程序添加语音驱动行为。
- Vision API :该 API 提供图像分析、缩略图生成和光学字符识别(OCR)服务。感兴趣的读者可以移步互动演示。
- 语言理解智能服务( LUIS ):该服务使开发人员可以使用来自 Bing 和 Cortana 的预置模型识别地名、温度、时间等实体,快速高效地为自己的应用程序添加语言理解功能,使其可以处理像“将闹钟设为早上 8 点”这样的常见请求。开发人员也可以根据自己的需要按照 LUIS 的指引自定义模型。
在上述四项服务中,前三项处于 Beta 测试阶段,第四项处于邀请测试阶段。在 SDK 方面,Face API 和 Vision API 均只提供了.NET 和 Android 版本,而 Speech API 提供了 Windows、Android 和 iOS 版本。感兴趣的读者可以从这里下载。
感谢魏星对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。
评论