亚马逊在最近的一篇博文中宣布了 Rekognition Service 新增的三项新特性。这些新特性可用于识别图像中的文本、最多可从一张图片中识别出一百张人脸,以及基于上千万张人脸进行实时脸部识别。
亚马逊在 re:Invent 2016 大会上推出了 Rekognition,开发人员因此可以在他们的应用中加入图片分析功能。后来,亚马逊在这方面又投入更多资源推出新的特性。Pinterest 是 Rekognition 的早期用户之一,Pinterest CTO Vanja Josifovski说:
作为一个以视觉为驱动的平台,Pinterest 高度依赖图像处理的速度和质量,而图像中的文本也同样重要,因为它们提供了重要的上下文信息,对于我们的两亿活跃用户来说至关重要。借助 Rekognition 的文本识别能力,我们能够更好地从存储在 S3 上的大规模图片中抽取文本。我们期待继续与 AWS 合作,为我们的用户提供更高质量的服务和更好的体验。
Web 和移动开发者媒体管理平台 Cloudinary 已经将 Rekognition 的新特性用到他们的服务当中。Cloudinary 的业务拓展副总裁 Daniel Amitai说:
Cloudinary 与 AWS 紧密合作,促进这项解决方案的落地。我们与 Rekognition 的集成让这项工作取得长足的进步,省去了手动分析图片内容的枯燥工作,让用户可以自动地对图片进行分类。
Rekognition API 提供了一些操作用于脸部识别和图像分析:
-
DetectFaces——最多可从一张图片中识别出一百张人脸,并提供每张人脸的相关细节,如年龄范围、性别和表情。
-
CompareFaces——用于比对脸部特征。可以对输入图像与目标图像中的人脸进行比对,最多可以支持单张图像中最大的一百张人脸比对。
-
DetectText——检测和抽取图像中的文本,文本以元素数组的方式返回。
-
RecognizeCelebrities——识别图像中的名人,最多支持一百个。识别结果中包含名人的细节信息,如名字、URL 链接和匹配指数。
用户可以登录 AWS 体验这组 API。
开发者可以使用这组 API 对上传到 S3 的对象或字节数组进行分析。Rekognition 支持 JPEG 和 PNG 格式的图片,如果是 S3 对象,最大可以达到 15MB,如果是字节数组,最大可以达到 5MB。Rekognition API 支持 Java、.NET 和 Python,目前在美国和欧洲可用,官网给出了定价细节。
亚马逊、谷歌和微软在 AI 产品方面展开竞争,希望为自己的平台带来更多的用户。微软的 Cognitive Service 提供了超过 25 组 API,包括 Emotion API 和 Computer Vision API,它们都具备图片和人脸分析能力。谷歌推出了 Vision API,可以检测图片中的物体和人脸。谷歌和微软比亚马逊要早走一步,而现在亚马逊也迎头追击。Investopedia 的一篇文章中写道:
亚马逊的颓势在于 AI 应用的开发,AI 应用可以助力云计算用户的数据分析、语音识别和图像识别。虽然亚马逊仍然是云计算的市场领头羊,但微软和谷歌正通过推出 AI 产品来缩小差距,为用户提供更多的选择。
评论