Sirius 是一个开源的定制系统,你可以用声音发出指令控制它。它由密歇根大学研究人员研制,与Apple Siri、Microsoft Cortana 和Google Now 相类似。按照密歇根大学的说法,Sirius“要设计成新一代的智能个人助手,适用于可穿戴设备和其他的设备。”
Sirius 有两个部件:
- 一组服务,实现了一个可随时部署的智能个人助手(IPA);
- 一组组件,为 IPA 提供支撑,统称为 Sirius-suite 。
Sirius 提供的 IPA 核心功能包括语音识别、图像匹配和自然语言处理,具备问答的能力。它还可以接收语音或图像形式的询问,并以自然语言的形式反馈结果。
Jason Mars 是 Clarity 实验室的主任,他说要感谢 Sirius,“在 Apple Watch 上可以运行一款应用,但 Sirius 与之不同,比方说吧,或许我可以做我自己的手表。”这应该会彻底改革可穿戴行业,就像 Linux 在服务器计算领域所做到的相类似,他说。还有一个维度将成为 Sirius 的关键,Mars 说,那就是基于云服务的声控指令服务的开发研究。也就是说,他暗示道,这可能预示着需要重新设计云平台以特别支持基于声音的工作负载。
一旦 Sirius完成本地构建,它的三个服务就可以启动并独立测试了,它提供的是随时可用的解决方案,包括语音识别、图像匹配和问题的问答。
Sirius 的基础是 Sirius-suite,其中有三个核心程序,它们是独立有效的,每一个为 Sirius 提供了独特的能力。更确切地说,Sirius-suite 核心程序提供了以下算法:
- 高斯混合模型(GMM)和深度神经网络(DNN)总谱,常用于自动语音识别(ASR)。
- 特征抽取或特征描述,它常用于构建图像匹配通道。
- 正则表达式、词语分析器和条件随机域,基于的是 Carnegie-Mellon OpenEphyra 问答系统。
Sirius 用户可以向 Sirius Users Google Group 提出他们的问题。
查看英文原文: Sirius: an Open Source Competitor to Siri, Cortana, Google Now
学习更多移动开发技术,报名参加 4 月 25 日 QCon 北京大会“移动开发平台与工具应用实践”专场,本专场将主要分享移动应用开发过程中可使用的各种平台与工具的特点与应用实践,了解移动 IM、IP 电话、推送、广告系统背后的技术难点。
评论