9月7日-8日,相约 2023 腾讯全球数字生态大会!聚焦产业未来发展新趋势! 了解详情
写点什么

脑机接口重大突破!华裔科学家首次用 AI 直接从大脑合成语音

  • 2019-04-25
  • 本文字数:1883 字

    阅读完需:约 6 分钟

脑机接口重大突破!华裔科学家首次用AI直接从大脑合成语音

4 月 24 日,《自然》杂志上发表了一篇主题为:“利用人工智能将脑信号转化为语音”的文章,文章显示,来自加州大学旧金山分校的研究人员已经可以通过 AI,将实验对象的脑信号成功转换为语音并进行播放。从脑机接口研究方向来说,这是一项重大的进步。

AI 构建神经解码器

随着科技的发展,失去说话能力的人已经可以通过技术手段来进行交流,不过,这些技术依然需要他们做一些微小的动作,来控制在屏幕上选择字母或单词的光标。患有运动神经元疾病的英国物理学家斯蒂芬霍金就是一个例子。


现在,利用人工智能技术,科学家或许可以让丧失语言能力的人开口“讲话”。


这个听上去有些天方夜谭的事情,近期在加州大学旧金山分校成功实现了,研究负责人 Edward Chang 表示:“为严重言语残疾患者创造恢复沟通的技术是一项长期目标。这项研究提供了原理证明:可以从大脑活动中产生语音,特别是大脑的语音中心。”



AI 前线注:Edward Chang 博士是加州大学旧金山分校的神经外科医生,专门治疗顽固性癫痫,三叉神经痛和脑肿瘤。他的研究重点是人类言语、运动和认知的大脑机制。他还是加州大学伯克利分校和加州大学旧金山分校的神经工程与假肢中心的联合负责人,该中心汇集了工程,神经科学,神经科和神经外科,以开发最先进的生物医学设备,以恢复神经残疾患者的功能。


在文章中,Chang 对这项研究的进展进行了详细地解析。


他解释说,使用脸颊肌肉激活的发声装置的人必须逐字逐句地打印单词,所以这些设备的速度非常慢,每分钟最多能打印 10 个单词,而普通人的自然口语速度为平均每分钟 150 个单词。所以,Edward Chang 和他的团队决定在构建神经解码器时对声音系统进行建模。


研究人员在参与者的头骨中植入与这些类似的电极来记录他们的大脑信号


研究人员在参与者的头骨中植入与这些类似的电极来记录他们的大脑信号


这项实验的参与者,是 5 位正在加州大学旧金山分校医疗中心接受侵入性治疗的癫痫患者。治疗方式是将手掌大小的电极板直接植入在他们的大脑表面上,患者癫痫发作后,电极可以在大脑中发生的地方产生定位。一旦医生确定了发病点,就可以通过移除大脑的病变部分以永久停止癫痫的发作。


当然,除了治疗癫痫之外,这块电极还有一些其他作用,即捕捉语言相关的脑信号。


首先,参与者需要大声朗读数百个句子,此时的大脑活动会被研究人员记录下来,并确定哪些信号控制了所谓的发声器官,包括嘴唇、舌头、下颌、喉头以及人们在没有意识到的情况下移动的嘴和喉咙的其他部位。通过参与者足够的脑信号数据,科学家们能够创建一个计算机模拟的声道。



研究人员设计了一种循环神经网络(RNN),可以将记录的皮质神经信号转化为声道咬合关节运动,然后将这些解码的运动转化为口语句子。


研究小组对这些数据进行了深度学习算法的训练,然后将程序整合到解码器中。

脑机交互是未来,但时机尚未成熟

很长一段时间以来,脑机交互被认为是计算机与脑科学发展的完美结合,无数科学家也在这一领域进行不懈的探索。


多年前,一位名叫 Phil Kennedy 的神经科学家曾经研究出了一种名为亲神经电极的技术,这种技术可以让电极长时间植入人脑,让脑机接口有可能从实验投入实际使用。1998 年,Phil Kennedy 找到了一位合适的实验对象,通过植入电极,实现了让这位曾经是植物人的瘫痪患者可以用意识打字。


但是由于后续的实验遭遇了接连的失败,接受实验的患者要么伤口长期不能愈合,要么因为身体原因去世。Phil Kennedy 甚至在 2014 年在自己的身上进行了实验,最后却还是出现了伤口无法愈合的情况,最后以失败告终。


而就在不久前,特斯拉 CEO 埃隆·马斯克曾在推文中提到自己的公司 Neuralink 正在研发一种技术,能够利用超小型植入式芯片,有效地将人类的大脑与计算机进行连接。马斯克表示:“Neuralink 的长期目标,就是要实现与人工智能的共存,从而实现一种智能的民主化,确保这种技术在研发成功之后,人工智能将不再是政府和大型企业所垄断的纯数字形式。”


值得一提的是,据知情人士透露,马斯克的这家公司与 Edward Chang 的团队似乎在实验项目上有不少的合作,Chang 团队此次的实验进展,似乎也得到了马斯克方面的帮助。


自计算机出现以来,人们对于脑机接口就开始了漫长的追求,虽然 Edward Chang 和团队的研究带来了新的希望,但是他本人也表示,目前这项功能只存在于实验室中,尚不能在现实中使用。


从原理上来说,Chang 团队所做的工作并不是彻底将思想转化为语言,而是通过捕捉人们发声时候各个器官以及脑信号的活动,再将其合成语音,播放出来。


该团队也明确表示:第一个成功的模型是在可以说话的人身上试验成功的,至于是否会对失去语言能力的人有所帮助,尚有待发掘。


如果有读者对该项研究感兴趣,可以查看相关论文


更多内容,请关注 AI 前线!



活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2019-04-25 15:218244

评论

发布
暂无评论
发现更多内容

深入理解HTML表格秘籍

喀拉峻

评测有礼 | 飞桨黑客松第二期热身活动上线啦!

百度大脑

群晖(Synology)NAS 安装 Mariadb 数据库启动错误

HoneyMoose

HTTP的成长

Tristan

前端 浏览器 网络 HTTP

微博评论高性能高可用计算架构

唐尤华

架构实战营

百度Q4财报:百度智能云2021年营收151亿元,同比大增64%

百度大脑

面向企业级前端应用的开发框架 UI5 的发展简史介绍

Jerry Wang

JavaScript 前端开发 前端框架 企业级应用 3月月更

区块链的过去与未来

CECBC

Mac 配置 Flutter 安卓开发环境

岛上码农

flutter ios 安卓 移动开发 3月月更

赋能区域产业,南京、成都双城AI开发者Meetup报名开启

百度大脑

两会声音|建议完善数字人民币体系 完善数字货币立法

CECBC

重磅硬核 | 一文聊透对象在JVM中的内存布局,以及内存对齐和压缩指针的原理及应用

bin的技术小屋

JVM 内存 Java虚拟机 false sharing java

Studio One 5新版本安装包图文教程

茶色酒

Studio One 5 fl水果20.9

群晖(Synology)NAS 后台安装 Docker 后配置 Mariadb / MySQL

HoneyMoose

Powershell基础之脚本执行

喀拉峻

网络安全 安全 渗透测试

安全无小事,教你解决密码泄露问题!

老陈

工具 安全 密码泄露

千万级学生管理系统的考试试卷存储方案

AragornYang

架构训练营 架构实战营

面由心生,由脸观心:基于AI的面部微表情分析技术解读

百度大脑

低代码实现探索(三十四)前台code逻辑

零道云-混合式低代码平台

当听障人士实现手语自由:手语AI平台的产业狂想

脑极体

工业AI落地场景案例实战,飞桨EasyDL让工业更智能

百度大脑

区块链共识,机器说了算还是人说了算?

Akumas

区块链 数字化转型 共识机制 十四五规划

群晖(Synology)NAS 后台安装 Docker 后配置 Mariadb / MySQL 配置端口

HoneyMoose

最好用的 6 款 Vue 拖拽组件库推荐 - 卡拉云

蒋川

Vue Vue3 vue cli

俄罗斯能通过加密货币规避制裁吗?

CECBC

自己动手写Docker系列 -- 3.1构造实现run命令版本的容器

Go Docker

【C语言】轻松解决Bug

謓泽

C语言 bug 3月月更

7招!实现安全高效的流水线管理

阿里云云效

云计算 阿里云 运维 云原生 持续交付

CorelDRAW2022最新订阅版本下载

茶色酒

cdr2022

中国AI的“底线思维”与安全锁

脑极体

适合新手代码审计之熊海cms

H

网络安全 代码审计

  • 扫码添加小助手
    领取最新资料包
脑机接口重大突破!华裔科学家首次用AI直接从大脑合成语音_AI_Vincent_InfoQ精选文章