9月7日-8日,相约 2023 腾讯全球数字生态大会!聚焦产业未来发展新趋势! 了解详情
写点什么

人类的意念终于能实时转化成文字,但 Facebook 不打算继续了

  • 2021-07-16
  • 本文字数:2522 字

    阅读完需:约 8 分钟

人类的意念终于能实时转化成文字,但Facebook不打算继续了

整理|燕珊、核子可乐


Facebook 正在放弃对于脑机接口(Brain Computer Interface,简称 BCI)设备的研发,尽管近日其投资的一个相关研究项目有了实质性进展——能让患有严重失语症的人拥有“沟通能力”。


近年来,作为最前沿的技术之一,脑机接口领域的技术进展和商业化落地进展一直备受关注。但 Facebook 坦承,面向大众市场的消费级脑机接口仍然遥遥无期。与此同时,为了继续促进光学 BCI 在整个领域的发展,Facebook 宣布开放相关 BCI 软件LabGraph的源代码,并将头戴式硬件原型分享给研究人员和其他同行,以帮助推进这一方向的探索。

Facebook 的“读心术”


2017 年春季可能会是一段被载入史册的重要时期,当时多家大型科技企业相继发起“深入人心”的活动。首先是 Elon Musk(埃隆·马斯克)创立了脑机接口企业 Neuralink,表示正在研究如何将数千个电极植入至人类大脑当中。几天之后,Facebook 也加入了这项探索,媒体曝光 Facebook Reality Labs(FRL)旗下名为 Building 8 的秘密部门正尝试开发一款耳机或者头带,帮助用户用思维方式发送短信——输入速度可以达到每分钟 100 个单词。


根据计划,Facebook 希望让任何用户都能通过 VR 虚拟现实的方式享受这种不需要用到手的人机交互。前 DARPA 官员、时任 Building 8 硬件部门负责人的 Regina Dugan 当时兴奋地强调,“直接通过意念就能打字,听起来是不是相当奇妙?虽然难度极大,但我们获得的进展已经远超大家想象。”


不过如今看来,现实的进展并没有远超想象。在一篇博文中,Facebook 表示将停止该项目,转而将研究重点放在一款用于虚拟现实实验的手腕控制器上,这款控制器能够读取手臂的肌肉信号。该公司指出,“虽然我们对头戴式光学脑机接口的长期发展潜力仍有信心,但还是决定把精力集中在另外一种不同的神经接口之上,希望能够更快拿出可行的市场产品。”


最初,Facebook 的脑机接口(BCI)项目团队设定的长期目标是:开发一个无声、无创的语音接口,人们只需用意念去想希望说出的话语,就可以实现相应的文本输入操作。


去年才开始接手和领导“无声”语音识别项目、但最近开始转而研究 Facebook 平台选举话题管理的物理学家及神经科学家 Mark Chevillet 表示,“我们在技术层面获得了丰富的实践积累。因此我们可以自信地说,从消费级接口角度来评判,头戴式光学无声语音设备还有很长的发展道路要走,远比我们预想的要长。”

BCI 难以应用到消费级产品


Facebook 的畅想无疑是让“无声”语音项目与 VR 结合,毕竟早在 2014 年它就以 20 亿美元高价收购了 Oculus VR。Chevillet 表示,为了实现这个目标,Facebook 公司采取了双管齐下的推进方法。首先,他们需要确定意念到语音的接口是否可行。为此,Facebook 决定赞助加州大学旧金山分校的一项研究,由研究员 Edward Chang 尝试在人类大脑表面放置电极垫。


植入的电极能够从单一神经元处读取数据,这种被称为脑皮层电流描记法(简称 ECoG)的技术能够一次性对大量神经元进行测量。


这支研究团队最终取得了一系列令人惊讶的进展。根据《新英格兰医学杂志》上的报道,他们使用这些电极垫完成了实时语音解码。其中的研究对象是一位代号为“Bravo-1”的 36 岁男性,他由于严重中风而失去了正常的语言表达能力,只能勉强发出断断续续的咕哝声。在报告当中,研究员团队表示通过大脑表面的电极垫,Bravo-1 已经能够以每分钟 15 个单词的速度在计算机上表达语句。至于具体实现方式,他们会测试 Bravo-1 尝试进行默念时用于控制舌头及声道的运动皮层区域神经信号。


为了达成这样的结果,Chang 的团队给 Bravo-1 提供了 50 个常用词汇,每一个进行近万次默念,而后将患者的神经信号输入至深度学习模型。在训练模型将词汇与神经信号相匹配之后,该团队即可以 40%的正确概率确定 Bravo-1 想要表达的词汇(远高于训练之初的 2%)。尽管如此,他的表达结果仍然充满了错误,例如把“嗨,你好吗?”理解成“黑,你吼吗?”


但科学家们决定添加一套语言模型来进一步提高性能,用于判断英语语境下哪些单词序列出现的几率更高。通过这次努力,准确率被提升至 75%。通过这种方法,系统已经能够将 Bravo-1 的表达“我稀饭我的护士”正确地调整为“我喜欢我的护士。”


但同样值得注意的是,英语这门语言共包含超过 17 万个单词,而一旦超出 Bravo-1 所掌握的词汇范畴,其性能也将直线下降。换句话说,这项技术虽然有望用于医疗援助,但与 Facebook 的最初预期仍然相去甚远。Chevillet 坦言,“在可预见的未来,这项技术应该能够实现临床辅助应用,而这跟 Facebook 的业务没什么关系。对于我们真正关注的消费级应用,目前的成果还远远不够。”


Facebook 开发的漫射光学层析成像设备,使用光测量大脑中的血氧变化。

应用场景待拓展


技术发展的速度往往比应用和产品的落地要快得多。多年来,脑科学更多聚焦在基础理论探索阶段,一方面这是极为复杂的交叉性学科,另一方面该技术还未大量进入日常生活,缺乏足够市场支持。


而尽管脑机接口技术的发展面临诸多挑战,该领域还是吸引了不少科技巨头进场,除了 Facebook,Google、阿里巴巴、科大讯飞等公司也在相继布局。今年 4 月,马斯克的 Neuralink 公司宣布,能够让一只猕猴通过大脑活动来控制计算机,而无需通过手来操纵游戏杆。消息一出,脑机接口又再登上热点话题。


研究人员通过在猴子的大脑皮层区域接入 2000 多条细丝,在猴子与计算机交互的时候记录猴子大脑的神经元活动,并将这些神经元活动数据输入到“解码器算法”中,以观察并实时预测猴子的手部运动。虽然有不少业内专家认为 Neuralink 的一系列成果在脑机领域并没有什么创新,但这也侧面说明了人类对脑机接口始终充满好奇。


在众多产业中,医疗领域被视为脑机接口最先落地的方向,目前已经实现临床应用产品,功能集中在针对神经疾病的病情诊断、系统监测和辅助治疗等方面。


阿里巴巴达摩院在 2021 十大科技趋势中亦指出,脑机接口帮助人类超越生物学极限。学术界和工业界正在努力攻克脑信号的采集和处理难题,帮助人类更好地理解大脑工作原理,技术的成熟将加速脑机接口的临床应用,未来将为口不能言、手不能动的患者提供精准康复服务。


参考链接:


https://www.technologyreview.com/2021/07/14/1028447/facebook-brain-reading-interface-stops-funding/

https://www.theregister.com/2021/07/15/facebook_dumps_mindreading_neural_interface/

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2021-07-16 20:124055
用户头像
罗燕珊 InfoQ中文站编辑

发布了 365 篇内容, 共 189.9 次阅读, 收获喜欢 693 次。

关注

评论 1 条评论

发布
用户头像
力荐一个阅读全球计算机论文的好RP:
1000+份计算机paper,卡耐基梅隆大学,芝加哥大学,facebook,google,微软,twitter等大牛一作,持续更新中...
https://github.com/0voice/computer_expert_paper
2021-07-20 15:03
回复
没有更多了
发现更多内容

开源软件下游分发合规性讨论 ——“心寄源”法律沙龙(2023第四期 | 总第九期)成功召开

开放原子开源基金会

开源

如何基于 ACK Serverless 快速部署 AI 推理服务

阿里巴巴云原生

阿里云 Serverless 容器 云原生 Serverless Kubernetes

OpenAtom OpenHarmony携千行百业创新成果亮相HDC.Together 2023

开放原子开源基金会

开源 OpenHarmony

全链路Trace全量存储-重造索引

乘云 DataBuff

学好Elasticsearch系列-脚本查询

码农BookSea

Java elastic

学好Elasticsearch系列-索引的批量操作

码农BookSea

Java elastic

数仓中典型的几种不下推语句整改案例

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

如何快速完成PostgreSQL数据迁移?|NineData

NineData

postgresql 数据迁移 不停机发布 NineData 结构迁移

DTCC 2023,8月16日北京见!

KaiwuDB

KaiwuDB DTCC 2023

安徽阜阳是几线城市?有正规等级保护测评机构吗?

行云管家

等保 等级保护 等保测评机构 阜阳

“一日之际在于晨”,欢迎莅临WAVE SUMMIT上午场:Arm 虚拟硬件早餐交流会

飞桨PaddlePaddle

人工智能 paddle 百度飞桨 硬件生态

LED电子显示屏幕如何计算它的面积

Dylan

广告 交通 LED显示屏 全彩LED显示屏 体育

教你如何搭建K8S集群。

百度搜索:蓝易云

云计算 Kubernetes 运维 k8s 集群

it资产管理软件哪个好?既好用又安全?

行云管家

运维 IT运维 IT资产 IT资产管理

小灯塔系列-中小企业数字化转型系列研究——企业网盘测评报告

向量智库

TiDB Bot:用 Generative AI 构建企业专属的用户助手机器人

PingCAP

人工智能 数据库 AI TiDB

企业大数据分析系统可以给企业主带来哪些帮助?

夜雨微澜

WAVE SUMMIT2023六大分会场同步开启,飞桨+文心大模型加速区域产业智能化!

飞桨PaddlePaddle

人工智能 paddle 百度飞桨

融云荣获「2023 中国数字生态通信领军企业」奖

融云 RongCloud

互联网 通信 数字 融云 AIGC

小灯塔系列-中小企业数字化转型系列研究——任务管理测评报告

向量智库

HyperDock for Mac(mac窗口调整工具)v1.8.0.10中文激活版

mac

苹果mac Windows软件下载 HyperDock 窗口调整工具

Nginx 基本原理与最小配置

timerring

nginx

Linux系统安装和使用Kafka教程。

百度搜索:蓝易云

云计算 kafka Linux 运维 云服务器

微博评论高性能高可用计算架构

艾瑾行

架构训练营

制造执行系统(MES)在新能源领域的应用

万界星空科技

新能源 新能源行业

TiDB v7.1.0 跨业务系统多租户解决方案

PingCAP

MySQL 数据库 多租户 TiDB

校源行丨开放原子开源基金会赴厦门大学访问交流

开放原子开源基金会

开源 校源行

Docker容器安装Nginx教程。

百度搜索:蓝易云

nginx 云计算 Linux 容器 运维

大模型时代,如何重塑AI人才的培养?知名高校专家为您解答

飞桨PaddlePaddle

人工智能 paddle 百度飞桨

小灯塔系列-中小企业数字化转型系列研究——项目管理测评报告

向量智库

华为携手华中地区5大高校倡议共建湖北省高性能计算研究院建设

彭飞

  • 扫码添加小助手
    领取最新资料包
人类的意念终于能实时转化成文字,但Facebook不打算继续了_开源_罗燕珊_InfoQ精选文章