新技术将大脑信号同步解码 “失语者”1秒发首音节

2025-07-31

在深度学习模型的帮助下，这个脑-声神经假体能在1秒内将说话意图合成自然语音，让失语者有望重获“声音自由”。

（伯克利31日综合电）历经多年研究与改进，一项有望彻底改变“失语者”命运的新技术终于问世：科学家们早前开发出一款革命性算法，可将大脑信号实时转换为自然语音。

这项研究由美国加州大学伯克利分校科学家主导，成果已通过同行评审并发表于顶级期刊《自然·神经科学》。研究显示，相比旧系统8秒生成一句话的延迟，新神经假体借助AI技术，在患者产生说话意图1秒内就能发出首个音节！

“我们首次实现了神经信号解码和几乎同步的语音流。”研究负责人、伯克利大学电气工程与计算机科学副教授阿努曼奇帕利说，“这让合成语音更加接近人类自然对话的流畅度。”

渐冻症（ALS）、中风导致的严重瘫痪患者往往丧失了语言能力。现有脑机接口提供了部分交流途径，但仅限于翻译文字，并存在反应慢、操作笨拙等缺陷。之前的语音合成也存在过度延迟的问题，难以实现流畅对话。

新系统采用了类似Siri和Alexa语音助手的底层AI模型，开发出可将神经信号解码为连续语音流的技术，实现低延迟的自然口语交流，同时能输出语音和文本。

将“语言意图”同步合成为语音

在伯克利大学的临床试验中，瘫痪患者安妮仅需默念屏幕句子，系统就能从她控制发声的运动皮层采集信号，结合AI预训练模型（包括她受伤前的录音），将“语言意图”同步合成为语音。安妮反馈道：“这比过去任何方法都更易操控！” 更惊人的是，研究人员测试了未在数据集中出现的单词，AI也能准确生成声音——AI真正掌握了发音底层逻辑而非机械复读。

合作研究者赵喆俊（音译）指出，“这个框架是革命性的！我们接下来的目标，是进一步提升语速、情感表现力与自然度。”

標籤

您好！請登入您的帳號