国际

新技术将大脑信号同步解码 “失语者”1秒发首音节

(伯克利31日综合电)历经多年研究与改进,一项有望彻底改变“失语者”命运的新技术终于问世:科学家们早前开发出一款革命性算法,可将大脑信号实时转换为自然语音。

这项研究由美国加州大学伯克利分校科学家主导,成果已通过同行评审并发表于顶级期刊《自然·神经科学》。研究显示,相比旧系统8秒生成一句话的延迟,新神经假体借助AI技术,在患者产生说话意图1秒内就能发出首个音节!

Advertisement

“我们首次实现了神经信号解码和几乎同步的语音流。”研究负责人、伯克利大学电气工程与计算机科学副教授阿努曼奇帕利说,“这让合成语音更加接近人类自然对话的流畅度。”

渐冻症(ALS)、中风导致的严重瘫痪患者往往丧失了语言能力。现有脑机接口提供了部分交流途径,但仅限于翻译文字,并存在反应慢、操作笨拙等缺陷。之前的语音合成也存在过度延迟的问题,难以实现流畅对话。

新系统采用了类似Siri和Alexa语音助手的底层AI模型,开发出可将神经信号解码为连续语音流的技术,实现低延迟的自然口语交流,同时能输出语音和文本。

将“语言意图”同步合成为语音

ADVERTISEMENT

在伯克利大学的临床试验中,瘫痪患者安妮仅需默念屏幕句子,系统就能从她控制发声的运动皮层采集信号,结合AI预训练模型(包括她受伤前的录音),将“语言意图”同步合成为语音。安妮反馈道:“这比过去任何方法都更易操控!” 更惊人的是,研究人员测试了未在数据集中出现的单词,AI也能准确生成声音——AI真正掌握了发音底层逻辑而非机械复读。

合作研究者赵喆俊(音译)指出,“这个框架是革命性的!我们接下来的目标,是进一步提升语速、情感表现力与自然度。”

標籤
你也可能感兴趣...
Close