描述该装置的研究发表在PLOS计算生物学
导读:人工智能设备又迈进一步:能读懂唇语。一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。
易科技讯11月29日消息,据外媒报道,一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。
该设备能“观看”嘴唇的动作,并利用人工智能络将它们转换成声音。
研究人员表示,该设备将能帮助声带麻痹患者发声,向脑机接口又迈进一步。
描述该装置的研究发表在《PLOS计算生物学》期刊上。
这项研究的作者来自法国国家科学研究中心。文章中提到,“这种语音合成器将人体主要语音发音器(舌,颚,口和嘴唇)的运动转换成智能语音。”
说话者的发言,以及嘴部各个部位的位置会被同时记录,然后通过人工智能络算法进行分析。
此处使用的人工智能算法是永远需要提升自己的办实事的能力基于人类大脑建模的深层神经络(DNN)。算法设计针对偏复杂的模式识别。
该深层神经络DNN通过测量舌头、下颚、软腭和嘴唇的协调动作(又称为”发音语音信号“)来识别嘴正在发音的某个词语。
作者解释道,DNN计算模型对这些测量的数据进行训练,将“发音语音信号”转换成“声学语音信号”。
作者提到,这项研究中,我们让用于训练DNN模型的用户,以及陌生新用户都来测试语音合成器的实时控制性能,从而评估它在是否能很好地成为脑机接口的一部分。
“语音脑机接口将能通过解码皮层的语言相关活动,实时控制语音合成器,从而帮助有严重发声障碍的人恢复交流。
为帮助连声道都无法震动的患者“说话”,科学家将必须掌握如何解码大脑信号,并将其翻译成语音。
使用人工智能来解码语音和语言已有先例。
谷歌不久前推出了多语言之间机器翻译系统。该系统被成为“Zero-Shot翻译系统“,并具有自我学习能力。它能将未学习过的两种语言翻译成一种已经学习过的语言——换言之,通过人工智能训练学习了如何实现X语言对Y语言的翻译后,系统就能立即自动掌握从X到Z语言的翻译。
GoogleBrain的博文把这项翻译技术称为神经机器翻译系统(GoogleNeuralMachineTranslation,
简称GNMT)。
三诺血糖仪哪一款最好中医怎么疏通经络三诺血糖仪价格表-
救护车鸣笛鲜有车辆让道 医生呼吁为生命让生路
救护车鸣笛鲜有车辆让道 医生呼吁为生命让生路从事故现场到医院不到3公里的路,足足走了40分钟!救护车鸣笛却...[详细]
-
我国方便面销量连跌四年 恶性竞争致行业困局
我国方便面销量连跌四年 恶性竞争致行业困局中国食品工业仍处于艰难的转型期。在昨天举行的中国方便食品大会...[详细]
-
男子偷盗爱心物品 驾驶货车带着妻子或父母每周至少作案两次
男子偷盗爱心物品 驾驶货车带着妻子或父母每周至少作案两次2017年2月22日讯,放在社区的爱心“旧衣回收箱”内的...[详细]
-
住百家联合创始人阮智敏分享要点如下
5月20日,由亿欧主办、中集e栈、Ucloud、小白车务、coding、排队协办的亿欧2016中国互联+新商业峰会·华南顺利举行,...[详细]
-
1秒钟科技界里苹果最赚钱同步推资讯
1秒钟:科技界里苹果最赚钱-同步推资讯1秒钟:科技界里苹果最赚钱文章概要:在科技界,苹果当属最赚钱的,除...[详细]
-
铡草机正确的操作方法
铡草机正确的操作方法铡草机正确的操作方法机器要有专人使用和保养,使用人员要认真学习使用说明,了解其结...[详细]