河北快3下注平台-河北快3注册平台_河北快3官网平台

谷歌想用AI帮言语障碍者“说话” ,数据集是最大挑战

时间:2019-11-14 03:24:14 出处:河北快3下注平台-河北快3注册平台_河北快3官网平台

7月12日下午消息,近几年AI领域对于残障人士的关注太多,企业和技术专家致力于通过AI赋能信息无障碍。日前在“Google Solve with AI”活动上,Google AI产品经理介绍了Google AI在针对听障和言语障碍患者人群推出的应用新进展和覆盖情况表。

据Sagar Savla介绍,目前全球有4.66亿人患耳聋或听力障碍,你这种数字在2055年时候 会增加至9亿。听力受损使得大伙儿 没能与附进的世界沟通交流,这是人类社会中一项严峻的挑战。

而语音识别(speech recognition)功能Live Transcribe的冒出,只是 为听障人群防止现实问题报告 。该功可以 能 实时自动转录对话,让大伙儿 参与到只是 无法参与的对话中。

目前,Live Transcribe应用系统系统进程支持超过70种语言,通过在手机屏幕上把现实生活中的语音转录为文本,帮助耳聋和听障人士与他人沟通。

此外,言语障碍患者也是一有俩个较大的群体。Google AI产品经理Julie Cattiau在接受新浪科技采访时提到,Google今年启动的Euphonia项目,正在通过招募志愿者,积累更大的残障人士语言数据库,希望最终帮助所有的言语障碍患者进行交流。

据悉,该功能通过为言语障碍患者建立语音识别模型,和可以 识别或多或少沟通土土办法(如手势,眨眼等)的基于计算机视觉的模型,让机器去理解你爱不爱我话的土土办法,用AI语音技术帮有有哪些患者“说话沟通”。

在活动现场,Julie Cattiau通过一段视频,展示了通过该功能,可以 相对准确地读取出有语言障碍人士的表达。

不过,要让AI背熟言语障碍患者的表达,也趋于稳定一定的挑战。Julie Cattiau在采访中表示,现在一般的语言识别时候 有极少量的数据了,有什么都有 人在使用你这种平台。时候 在Euphonia你这种项目中,虽然没办法 太多人参与,什么都有 有语言障碍的人很少我应该 来参与。目前,正在通过招募什么都有 言语障碍患者志愿者,让大伙儿 朗读或多或少词汇,积累表达,只是 就能建立或多或少数据。

“有有哪些数据实际上没办法 没办法 多,虽然大伙儿 儿在语音识别方面取得了很大的进展,但依然趋于稳定只是 的挑战”,Julie Cattiau坦言。

语音识别对于患有或多或少健康情况表的人来说是一项至关重要的技术,但或多或少产品即使在最理想情况表下也表现平平。

据了解,通过和有有哪些非营利组织的合作,Euphonia项目团队时要记录更多患者的声音,时候 将有有哪些声音来训练人工智能,从而创建可以 识别有有哪些语音的算法和频谱图。

目前,时候 没办法 人下发到足够大的数据集,语音识别技术时候 不适用于有语言障碍的人士,而这将是Euphonia着手研究的每段。

热门

热门标签