语音大数据:即将到来的网络数据浪潮
日期::2013-12-20 来源:

  语音操控与大数据这两个2012年互联网产业的热点,很少被联系在一起。目前所说的大数据多是指网络上文字信息储存、清洗、分析与利用,重点在于对人类行为特点的把握。语音操控则指Siri类依靠机器语音识别的人机互动,用于新型网络服务与改善用户交互体验,还没有将声音作为一种数据资源加以利用。

  众多产品中的语音应用兴起告诉我们:语音数据的浪潮即将袭来。 英国“窃听门”与美国“棱镜门”都在提醒人们声音数据的重要。

  语音数据为何会兴起?首先,语音交流是最本能的沟通方式,传播技术的发展是要便捷人类沟通,将会趋于人类最自然的交流形式——语音传播。互联网语音识别技术及语音传播应用的增加正符合了这一趋势,记录语音的数据将大量增加。

  语音数据有很多其他类型数据无法比拟的优势,如准确、快速完成身份识别。声纹如同指纹,每个人都不相同,国内已有几家科技公司在从事声纹识别(speaker recognition或voiceprint recognition)技术开发,依靠声音波纹,轻松地在数十亿人中锁定一个人。如此一来,网络身份可以不再依赖IP地址或移动设备编号来确定。

  此外,语音数据包含更多“无意识”信息,更符合大数据特点——无意间流露,有意识分析。个人说话的语调、语速、音量、换气频率等都可以转化为反映个人区域、心理、健康的数据。2013年,瑞士联邦理工学院视听通讯实验室(LCAV)依靠声音数据已能构建出简单的空间凸起的三维地图[1]。同时,语音数据相对于文字数据更为准确反映意义。如网上流行的段子“冬天:能穿多少穿多少;夏天:能穿多少穿多少”。同样的文字,语音更能明确表达意图。

  最后,语音识别技术已经基本成熟,可以较为准确地转换为文字,使语音信息具备了文字信息的潜质,通过这一处理,所有基于文字的数据处理方法都可以用来分析转换过的语音信息。

资料参考:http://yjy.people.com.cn/n/2013/0813/c245082-22549844.html
上一篇:“Ok Google”Chrome浏览器中的语音识别 下一篇:智能语音:触发“生活大爆炸”
关键词: 声纹识别 声纹鉴定 社矫认证 社保认证 远程认证 动态口令 声纹密码 语音识别
友情链接: 智能语音实验室