语音识别的新拐点

产品分类

模拟监控摄像机系列高清网络数字摄像机智能高速球机系列硬盘录像机系列视频采集卡系列专用显示器系列安防专用线系列专用硬盘系列视频收发器系列防盗报警系列门禁考勤系统智能停车系统 LED显示屏系列医院呼叫系统汉邦高科电子围栏脉冲电网

新闻分类

公司新闻行业新闻安防知识安防趋势

内容详情

您现在的位置：网站首页 > 新闻资讯 > 安防知识 > 正文

语音识别的新拐点

美国麻省理工近日消息，麻省理工计算机科学和人工智能实验室研发了新的声音识别系统，比起上一代声音识别系统正确率提高了15%。　　

　　场景声音辨识技术加速完善语音识别有望迎拐点

　　近年来人工智能系统在语音和图像识别领域已有较成熟的算法，但在嘈杂环境下的声音辨识能力相对较弱。此次研究人员利用视觉和声音的自然同步，在原有数据库中导入大量视频信息，结合新算法对声音识别系统进行测试。在10个不同声音测试中，该系统获得了92%的正确率，在50个声音测试中准确率为74%，而人类在相同样本测试中的正确率分别为96%和81%。未来该系统将改善用户在户外使用语音识别的体验。

　　研究人员表示，该系统应用潜力巨大，比如无人驾驶汽车系统搭载该声音识别技术后，当听到救护车声音，无人驾驶汽车能更早选择新的路线规划。另外手机安装该系统后，用户到电影院后该系统通过周围声音环境判断电影是否开始放映，并自动切换成静音模式。该声音识别系统将在本周召开的国际神经信息处理系统大会(NIPS)上进行展示。

　　作为人工智能最重要的技术之一，国外语音识别技术的准确率已基本达到人类的水平。微软旗下最新语音识别系统的识别错误率仅为5.9%，这和专业速记员将对话转录成文字的最低错误率一致。而微软也在一年前将语音识别系统的深度学习算法进行开源，使其他人工智能产品通过该算法拥有语音识别技术。海外市场调研机构预计，未来几年全球语音识别市场规模有望突破百亿美元。

　　国内的语音识别技术也在快速发展。11月底搜狗和百度分别召开发布会表示，旗下语音识别系统正确率已达到97%左右，同时有不少智能语音产品支持不同地区的方言识别。《2016年互联网趋势报告》显示，近几年用户通过语音搜索的使用量大幅提升，使用语音的本质是解放双手，而目前全球语音识别系统依然存在场景辨识率低等问题。随着场景声音辨识技术的加速完善，语音识别技术有望迎来拐点，未来发展空间将进一步扩大。