2016年是人工智能概念提及率爆发式增长的一年,智能语音作为人工智能中重要的领域之一,正在继文字之后,成为非常重要的一个人机交互方式,同时语音技术的研究、开发与利用也越来越受到瞩目。
8月6日,在中关村创业大街的车库咖啡,百度开发者中心举办了主题为“百度语音识别和语音唤醒技术解析及实践”的第65期技术沙龙,三位百度智能语音专家为大家分享了百度在语音技术上的开发经验和成果。
百度语音开放平台产品经理何荡首先为大家带来一场精彩的分享,从语义理解、语音识别、语音合成、后端资源四个角度给大家介绍了百度语音技术,同时讲解了百度下一步开放计划。百度语音技术在今年二月份的时候,被美国麻省理工这一个权威的杂志评论为“2016年十大突破技术”,百度语音开放平台的开发者数量已经超过了12万,“每天识别的在线请求数在1亿以上,合成的在线请求数在2.5亿到3亿之间”何荡用数据说明了百度语音的用户使用概况,并从识别和合成两个方面展示了百度语音效果。
百度语音资深研发工程师魏力凯以自己的亲身经历切入,为大家进行了精彩绝伦的经验分享。一句:理想很丰满,现实很骨干,道出了他6年语音和应用开发上的体会与感悟。魏力凯分别从在线自定义、离线自定义、自定义语义、语法编辑器四大层面解释了语音技术的四大功能。“首先打开开放平台的首页,点击产品与服务,主要的开发技术有三项,识别、合成和唤醒,代表了自定义模块可以看到这个广角。”魏力凯随后向现场开发者介绍了语法编辑器工具的使用注意事项。
负责唤醒和语音技术的测算和算法研究的工程师唐立亮,现场向开发者介绍了什么是语音唤醒技术,并指出了唤醒的正确率和误报率以及功耗问题。“第一个是置信度的方案,其实通过某种方式的某种得分,判定唤醒效果的好坏。第二个是基于识别的唤醒系统,也就是说在唤醒的后边接一个识别系统。这个识别系统说什么都能有一个结果,同样说唤醒词也会有一个识别结果。接下来第三部分是基于垃圾词网络的技术,垃圾词和唤醒词进行一个并连或者是串联。得到最终的结果,这是之前的三个方向的技术。”唐立亮现场分享了语音唤醒技术的解决方案。并在后续演讲中阐释了所用到比较核心的技术模块。
沙龙在每一位主讲人讲完以后有一到两个提问的环节,还会有一个现场的案例演示以及QA互动的环节。在提问环节中,不少观众与嘉宾进行了现场互动,观众们向三位分享者探讨交流自己在语音开发上所面临的困惑与难题,三位嘉宾对于观众的提问也给出了具有借鉴意义的回复。
据了解,百度技术沙龙是由百度开发者中心主办,InfoQ负责策划、组织、实施的线下技术交流活动,每月1期,旨在为中高端技术人员提供一个自由的技术交流和分享的平台。百度技术沙龙通过向开发者共享百度核心技术、数据和资源,为开发者提供全方位服务和支持。作为国内互联网巨头,百度开发者中心是百度扶持行业发展、创造共赢生态的一面窗口,越来越高的人气显示,百度开发者中心技术沙龙正在成为开发者追逐梦想的必经之地。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!