专业机构发布《2019年语音技术》报告称,语音将成为未来十年决定性主题之一,与人工智能一起从根本上改变人与机器的关系。近日,搜狗输入法在语音输入领域率先推出“个性化语音识别”功能,突破语音识别技术瓶颈,大幅优化个人词汇录入的直接准确性,在语音输入领域实现“更懂用户”。
搜狗“个性化语音识别”打造用户专属输入法
在日常交流中,个人口头禅、惯用语经常会干扰双方的信息传达,这一问题在人机语音交互中尤为凸显。在语音输入时,往往用户只是想录入一个名称,输入结果却显示的是音同意不同的另一项结果。比如,当用户希望输入法显示人名“凭远”时,通用的语音识别往往将大众常用的“平原、品源”列在前列的候选词汇,用户的个性化内容并不在其中。除此之外,用户习惯使用的个人词汇,以及一些多音字、读音差错也会对语音识别结果造成影响。
基于以上原因,搜狗语音率先对语音识别技术进行了革新优化,推出“个性化语音识别”服务。经过本轮更新,用户只需在搜狗输入法App选择一键登录个人账户,即可体验此项服务。成功开启后,“个性化语音识别”会通过强化学习用户习惯使用的个人词汇,为每个用户建立定制化语音输入法。此后,在用户需要进行语音输入时,输入法会根据语言环境,结合上下段落语句进行分析,快速输出符合用户心意的文本内容,有效减少用户手动进行二次更改的频率。
搜狗语音又诞生“黑科技”语音识别更精准
搜狗“个性化语音识别”不仅可有效提升用户个性化词句的识别准确率,同时全自动词库学习这一特色极大保证了系统的处理及反馈速度,实现整个学习个性化特征的过程在“毫秒级别”就可以全部自动完成。
通过DTSS(Deep Transformer-based Sequence to Sequence model)的端到端声学模型、神经网络语言模型和智能标点预测等技术,搜狗输入法引入前沿深度学习技术,对语音识别进行仿真模拟和训练,有效提高语音录入在通用场景下的识别准确性,精准度已达到领先业内。“个性化语音识别”可基于用户数据分析,对用户习惯使用的个性化词组进行扫描记录,在语音输入时,优先选择用户习惯用语进行文本输出。通过此项技术革新,在保障通用识别准确性的前提下,使用户常用语的字词错误率下降40%,攻克语音识别精准化的技术难关。
掌控AI从个性化语音识别开始
手和舌头是人类最灵活的两个部分,从移动智能设备发展以来,各种触控交互无不依赖于手的操作。而当语音技术和人工智能同时走向成熟时,或许就像《2019语音技术报告》中所描述的那样:语音交互扭转了以往人机交互的存在形态,用户与设备间基于语音交互的全新关系开始搭建,与之前互联网向移动互联网过渡一样,其对底层平台的全新需求也在酝酿当中。
新时代即将来临,为应对人工智能、虚拟现实等技术的革新以及不同维度、多场景使用的需要,用户输入法的使用习惯逐渐向语音输入转移。同时,与文本输入相比,语音输入注定成为最主要的人机互动接口。优化语音识别技术,为用户提供更自然、更便利、更高效的语音录入服务,是智慧输入法的发展趋势。
随着语音识别技术的不断成熟,以及用户个性化词库的不断丰富,搜狗将聚合用户级语音个性化资源,实现“定制化语音输入法”。使每个用户基于“定制版”、“更懂自己”的搜狗语音识别的支持,在日常生活以及医疗、法律等专业领域,有效提高线上交流和人机沟通的效率及准确度,或将成为人工智能时代输入端的全局掌控者。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队
这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特
文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定
2020年底,王慧文在朋友圈写下这句话时,外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是,一个曾经多次创业,正值壮年的互联网老将心中的创业热情是难以熄灭的。
苹果16弄了两个版本,一个是专门给中国人用的,准备用百度的AI,还要交钱。第二个是全世界都可以用的,用了ChatGPT,包括台湾、香港、澳门都可以用。以后都这样了。好,问题就出在这,苹果和百度的合作出现问题了,新闻连起来看,才能明白其中含义。新闻一:苹果正在和腾讯、字节初步接洽,考虑将二者的AI模型
“技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。”计算机之父约翰·冯·诺依曼曾这样说到。
“人工智能的商业模式,是要创造一个市场,而非一个算法”。这是世界AI泰斗MichaelI.Jordan的观点。而当前的全球AI市场,占据主导地位的中美双方,却也走出了两条截然不同的技术路径,前者执着于前沿技术的探索,后者则发力应用优化和商业化落地。南辕北辙的两个方向,或许已经无法直接进行排位先后、优
智能体进化发展了一年,现在的RPAAgent迭代到什么程度了?从实在智能最新发布的实在Agent7.0,看RPAAgent的迭代升级抓取豆瓣信息、自己制作PPT,这款AIAgent真的实现了流程全自动化AIAgent构建到执行全自动化,持续进化RPAAgent再次降低智能体应用门槛实在智能重磅发布实
崔大宝|节点财经创始人进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“以厘计费”,打响国内大模型
文|智能相对论作者|陈泊丞好消息!你心心念念的事业单位发录取公告了!坏消息!他们没录你,录了个数字人。图片来源网络随着数字人技术的突破,越来越多的传统企业和机构开始用上了“数字员工”。甚至很多中国人心心念念的“铁饭碗”,也被这些数字人给捧上了。数字人捧上了“铁饭碗”简单翻看一下全国各地事业单位的“录
黑芝麻智能敲钟后,港交所门口又有一些智驾芯片企业引发关注。据悉,近日地平线已通过中国证监会IPO备案,拟发行不超过11.5亿股境外上市普通股并在香港联合交易所上市,预计筹集约5亿美元资金。从天眼查可以了解到,该公司成立于2015年,是一家乘用车高级辅助驾驶(ADAS)和高阶自动驾驶(AD)解决方案供
8月21日,万众瞩目的2024世界机器人大会暨博览会在北京亦创国际会展中心盛大开幕。这场为期5天,集“展览”“论坛”“赛事”于一体的机器人盛会,反映了当下机器人领域的繁荣生态。据官方统计数据,今年现场逛展观众高达25万人次,比去年增加25%。机器人行业有多火?看看2024世界机器人大会火爆程度便可知