也许你也有过这样的经历,向智能客服咨询问题,却陷入毫无进展的对话里:
-你们家的面膜都是纯天然的?
-亲亲,我们家的面膜都是芦荟精华提取,纯天然的哦~
-我皮肤有点干,推荐一款呗~
-冬天皮肤干燥推荐给亲亲我们的保湿精华乳~
-我是要买面膜,你是机器人吧,让人来说话。
作为顾客,此时你大概要叹一句“人工智能真不智能”。这些所谓“智能”客服们往往只能做到一问一答,一旦对话涉及稍微复杂的情境,它们就开始答非所问。
让人工智能学会根据上下文去处理信息,是自然语言处理技术一个关键的门槛,也是多年来整个学术界和工业界都在努力攻克的难题。尽管在通用NLP领域,gpt-2,BERT等算法模型的出现,让语义理解取得了重大进展,但是由于专业性强、垂直语料库不足等原因,某些亟待落地的应用场景,例如高强度的客服对话,还深陷在开头出现的“人工智障”泥潭中。
最近,这个难题迎来了新进展。晓多科技(下称“晓多”)开发的基于上下文的语义识别项目,以深度学习的方式,让智能问答机器人能够像人类一样,结合语境去理解复杂场景下的对话,并且进行持续的自我学习,无需人工设置规则,也能不断扩展和覆盖更多的场景。
从一问一答到读懂语境
为什么人工智能会有这些“不智能”的表现?这是因为目前市面上主流的智能问答机器人,大部分都是根据单个句子来识别顾客的意图,从而进行一问一答的任务型对话。但在日常聊天对话中,我们习惯口语化表达,尤其在打字时,一般不会大段大段地发送,而会使用很多断句,这种零碎的表达使得机器人无法从单个句子中准确识别出你的真实意图,造成答非所问的情况。
这对于服务业来说是一个致命伤。
和普通的闲聊机器人不同,智能客服必须做到对各种场景的精准识别。因为智能客服面对的工作,是要及时地、明确地解决顾客的问题。
当你和闲聊机器人逗趣的时候,它答非所问的话并不会让你烦躁,反而觉得很有趣味;但当你只想赶紧退货或者得到赔偿时,智能客服的胡言乱语足够让烦躁的顾客给这家店铺打上0星,并在评论区洋洋洒洒好几百字,控诉店铺服务不到位。
在商品售前阶段也是这样,智能客服错误的回复或答非所问,都会影响顾客的体验度,平台商家竞争激烈的情况下,得不到满意答复的顾客可能会很快放弃,选择另外一家店铺,从而造成顾客的大量流失。
单句识别与上下文识别的差别
解决这一问题的关键,在于要让机器人像人一样,学会联系上下文,结合语境来对话,而不仅仅对单个句子作出反应。
目前市面上其他机器人都不支持上下文语义,他们是在靠规则和流程设置关键词。也就是说,这个情景中需要什么信息,就要设计出对应的问题,让机器人按照固定的顺序提问,顾客按照要求回答完所有问题,机器人才能根据所有信息来进行回应。
例如,顾客要购买飞机票,就要设定机器人首先询问顾客起点、终点、时间,再问顾客想要什么等级的座位等等,通过这些固定问题的答案,把需要的信息补充完整,最终给出推荐。
在这种情况下,每一个场景都需要人工去设定对应的规则,效率十分低下。尤其在电商领域,从售前到售中,再到售后,涉及到的问题是方方面面的,更别说还有购物品类的区别,场景的扩展是指数级的,靠人工设定规则去做到全覆盖,说是天方夜谭也不为过。
如果能够将目前人工智能领域大热的深度学习应用到这一问题的解决上,让机器人能够通过自己学习,掌握基于上下文的语义理解,并持续学习扩展到各个场景中,就可以大大地提高智能机器人面对复杂场景的精准应对能力,同时提高它覆盖各种场景的效率。怀着这样的想法,晓多开始了上下文语义项目。
让机器人自己“划重点”:记住重要信息,忘记不重要的
机器人自己学会理解上下文,困难在哪里?晓多算法工程师、本次上下文语义项目的负责人张翀向大数据文摘介绍,最关键的问题在于要让机器人像人一样记得上文的重要信息,并且知道这些信息和当前问句的关联。
在这个问题上,目前学术界和业界并没有现成的解决方案。对此,张翀介绍,晓多为新一代问答机器人创新设计了一个深度学习模型,包含四个模块:记忆与遗忘、提炼、融合、输出。
记忆与遗忘模块赋予机器人记住上文关键信息的能力。没有记忆能力的机器人,只会对最近的一句话作出反应,而晓多的模型可以帮助机器人把前后的诉求关联起来,及时作出准确的推荐。
点击图片查看详细内容
在技术上,晓多做出了一个此前业界还没有实现过的创新应用,参照一个名叫长短期记忆网络(LSTM)的结构,设计实现会话级别的记忆和遗忘。
晓多的又一创新,是应用于提炼模块的注意力机制。它会自动对上文的每一条信息进行计算,算出这些信息与当前句子对应的重要程度,重要程度高的,就会被保留下来。
假如顾客得到了满意的产品推荐之后,又提出“什么时候发货”的问题,注意力机制通过计算,就会发现上文的重要程度并不高,这样,无用的信息就会被过滤,与当前对话有关联的上文信息被选取出来,进入下一个模块中。
在融合模块中,机器人会对提炼出的上文关键信息和当前聊天消息结合,来识别顾客的意图。晓多采用的方式是在向量空间做梳理,简单来说,可以理解为提取上文关键信息是在机器人大脑内部的一个操作,这之后,再在一个抽象的空间里,把提取出来的关键信息与当前的单句进行综合,最终输出一个结合上文信息和当前单句所做出的判断。
这个模型在实验中得到的数据令人惊喜。晓多从真实电商聊天⽇志中抽取了若⼲涉及上下⽂的问答样本,构造两份意图识别测试集,分别对应两个电商领域,对⽐发现结合上下⽂预测的模型效果远超只根据单句预测的模型:
recall(召回率)=机器人正确识别的问题数/问题总数;
Precision(精确率)=机器人正确识别的问题数/机器人已识别的问题数;f1core=2*precision*recall/(precision + recall) ,表示综合考虑召回率和精确率的评分;
这些工作并不是想到就可以做到的,对机器人的训练需要大量的数据,迁移学习能力是晓多能够实现这些创新的关键。
“人工智能的深度学习,突出的特点就是对数据的依赖非常大,”张翀说,“因为深度学习模型的参数非常多,你可以理解为它是一个更复杂的智能体,数据是它学习的依据,它要学习的东西越多,需要的数据就更多,而你给它的数据越多,它也越聪明。”
目前,晓多的标注团队从上百亿的数据中进行分析提取的价值样本,提供给机器学习进行数据训练。
如果每一步都需要人工设计,从发现场景、总结规律,到最后开发、测试、上线,可能需要至少两周的时间才能扩展一个场景,张翀介绍说,而使用这样的数据标注让机器进行深度学习,只需要几天的时间,就可以同时扩展几十个场景、几百个产品。
各个行业的电商客服需要应对的场景虽然有很多差异,但有一些数据却是通用的,包括关于快递物流的问答等。晓多对标注好的数据进行了模块拆分,区分出通用数据,当机器人需要对新行业进行学习时,可以直接使用这些标注好的通用数据,实现迅速的扩展学习。
谈到数据、算法和计算能力的关系,张翀认为,数据是基础,大数据为机器学习装上引擎;算法是核心,将人工智能带到全新高度;而计算能力是保障,为算法的实现提供坚实的后盾。
不止于此,顾客体验迎来后智能化时代
从售前的商品导购,到售中咨询运费、活动赠品等,目前,晓多的上下文语义项目已经投入使用,覆盖了多种电商服务场景。这仅仅只是这项技术投入应用的第一步,晓多的业务计划中,还涉及到更多的业务铺开。在售前,顾客可能会要求客服进行商品推荐,他们的需求点信息包含在整个对话过程中。传统的客服机器人只能根据顾客最后的需求进行推荐,而晓多机器人会对顾客的会话信息进行分析,更加准确地识别到顾客的真实需求,推荐给顾客符合心意的产品。
另外,对于电商行业中热门的服装领域来说,售前的服装尺码推荐是客服经常会遇到的问题,店铺内大量商品的尺码各不相同,尺码问题会耗费客服大量的人力。通过上下文识别的手段,客服机器人可以获取顾客的尺码信息,准确地进行尺码推荐。
在销售过程中,顾客常常要询问运费问题,这就涉及到了首次购买和退换货两种场景。没有上文语境,机器人就只能解读出“运费”,而不能准确地判断顾客询问的是首次购物运费还是退换货运费,可能导致错误的回复。而在加入了上下文理解后,机器人能够准确判断顾客的实际问题,准确地回复此类问题。
另一个常见的售中场景是关于活动赠品的问题。当店铺进行活动优惠提供赠品时,顾客的提问可能不是针对商品,而是针对赠品,需要机器人通过语境来识别,防止混淆这两个方面的提问,给出张冠李戴的答案。
这项技术不但可以应用在智能对话上,智能营销、智能质检、情绪识别……客服行业中还存在着更多未被开发的可能性。
对于晓多来说,这意味着他们为顾客提供的服务,向超专家级更进了一步。“我们现在可能只是把它应用在语义识别上,但后续我们在其它业务线上还可以继续铺开。我们把它当成一个基础的能力,一个支撑我们整个公司的算法产品。”张翀说。
晓多也期待着,上下文语义识别可以作为技术基石应用到行业各个方面,通过推开这项技术的应用,机器人可以自动生成尺码表,自动获取个性化对话内容进行系统自动萃取对接等等,机器人行业一直以来由人工配置的时代可能走向终结,而迎来一个从数据中学习后智能化自动生成的时代。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
7月5日,上海国际工业装备及传输技术展(简称AHTE)在上海新国际会展中心举办,中科新松给用户带来了更完善的面向场景、面向未来的“机器人+”综合解决方案。除了携国内首台25kg协作机器人华丽亮相外,还带来了针对汽车和3C行业的6大应用解决方案,包括汽车踏板压力测试、机车触屏测试,大扭矩螺钉拧紧及无人
6月28日——30日,以“时不我待”为主题的MWC上海世界移动通信大会正式举行,联想集团作为全球领先的ICT科技企业将携全线产品、解决方案和服务亮相。捷象灵越作为联想子公司联晟智达生态伙伴参展,围绕“智能制造与智慧物流”主题,展示了面向未来的、高柔性化的托盘机器人矩阵以及工厂智慧物流应用场景演示。M
6月14日,为期三天的LogiMATChina2023在上海新国际博览中心如期盛大开展。作为物流行业风向标的重要平台之一,LogiMAT斯图加特物流展一直致力于呈现内部物流产业前沿科技。不同以往参展展品,在今年LogiMATChina展会现场,兰剑智能(展位:N4-D01)全系列移动机器人家族首次集
5月25日,消费级机器人品牌「ROBOSEN」乐森机器人(以下简称:乐森)在北京兰境艺术中心隆重举办以“MakeLifeMoreFun”为主题的新品发布会。发布会上,乐森重磅推出三款消费级娱乐机器人,包括乐森巴斯光年、乐森大黄蜂G1性能版、乐森擎天柱《超能勇士崛起》精致系列机器人,以及两款乐森智能基
5月25日,消费级机器人品牌「ROBOSEN」乐森机器人(以下简称:乐森)宣布,日本著名机械设计师河森正治(ShojiKawamori)正式以“产品创想合作伙伴”的身份加盟乐森。河森正治表示:“乐森拥有高超的变形技术、运动技术以及AI应用方法,将结合他对机器人和AI方面的构思,一起开发新的AI机器人
“技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。”计算机之父约翰·冯·诺依曼曾这样说到。
“人工智能的商业模式,是要创造一个市场,而非一个算法”。这是世界AI泰斗MichaelI.Jordan的观点。而当前的全球AI市场,占据主导地位的中美双方,却也走出了两条截然不同的技术路径,前者执着于前沿技术的探索,后者则发力应用优化和商业化落地。南辕北辙的两个方向,或许已经无法直接进行排位先后、优
智能体进化发展了一年,现在的RPAAgent迭代到什么程度了?从实在智能最新发布的实在Agent7.0,看RPAAgent的迭代升级抓取豆瓣信息、自己制作PPT,这款AIAgent真的实现了流程全自动化AIAgent构建到执行全自动化,持续进化RPAAgent再次降低智能体应用门槛实在智能重磅发布实
崔大宝|节点财经创始人进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“以厘计费”,打响国内大模型
文|智能相对论作者|陈泊丞好消息!你心心念念的事业单位发录取公告了!坏消息!他们没录你,录了个数字人。图片来源网络随着数字人技术的突破,越来越多的传统企业和机构开始用上了“数字员工”。甚至很多中国人心心念念的“铁饭碗”,也被这些数字人给捧上了。数字人捧上了“铁饭碗”简单翻看一下全国各地事业单位的“录
黑芝麻智能敲钟后,港交所门口又有一些智驾芯片企业引发关注。据悉,近日地平线已通过中国证监会IPO备案,拟发行不超过11.5亿股境外上市普通股并在香港联合交易所上市,预计筹集约5亿美元资金。从天眼查可以了解到,该公司成立于2015年,是一家乘用车高级辅助驾驶(ADAS)和高阶自动驾驶(AD)解决方案供
8月21日,万众瞩目的2024世界机器人大会暨博览会在北京亦创国际会展中心盛大开幕。这场为期5天,集“展览”“论坛”“赛事”于一体的机器人盛会,反映了当下机器人领域的繁荣生态。据官方统计数据,今年现场逛展观众高达25万人次,比去年增加25%。机器人行业有多火?看看2024世界机器人大会火爆程度便可知
瞄准场景需求,打造国内领先的自主可控、高质量超大载重高烈度环境特种智能系留无人平台。卓翼智能亮相HICOOL峰会以科技实力荣摘创业大赛一等奖这个比赛5年培育出16家“独角兽”HICOOL2024全球创业者峰会暨创业大赛已于8月25日在北京圆满落下帷幕,大赛共吸引了124个国家和地区的7406个创业项