1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

崔大宝:大模型降温背后的难点、卡点、节点

 2024-09-03 10:58  来源:A5专栏  我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

崔大宝 | 节点财经创始人

进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;

消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……

热闹的大概只剩下两场酣仗 :自5月15日字节跳动宣布“以厘计费”,打响国内大模型“价格战”的第一枪,百度文心、讯飞星火、阿里通义、腾讯元宝等纷纷跟进;

同时,地铁、写字楼、机场等白领人群密集区域,百度文心、讯飞星火、阿里通义、腾讯元宝、华为盘古的Slogan,你方唱罢我登台,贴脸营销如枪林刀树。

“海水”与“火焰”交融的场面,不得不让人思考,大模型的出路究竟在哪里?难点、卡点、节点又是什么?

01 难点:盈利难&落地难

强如OpenAI,也面临“恰饭”的难题。

援引外媒报道,OpenAI预估亏损50亿美元,全年运营总成本高达85亿美元,照此估算,其现金流大概率在一年内耗尽。

而在一篇题为《How does OpenAI Survive》的长文中,作者对OpenAI的商业模式产生了质疑:

“OpenAI的营收在35亿至45亿美元之间,但其运营亏损可能高达50亿美元,其收入远远无法覆盖成本。而为了推出下一代的大模型GPT5,OpenAI需要更多的数据和算力,这又是一大笔花费。”

说千道万,靠着“碎钞式”的大力出奇迹后,大模型却仍未找到一条合理的盈利路径。

据《节点财经》观察,市面上的大模型,大部分都采取To C+To B,即会员订阅+开发者API调用“两条腿”走路。

但无论是To C,还是To C,能一上来就产生付费的寥寥无几,若再刨除重负的减项,多半是鼻子大过脸。

以本土大模型先行者百度为例,2024年Q1,其云业务收入为47亿元,同比增长12%,其中6.9%来自外部客户使用大模型及生成式AI相关服务,约为3.24亿元。

而在2023年Q4,大模型为百度云贡献了6.6 亿元增量收入。

这是国内唯一披露大模型收益的厂商,本身又是家大业大,有底气拼到底的巨擘。 但只谈创收,忽略创利,就是耍流氓。

可想而知,其余不敢明示账目的选手,内心有多迷茫、煎熬。

不挣钱,难挣钱的背后,是大模型落地难的窘境。

虽然大佬们高呼“ChatGPT”的问世是“iPhone时刻”,第四次工业革命,新一代的“火”和“电”,但坦率地讲,当下大模型还有很多局限性,包括认知偏差、能动性欠缺、泛化性能弱、幻觉等。

比如,数值运算就是大模型明显的弱项,或者说大模型是妥妥的“文科生”,做数学题的智商可能连二、三年级的小学生都不如。

《节点财经》亲测,在Kimi输入:“9.11和9.8哪个大?”一顿啰嗦后,Kimi给出了完全不正确的答案。

图源:Kimi官网

比如,大模型资料更新不及时,必须外挂知识库才能在一定程度上缓解这个痛点,并且还是无法完全解决“一本正经地胡说八道”的尴尬。

前几天刷屏的SearchGPT,就在各地网友兴致勃勃等待灰测展现AI搜索的“洪荒之力”时,《大西洋月刊》浇了一盆冷水,眼尖的记者发现:

问的是关于“八月份北卡罗来纳州的布恩音乐节”的细节,SearchGPT的回答分为5条,3条里包含事实错误——有的是把举办日期弄错,有的是把距离和车程搞混,有的是把场馆网址张冠李戴。

再如,大模型绝对是“健忘症”患者,我们在和它对话时,尤其是多轮对话时,难免要化身“复读机”,一遍一遍重复相同的话术。

而在B端,因为实战经验不足,生分于对方的Know-How,加之环境的复杂多变性,大模型面临的挑战更艰巨。某业内人士表示,迄今大模型在行业中尚没有一个成熟的案例。

02 卡点:数据、算力、成本

深入肌理地分析,大模型的“落地难”又与自身的三大卡点:数据、算力、成本息息相连。

➊ 卡在数据

如果把大模型比作一头巨兽,那它的显著特征之一便是“不停进食”:需要高质量、大面积的语料做长久期、高频次地投喂、催肥。

换言之,“食物”的品质、多寡、新鲜度、多样性等,决定了大模型的迭代进度和学习效果。

无疑,这对数据的挖掘、获取提出严峻考验,关系到各方的权益保障、利益分配、版权归属等,通常涉及到敏感信息时,数据的清洗、标注、脱敏又会很繁杂。

前阵,免费网文APP番茄小说因一份“AI协议”引发轩然大波。根据该份协议,平台可以将签约作品,含名称、大纲、简介、章节等,作为“哺育”AI大模型的素材,用于各种应用场景,如智能对话、智能文本创作等。

不过,这一举动遭到作者的普遍反对,认为其不仅威胁网络写手的生计,还损害了原创内容的价值,甚至发起联合断更以示抗议。

➋ 卡在算力

如果把AI链路比作一间工厂,那么算力便是维持工厂运转,量级夸张且进价不菲的“燃料”(煤、石油、电力等)。

公开资料显示,初始ChatGPT匹配的算力是1万块英伟达A100(AI芯片),花费超过7亿元。后续调优每天消耗的算力大概是3640PFLOPS,即7至8个算力达500PFLOPS的Data Center的支撑,整体基建开支以百亿计。

按照广发证券的测算,在暂不考虑软件层面算法优化的前提下,本土AI大模型在训练与判断、预测阶段所需算力,相当于1.1万台或3.8万台(乐观假设下)高端AI服务器,大致对应约126亿元到434亿元的资金体量。

进一步地,随着大模型规模状大,算力需求会倍数递增,已然超越硬件的摩尔定律。据悉,ChatGPT从1.0到3.0,参数量从1.17亿狂飙到1750亿。

而目前,我们在算力这块既面临外部“卡脖子”,内部建设又相对落后,碎片化、传输慢、协同难、人才紧缺等“痼疾”亟待突破,导致大模型的实效逊于国外。

“大模型只有两个梯队,OpenAI和Others,国产用哪家都一样”,多位AI从业者谈道。

➌ 卡在成本

大模型“桎梏”于算力,实际也是“桎梏”于成本。

计算机飞入千家万户,售价下探,变得亲民、接地气,很关键;智能手机能人手一部,物美价廉的小米功不可没;新能源汽车的热卖,离不开动力电池的“跳水式”降价……

从人类历史的进程看,任何一项新技术的推广、普及,都离不开对成本的有效、大力压缩、控制。

硬币的背面,是科技发展和工业文明进步共同作用下,制造效率、运算精度提升,人均产值拔高,各类物料愈发便宜等因素集结的强大驱动力,进而减轻C端、B端“太贵了,买还不买”的纠结。

大模型同理,浩大的开支也是其成长途中的“绊脚石”。试想,当生态里只有唯一的“卖铲人”(英伟达)赚钱,赚头还不小,怎么可能持续呢?

好消息是,今年2月末,李彦宏透露,自发布以来,百度不断降低文心大模型在推理方面的成本,已降至去年3月版本的1%。

03 节点:在产业里“种植”大模型

毋庸置疑,大模型仍有诸多“短板”和缺陷,但新技术的魅力向来在于探索“无人区”,跋涉“深水区”。

很多眼下看似微弱的“火种”,往往都孕育着日后“纳须弥于芥子”的宏壮。尽管迄今为止的大模型,大家都是拿着锤子找钉子,但我们已经看到,其正逐步向产业迈进,尝试扮演了一些浅层的Agent的角色。

最醒目的标识便是,大模型不再坐而论道,只会聊天、写诗、作画,而是起而动之,走出实验室,去往矿区、政务、金融、医药、金融、物流等具体领域,努力兑现自己的终极使命。

比如,在矿区,下井工人常年深陷光线昏暗、浮尘弥漫的环境,叠加经年累月高强度的劳碌,使不少人都患上了风湿、耳鸣等职业病,更甚者,还可能遭遇瓦斯、透水等意外,但矿区作业又十分依赖人力,特别是主运系统巡检。

华为的盘古矿山大模型这时候便派上用场了。其覆盖煤矿的采、掘、机、运、通、洗选等流程下的1000多个细分场景,用AI取代人成为主运智能监测系统的眼睛,能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%,动作规范识别准确率超过95%,且全时段巡逻助力工作人员,避免因漏检造成的安全事故,缩短停机时间。

京东表示,基座大模型是靠卡训出来的,企业大模型是靠人用出来的。

物流领域,揽收、派送、分拣、辅助,应对突发事件等,快递员每天都背负着繁重的任务,还要熟悉货物处理规程、安全操作标准、客服要求等多达上百个规范,把这些统统记牢,肯定要耗费大把功夫,还容易混淆。

京东言犀大模型的小哥终端助手大大化解了上述烦恼。它告别了只“动脑”的境界,能直接“下手”,快递员动动嘴,小哥终端助手就能立即将送货通知发给客户。如今,小哥终端助手为JD商城近35万自有配送员“效劳”。

再如,零售行业,基于京东言犀大模型的AIGC营销工具“京点点”,不仅可以帮助商家一键出商品图,还支持了超过2000种视觉元素道具;不仅可以丰富吸睛资源和表现力,还能依循商品属性、特点和宣传想要的个性化布局,实时、自主撰写创意卖点、种草文案、直播脚本等。

总的来说,把大模型“种植”在产业里,让大模型在产业里生长、发芽,俨然是现在大厂的共识,必须攻克的难关。长远看,该共识亦如“星星之火”终会燎原旷野。

写在最后

当喧嚣过后,大模型这场豪华游戏,能留在牌桌的玩家,注定只是少数。

面对数据、算力、成本等现实问题,供需两端渐渐回归理性。可以预见,在真“好用”和能“吸金”之间,大模型还有很长的路要走。

*题图由AI生成

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
大模型

相关文章

  • 两分钟“熟读”《国史大纲》,大模型的下一个爆点是“书童”?

    年初大模型行业上演“长文本”大战时,我们就萌生过做一个“读书助理”的想法。测试了市面上主流的大模型后,发现普遍存在两个不足:一种是可以处理的文本长度不够,即使有些大模型将文本长度提升到了20万字,像《红楼梦》这样近百万字的名著,还是需要多次才能“读”完。另一种是语言理解和生成能力不足,经常出现“幻觉

    标签:
    大模型
  • 除了烧钱,互联网留给大模型挥霍的“家底”不多了

    互联网或许从未停止创新,只是对于创新的认知下降了。

    标签:
    大模型
  • 谁该成为大模型成长的“养料”?

    在科技进步的历史征程里,我们享受技术成果之前,似乎总要付出一些“隐形”成本。

    标签:
    大模型
  • 百川智能,摘下“大模型皇冠上的明珠”?

    随着AI产业化和产业AI化成为业界共识,大模型的“新赛季”来了。2024年是国产大模型全面商业化的元年,各地人工智能产业发展的政策密集出台。同时,在2024世界人工智能大会(WAIC2024)上,各大AI厂商纷纷表示要让大模型落地应用场景。不过,对于大模型商业化的路线,科技巨头和大模型初创公司之间存

    标签:
    大模型
  • 最后一公里不解决,大模型开闭源都一文不值

    对所有大模型而言,其真正考验如同科大讯飞创始人刘庆峰所说,在最后一公里的应用和商业化落地上。作者|Cindy编辑|杨铭恐怕谁也不会想到,百模大战进入商业化下半场,围绕大模型大规模、旷日持久的战争,竟是开源和闭源路线的交锋。最近,在2024世界人工智能大会(WAIC)上,刘庆峰、李彦宏、王坚、朱啸虎、

    标签:
    大模型
  • 智能体进化发展了一年,现在的RPA Agent迭代到什么程度了?

    智能体进化发展了一年,现在的RPAAgent迭代到什么程度了?从实在智能最新发布的实在Agent7.0,看RPAAgent的迭代升级抓取豆瓣信息、自己制作PPT,这款AIAgent真的实现了流程全自动化AIAgent构建到执行全自动化,持续进化RPAAgent再次降低智能体应用门槛实在智能重磅发布实

  • 崔大宝:大模型降温背后的难点、卡点、节点

    崔大宝|节点财经创始人进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“以厘计费”,打响国内大模型

    标签:
    大模型
  • 这一届“出道”的数字人,已经拿捧上了“铁饭碗”

    文|智能相对论作者|陈泊丞好消息!你心心念念的事业单位发录取公告了!坏消息!他们没录你,录了个数字人。图片来源网络随着数字人技术的突破,越来越多的传统企业和机构开始用上了“数字员工”。甚至很多中国人心心念念的“铁饭碗”,也被这些数字人给捧上了。数字人捧上了“铁饭碗”简单翻看一下全国各地事业单位的“录

    标签:
    数字人
  • 来到IPO关口,地平线离“三分天下”还有多远?

    黑芝麻智能敲钟后,港交所门口又有一些智驾芯片企业引发关注。据悉,近日地平线已通过中国证监会IPO备案,拟发行不超过11.5亿股境外上市普通股并在香港联合交易所上市,预计筹集约5亿美元资金。从天眼查可以了解到,该公司成立于2015年,是一家乘用车高级辅助驾驶(ADAS)和高阶自动驾驶(AD)解决方案供

  • 机器人大会引领产业动向,卓翼飞思绘制无人系统教科研新蓝图

    8月21日,万众瞩目的2024世界机器人大会暨博览会在北京亦创国际会展中心盛大开幕。这场为期5天,集“展览”“论坛”“赛事”于一体的机器人盛会,反映了当下机器人领域的繁荣生态。据官方统计数据,今年现场逛展观众高达25万人次,比去年增加25%。机器人行业有多火?看看2024世界机器人大会火爆程度便可知

  • 卓翼智能:超大载重高烈度环境特种智能系留无人平台的应用与未来

    瞄准场景需求,打造国内领先的自主可控、高质量超大载重高烈度环境特种智能系留无人平台。卓翼智能亮相HICOOL峰会以科技实力荣摘创业大赛一等奖这个比赛5年培育出16家“独角兽”HICOOL2024全球创业者峰会暨创业大赛已于8月25日在北京圆满落下帷幕,大赛共吸引了124个国家和地区的7406个创业项

  • 60万奖金召唤AI创新者,2024无锡国际人工智能创新应用大赛火热进行中!

    人工智能是新一轮科技革命和产业变革的重要驱动力量。无锡市作为中国的科技创新中心之一,正通过构建人工智能"算力+算法+数据"三要素齐备的产业生态,为产业技术创新应用提供强大支撑,通过“AI+”行动推动人工智能与多个产业交叉融合,实现技术落地和产业化,加速形成新质生产力,打造具有国际竞争力的产业创新智造

  • “云+AI”驱动操作系统创新升级,龙蜥坚持可持续发展路线

    近日,2024龙蜥操作系统大会(OpenAnolisConference)在北京圆满召开,此次大会由中国计算机学会开源发展委员会、中关村科学城委员会、海淀区委网信办、中国开源软件推进联盟指导,龙蜥社区主办,阿里云、浪潮信息、Intel、中兴通讯、Arm、中科方德等24家理事单位共同承办,主题为“进化

  • 探访数字人公司世优科技:AI数字人“情智兼备”的创新之旅

    数字人作为未来产业之一,是新一代信息技术集成创新和应用的未来产业,也是数字经济与实体经济融合的高级形态,数字人和自然人、机器人高度协同,将深刻变革人类生产生活方式,重塑全球产业发展格局。为推动数字人产业高质量发展,培育形成新质生产力,8月28日,世优科技创始人兼CEO纪智辉、世优科技李曦、韩光明接受

编辑推荐