大模型“淘金”的创业者，阵痛比红利来的还早？

2023-10-19 10:28 来源：A5专栏我来投稿撤稿纠错

根据北京市经信局公布的数据，截止到2023年10月初，国内公开的AI大模型数量已经达到238个。

尽管学术界对大模型的参数量并没有明确的标准，许多10亿级参数的模型并不能和GPT4相提并论，国内大模型的爆发式增长，无疑揭示了一个既定事实：和每一次风口出现时一样，总有人一窝蜂地涌入，试图在新一轮的创业潮中搏一个机会。

就像创新工场董事长李开复的观点：AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命，它将比Windows、安卓要大10倍甚至更多，它会让每个应用改写，会重构人类的工作，会让有创意的那些人的聪明才智被放大10倍或者更多......

为了不错过“百年一见”的历史机遇，一场“百模大战”正在上演，可问题在于：当前的大模型战场，当真是属于创业者的机会吗？

01 “插件”更像是一种过渡

大模型的爆火，属于多种因素叠加的结果，其中让大多数人印象深刻的标志性事件有两个：一个是ChatGPT的走红，月活用户量在两个月的时间里就超过一亿；另一个是英伟达CEO黄仁勋的比喻，认为“AI的iPhone时刻已经来临”。

冷静下来思考，这两个事件都有着鲜明的移动互联网色彩，将月活视为一个产品成败的标准，将某个产品的爆炸性增长视为市场需求被激活的晴雨表。这样的逻辑是否合理还不得而知，但深深影响了大模型商业模式的构建。

于是，很多大模型都在打造自己的“应用中心”。OpenAI上线了ChatGPT插件，付费用户可以调用插件解决某类需求，目前ChatGPT上已经有近1000个插件；国内的百度也在积极布局，发布文心一言插件生态平台“灵境矩阵”，并计划提供百亿流量、亿元基金等激励来扶持插件生态。

个中缘由并不难理解。

无论是站在移动互联网塔尖的苹果，还是出货量稳居前五的安卓厂商，无不构建了应用市场的变现模式，衍生出了广告排名、支付分成、游戏联运等多种盈利方式。甚至微信这样的超级APP，也通过小程序实现了类似的机制。

就现阶段来看，像手机厂商一样经营“插件生态”，可能是大模型平台当下的最佳选项，而开发者同样乐见其成。

就像移动互联网催生的流量红利，灌溉了大大小小的应用，倘若大模型可以沿着移动互联网的轨迹增长，大概率将带来了新一轮的红利。为大模型平台开发插件，可能会得到平台的流量倾斜，拿到大模型时代的门票，乃至通过“降维打击”的方式颠覆固有的市场格局。

问题在于，大模型平台能否成为占领用户习惯的入口？在互联网和移动互联网时代，入口一词频频被提及，可以细分为内容、应用、操作系统、硬件四个维度，充当着用户获取信息、解决问题的第一触点。

眼下的挑战在于，坊间普遍认为通用大模型会趋向寡头化，最终只剩下两到三家，开发者选择加入哪个大模型插件生态，就像是一场豪赌。毕竟ChatGPT的访问量已经连续三个月下滑，而且功能相似的聊天机器人应用仍层出不穷，在大多数用户的习惯养成前，无法断言哪个大模型会是最后的赢家。

把视野再放大一些的话，聊天机器人可能并不是大模型的终极应用，更像是一个启蒙产品。

比如华为已经将大模型和语音助手小艺融合，不排除越来越多的智能手机、智能音箱、智能家居类厂商有同样的计划，语音助手逐渐成为人们唤醒大模型的主流方式；再比如一些人鼓吹的Agent，即可以能自主理解、规划决策、执行复杂任务的智能体，自动帮主人处理一些繁琐的流程性工作。

无论是哪一种情况，都意味着插件不过是一种过渡，用户需要的只是连接某个服务，不需要知道服务来自哪个插件。先调用某个插件才能获得某项能力的交互，注定是大模型初级阶段的产物。

02 垂直大模型是金矿吗？

事实似乎也是如此。不管是ChatGPT还是同类产品，插件的主要贡献者集中在独立开发者和人数较少的小团队，那些手握上千万用户和海量数据的产品，好像对插件背后的机会窗口不太感兴趣。

毕竟插件生态的主导者是通用大模型，插件的作用可以归类为AI+的范畴，目的是为了扩展大模型的多元能力。借用百度集团资深副总裁何俊杰的观点：“如果说大模型是一颗聪明的大脑，那么插件就是大模型的手和脚。”

典型的例子就是文档处理类的插件，调用大模型的能力对用户的文档进行处理，再基于文档完成摘要、问答、创作等任务。插件扮演的终归是工具的角色，而工具类产品的宿命普遍不太乐观：风口期收获了大把的流量，但大多数工具没能走通变现的路子，风口过后还要买流量来维持增长。

有野心的开发者不甘心做插件，做通用大模型的“寄生品”，瞄准了更有吸引力的选择：

一种是基于大模型的能力开发独立应用，或为自己的应用接入大模型厂商的API，进而提升产品的服务能力；另一种是在通用大模型或开源大模型的基础上，训练适用于垂直场景的模型。据说北京市已经有115个AI大模型，其中垂直大模型占到了103个。

前者的挑战在于，目前的产品主要集中在对话型、绘画类产品上，且以To C场景为主。只不过C端用户仍以闲聊、娱乐为主，尚未产生实实在在的生产力，导致付费意愿通常比较低。同时还存在产品同质化的现象，以闲聊类产品为例，早期的产品普遍基于公开语料，假如用户的提问难以产生有价值的数据，差异化也就无从谈起。

To B渐渐成了行业内心照不宣的选项。

大模型的能力听起来很美好，大多数企业却用不起来，原因在于通用大模型无法很好地解决垂类问题。对于B端企业来说，可以将自己服务行业的专业知识灌输给大模型做进一步的训练与微调，训练完后在本地进行私有部署，再来解决对应垂类问题。

这就为垂直大模型提供了充足的想象空间，也是创业者扎堆的赛道。B端企业的场景比较明确，并且积累了海量的数据，既能为大模型训练提供数据，还提供了大模型效果的检验场。

相对不那么乐观的是，现阶段愿意为大模型付费的，还只有金融为首的个别场景，不少行业还在观望中。以金融大模型为例，目前发布了金融大模型的企业有蚂蚁集团、Bloomberg、MorganStanley、Lemonade、苏黎世保险、度小满、瑞穗金融集团等，要么手握海量金融数据，要么有自研大模型的背景，都不是靠一腔热血闯进市场的创业者。

简而言之，大模型的想象空间越大，想要从中寻找机会的企业就越多，留给创业者的机会窗口并没有太多。况且还有一个无法规避的问题：在和大厂同台竞争的过程中，创业者有资本试错吗？通往大模型的远方有千万条路，也意味着会有千万个死胡同。

03 创业者“无法承受之痛”

首当其冲的正是合规问题。国内在7月初出台了大模型备案要求，依靠API接口获取境外大模型能力的模式受到挑战，导致年初时就接入OpenAI做应用的团队，在不同程度上陷入了困境。

比如某在线设计平台，曾是国内最早推出AI生图的产品之一，并围绕AI生图搭建了社区生态。但在9月初的时候，这家平台突然宣布“网站维护”，一直到一个多月后，依然是“网站升级中”的状态。而在每天都有新事物出现的大模型行业，早期的先发优势正不可避免地随着时间消亡。

和过往几次“风口”最大的不同，在大模型的曙光面前，创业者很兴奋，监管却很理性，为了避免大模型市场重蹈野蛮生长的局面，避免大模型走向失控，相关政策和法规密集出台。

就在不久前，科技部、工信部、教育部等10部门联合印发《科技伦理审查办法（试行）》，明确提到：算法、模型和系统的设计、实现、应用等遵守公平、公正、透明、可靠、可控等原则，符合国家有关要求，伦理风险评估审核和应急处置方案合理，用户权益保护措施全面得当等。

几乎在同一时间，全国信息安全标准化技术委员会发布了《生成式人工智能服务安全基本要求》（征求意见稿），涉及语料安全、模型安全、安全措施、安全评估等多个方面。

其中在语料安全要求中，不仅明确提出语料可溯源，包括开源语料和自采语料，还提出要建立语料来源黑名单，不使用黑名单来源的数据进行训练。“应对各来源语料进行安全评估，单一来源语料内容中含违法不良信息超过5%的，应将该来源加入黑名单。”

也就是说，在监管趋严的背景下，等待开发者的不单单是备案问题，而是系统性的合规要求。无论是调用大模型API做创新的应用层开发者，还是想在垂直领域分一杯羹的垂类大模型，“蒙眼狂奔”的选项已经消失，必须要谨慎应对潜在的合规和安全风险。

如果开发者基于某个不合规的通用大模型训练产品，为了满足合规需求而切换大模型的话，需要重新处理数据，因为不同大模型的训练数据不同，开发者需要重新对数据进行清洗、预处理和标注；需要基于新模型训练和调优，包括训练算法、超参数，以及反复的实验和调整；在模型部署和应用过程中，还要考虑不同的部署平台和框架……

垂直大模型大发展需要应对的潜在风险更多。就像《生成式人工智能服务安全基本要求》中提到的，预训练、优化训练等环节的输入端数据均纳入“训练语料”的范畴，过去靠采集境外数据进行训练的方案已经行不通，势必要花更多的精力进行数据采集、清洗、标注。数据影响着大模型的“智商”，同时也左右着垂直大模型的生死。

相比于巨头们充沛的资源，大模型创业者面临的挑战将越来越多，现阶段是合规，下阶段可能就是盈利了。

04 写在最后

用一句话形容大模型时代的创业者：表面上鲜花着锦，实际上烈火烹油，从抢跑到碰壁，不过才半年时间。

也许大模型时代不缺少机会，但每一条赛道都不会是康庄大道，不缺少冲出一家家独角兽的机会，比例上注定是九死一生。结果大概率和一次次淘金热一样，淘到金子的人寥寥无几，卖水人悄悄发了财。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: 大模型; 创业者

揭秘成功创业者的最大秘密：独立性才是真正的升职加薪！

收到后台粉丝留言：为什么我们应该追求独立性而不仅仅是升职加薪？这个问题非常好。作为中小微企业老板，不断提高自己的独立性是至关重要的，这不仅是为了个人成长，更是为了创业事业的成功。在现代社会中，我们常常被教育和社会期望关注职位晋升、薪资增长，但是拥有独立性才是真正让我们在工作中获得满足感和成就感的关键

标签：

创业者
普通创业者，如何与行业大V建立链接？

有公众号粉丝留言：我是一个个人创业者，想跟一些行业大V建立链接，但是我不知道具体方法，您能否给指点一二？借力大V是一个非常不错的选择，也是很多创业者的需求。想象一下，作为一个普通的创业者，你能够与行业的权威人物建立联系，获得他们的支持和指导。这将是一个巨大的优势，有助于你的事业取得长足的进步。但是，

标签：

创业者
大模型应用疯狂加速，洗牌却在静悄悄进行了

随着未来不断有新的企业通过备案，“大模型+”的应用拐点正在到来。

标签：

大模型
大模型深挖数据要素价值：算法、算力之后，存储载体价值凸显

存储之轮，如何推动大模型加速前进？

标签：

大模型
垂直行业大模型“封神”背后，AI数据服务走入“深水区”

进军垂直行业大模型领域，云测数据三重思维继续引领AI数据服务

标签：

大模型

3亿自媒体正在批量停更：10块的商单一堆人抢着做

种种迹象表明：自媒体行业越来越难做了，而且停更的自媒体越来越多。据不完全统计，国内自媒体帐号总数有超过三亿个，至少有一亿人把自媒体当成副业。自媒体到底难不难做，大家看看下面的例子就知道了：(1)一个商单，两个自媒体平台(今日头条+小红书)加起来一共10块钱，但一堆人抢着做：(2)值得买黄V代发一篇文
定性了：企业信用修复收费=违法违规

这根本是"空手套白狼"的暴利生意!成本为0，收费几千到几万?成本几乎为0，但能赚大几千块钱。难怪这么人做这个业务(文末附免费修复攻略，别再被割韭菜!)。这不，国家终于出手了!4月2日，国家发改委在新闻发布会直接开炮：一些第三方机构，信用信息更细不及时，甚至要求有偿修复，还有一些不法分子通过黄成能够“
马化腾发文章了，马云也回来了，肯定不是偶然现象

昨天，一向低调的马化腾突然在人民日报发文章称：为经济回升向好贡献互联网力量，他相信民营企业一定会有光明的前景。原文我就不发出来了，你们可以去官方看看搜搜。大致内容如下：①近期，一揽子增量政策持续推出，聚焦当前经济运行中的痛点堵点;②互联网等数字技术产业是中国发展的新动能，在提振经济中承担着重要责任;

标签：

马云

马化腾
发力蓝海市场，中国企业拓展非洲业务

近年来，非洲的经济表现的确引人注目。非洲开发银行（AfDB）今年5月发布的《2022年非洲经济展望报告》认为，在新冠肺炎疫情肆虐的情况下，非洲经济在经历负增长后，于2021年实现快速反弹，增长率达6.9%。联合国贸发会议（UNCTAD）6月发布的《世界投资》报告显示，2021年非洲吸收的直接投资较上
一场奶茶店和餐饮店倒闭潮开始了

关注卢松松，会经常给你分享一些我的经验和观点。年底了，看到一些奶茶店、餐饮店转让关门，非常悲凉。不由是在发个预警：大家都在开店的时，你就别开店啦!先给你看看3个数据就晓得了哈：(1)书亦烧仙草90天关店1605家，新开店496家，关店数达到开店数三倍了，还有今年上半年奈雪亏损了4.4亿，茶百道营收下
“创客北京2024”创新创业大赛中国通号•轨道交通通信信号行业专项赛决赛圆满收官

8月30日，“创客北京2024”创新创业大赛中国通号•轨道交通通信信号行业专项赛决赛圆满收官。决赛邀请了来自于国家铁路局、中国通号、中国铁道科学研究院、北京地铁、北京交通大学等单位的7名评审专家参加会议，对参赛项目进行了评审。丰台区轨道交通智能控制产业集群、中国通号研究设计院集团的有关领导代表出席会

教你用五位一体法打造个人品牌

秦刚老师：您好，我是倩美塑身衣符姐。我是比较简单的一个人，过去的10年内生了3个孩子，创立了一个电商品牌——倩美。做倩美这个电商品牌的时候，我是有痛点的，因为我生完孩子以后发现身材变形严重，接受不了全职做妈妈这个角色，特别迫切地想恢复身材。机缘巧合下，我接触到了塑身衣这个行业。我服务的人群分两类：一
什么样的免费内容，能够吸引精准优质用户？

秦刚老师：您好，我是帮孩子解决休学问题的陶老师。我此前一直在做学校教育，一方面是服务那些不适应传统教育，以及有一些心理状况特殊需求的学生；另一方面是服务培训机构，进行连锁加盟。2017年因为一些情况，我退出来了，退出后来到了大理。我有20多年青少年辅导和心理教育培训经验，针对这部分群体，我在大理又做
大健康行业：下一个财富风口，你准备好了吗？

有粉丝留言：秦刚老师，在中国老龄化的背景下，大健康行业正快速崛起，巨大的市场潜力和商机令人瞩目。作为普通人，我们如何参与其中并实现财富增长？借这个提问，我来聊一下热门话题——大健康行业。曾经的首富马云曾说过，下一个中国的马云可能会在大健康行业崛起。有人或许会以为这只是个玩笑，但是我们不能忽视一个事实
定位不清，赚钱难，特别焦虑？怎么办？

你知道自己的用户都是谁吗？听到这个问题，你可能觉得很好笑：废话，我做生意这么多年了，自己的用户群体是谁还不知道吗？但让你具体地描述出来，他们是哪个年龄层的？他们居住在几线城市？他们的收入状况是怎样的？他们的家庭和婚姻状况怎样？他们的价值观是什么？他们的梦想是什么？........估计你就会傻眼了！那

加载更多

大模型“淘金”的创业者，阵痛比红利来的还早？

相关文章

揭秘成功创业者的最大秘密：独立性才是真正的升职加薪！

普通创业者，如何与行业大V建立链接？

大模型应用疯狂加速，洗牌却在静悄悄进行了

大模型深挖数据要素价值：算法、算力之后，存储载体价值凸显

垂直行业大模型“封神”背后，AI数据服务走入“深水区”

3亿自媒体正在批量停更：10块的商单一堆人抢着做

定性了：企业信用修复收费=违法违规

马化腾发文章了，马云也回来了，肯定不是偶然现象

发力蓝海市场，中国企业拓展非洲业务

一场奶茶店和餐饮店倒闭潮开始了

“创客北京2024”创新创业大赛中国通号•轨道交通通信信号行业专项赛决赛圆满收官

教你用五位一体法打造个人品牌

什么样的免费内容，能够吸引精准优质用户？

大健康行业：下一个财富风口，你准备好了吗？

定位不清，赚钱难，特别焦虑？怎么办？

热门排行

编辑推荐