2023年,几乎可以被定义为中国互联网公司的“大模型元年”。
ChatGPT的全球爆红,彻底点燃国内的大模型赛道,曾经的“创业英雄”、如今的商业领袖们亲自下场,接连发布生成式人工智能产品与大模型布局。
大模型火了,沉寂许久的互联网行业又有了新的“战事”。同时,大模型的快速发展也改变了云市场的现状,企业对算力的需求急剧增长,技术层面从单一云架构向“多云架构”转变的趋势日益显著。
2022年,字节跳动旗下云服务品牌“火山引擎”对4000多家在云上消耗超过100万的企业客户进行调研,他们发现,目前有88%的企业采用多云架构,平均每家企业会使用“五朵云”。
在多云架构趋势与大模型持续迭代的背景下,火山引擎总裁谭待认为,未来将是“多云多模型”的时代。
不难理解,如今国内云服务市场呈现多元化趋势,企业从不同厂商采买云服务已是常态,而大模型也不会一家独大,最终会形成多模型共生甚至协作的生态。
“在多云方面的实践,字节可以说是经验最丰富的一家。”谭待说。
具体到技术与业务层面,在“多云多模型”时代下,火山引擎如何为企业提供针对性的解决方案?
做好大模型的“基础设施”
大模型是人人都想摘得的“玫瑰枝”,但在国内落地实现的壁垒依然很高。
大模型的训练与迭代是对算力和数据的双重考验,也是对企业资金储备与战略定力的挑战;有业内人士估算过,OpenAI 训练 GPT-3 一年,算力成本就高达 2000 万美元。
尤其对中小科技企业或初创公司而言,建设大模型更具体的挑战在于,企业缺乏足够的应用场景实践和行为分析数据,在训练和迭代升级上也存在壁垒。
谭待也认为,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队、丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。
对此,火山引擎的解法是:为大模型客户提供高稳定性和高性价比的AI基础设施。
如何为大模型提供基础设施?据谭待透露,国内大模型领域七成以上企业是火山引擎客户,火山引擎将为他们提供关键的算力支持和技术平台,并为消费者带来更丰富的AI应用。
具体到产品端,近日,火山引擎发布新版机器学习平台:支持万卡大模型训练、微秒级延迟网络,让大模型训练更稳更快。
同时,火山引擎发布了基于自研DPU的Intel CPU计算实例、AMD CPU计算实例、NVIDIA GPU计算实例,以其中“DPU+AMD Genoa CPU平台的计算实例”为例,整机性能最高提升138%,单核性能最高提升39%。
算力是实现大模型迭代的关键一环,而火山引擎通过与字节跳动国内业务并池,将抖音等业务的空闲计算资源极速调度给火山引擎客户使用,确保企业在大模型建设中的数据支持与算力保障。
字节跳动副总裁杨震原表示,“并池”意味着可以调度一些资源,去错峰互用,把运力提上去,“比如其实也有波峰和波谷,凌晨用的人少,这种资源就很适合科学计算的能力。”
字节跳动副总裁杨震原分享抖音的机器学习实践
基于字节系的算力资源和生态能力,火山引擎所提供的大模型基础设施,在运算效率和性价比方面更有优势。
以火山引擎的合作客户MiniMax为例,这是一家已经推出自研大模型产品的独角兽公司,其与火山引擎合作建立的超大规模推理平台,拥有万卡级算力池,支撑单日过亿次调用。
再比如抖音的推荐系统,在火山引擎的算力支持下,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。
“火爆全网的抖音’AI绘画’特效,从启动到上线只用一周多,模型由一名算法工程师完成训练。”杨震原介绍说。
杨震原还认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。
效率更优、算力资源丰富、成本可控的大模型训练与迭代方式,往往是初创型科技公司最为看重的模式,也是火山引擎努力实现的目标。
谭待指出,火山引擎要服务好那些立志做好大模型的公司,为其提供基础算力支持和技术平台。“如何在工程上帮它们优化,提高效率,稳定性,都是我们关注的重点。”
当然,不同企业在不同应用场景下,对云服务和大模型的需求千差万别,火山引擎又如何做好个性化的企业级解决方案?
数据驱动,升级企业解决方案
从2020年成立至今,火山引擎基于内部业务的技术生态,已经向外开放机器翻译、视觉智能等能力,业务覆盖金融、汽车、消费、文娱等行业场景。
不过,事情正在起变化,“多云多模型”时代对云厂商提出更复杂的挑战。
一方面,企业加速搭建“多云架构”,以实现算力的快速增长;另一方面,多模型意味着多场景应用,企业在不同的业务场景中需要差异化的AI应用。
早在2022年,火山引擎就提出“体验创新、数据驱动、敏捷迭代”的云上增长三要素,基于企业不同的应用场景,利用数据驱动搭建云增长模型。
谭待认为,“过去很多企业花费了大量时间构建数据中台,但最后失败了,找不到数据应用的场景,价值也没有发挥出来。其本质在于,企业没有将数据驱动整个体系设计好。”
火山引擎总裁谭待宣布支持“多云多模型”的未来架构
火山引擎非常看重数据驱动为企业降本增效、技术升级所带来的作用,内部对数据使用的价值也有一个明确标准——“0987”,即零事故、满足90%的需求、80%的需求能够通过技术优化实现秒级调用、通过业务部门评价达到70分以上。
坚持以数据驱动为增长核心,火山引擎能在内容、营销等领域提供更多个性化的企业级应用,比如在内容领域通过算法和AI平台帮助创作更优质内容、在内部运营方面通过数据平台优化供应链和库存管理等。
如今,火山引擎的解决方案已经在各行各业落地,进一步带动产业的数字化升级。
2022年卡塔尔世界杯期间,火山引擎就用AI的方式做出窄带高清,一方面提升视频帧率,另外还能降低带宽。
同时,针对网络观众收看比赛最头疼的直播延时问题,火山引擎通过RTM超低时延直播技术,将直播画面的端到端延迟最低降到1s,电视观众和网络观众几乎都能“同频”观看赛事直播。
此外,在公益领域,火山引擎与字节跳动公益将联合推出公益版的电子票据服务与公有云服务,为符合条件的公益组织提供为期3年的免费服务。
据地歌网了解,字节跳动公益电子票据服务已于今年2月上线,目前中华社会救助基金会、中国听力医学发展基金会已申请使用该服务。
中华社会救助基金会相关负责人表示,该基金会2022年开票量超过1万张,电子开票可以节约0.5个财务人力成本。
从直播体验升级到公益票据服务,火山引擎通过数据驱动,努力在不同行业的不同业务场景中落地数字化应用。
火山引擎所处的云计算领域是大市场,专业机构估算,国内云计算市场规模预计在今年突破3000亿元。
但,“多云多模型”时代逐步变为现实,企业对云服务的差异化能力提出更高要求,并且需要将云计算与大模型赋能到实际业务中,带来整体业务升级。
行业正在起变化,云计算企业“不得不变”。
在海外,亚马逊AWS于日前为企业客户推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型等。
在国内,云计算领域竞争激烈,阿里云、华为云等均在行业内深耕多年,火山引擎作为“后发之人”,依托于字节生态“溢出”的2B能力,持续升级企业数字化解决方案。
当然,为适应“多云多模型”时代,为大模型客户提供AI基础设施,火山引擎有着“任重道远”的目标。好在,基于多年的资源储备和场景实践,火山引擎已经摸索出了一条自己的云增长道路。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
7月5日,由艾瑞咨询主办的第15届2023iResearchAwards金瑞奖获奖名单正式揭晓。广州九四智能科技有限公司(简称:九四智能)创始人、CEO刘嗣平凭借在企业服务领域创新的智能用户运营方法论及细致的场景解决方案,从众多候选人中脱颖而出,荣获本届金瑞奖“数字服务年度人物”。金瑞奖于2006年
2023年上海世界移动通信通信大会(简称“MWC上海”)上,思特奇以“智启万物数转赋能”为主题,通过300m²超大展位、8大展台板块,全面呈现公司自主创新原生技术和应用案例,赋能千行百业数智化转型。产业数字化是指以数字技术为引领、数据赋能为主线、平台为支撑,对产业链上下游全要素数字化升级改造的过程,
6月28-30日,2023上海世界移动通信大会(MWC)在上海新国际博览中心举办,作为行业领先的数字化转型产品及解决方案服务商,北京思特奇信息技术股份有限公司(简称:思特奇;股票代码:300608.SZ)以“智启万物数转赋能”主题强势亮相展会,从运营商服务升级、政企产业服务创新、科技创新引领、数字生
在过去的两个多月时间里,MAXHUB2023全国新品品鉴会已先后走进广州、北京、西安、重庆、武汉、上海、杭州、深圳、石家庄、郑州、长沙、成都、呼和浩特、南京、哈尔滨、乌鲁木齐等城市,举办121个场次,吸引超一万名嘉宾参加,构建产业人士与MAXHUB三大空间数字化解决方案近距离体验的平台,打造令众人眼
描述:2023年华映资本年度大会以“无限新成皆繁星”为主题。企企通作为数字化采购与供应链领域的专家,受邀出席本次大会,其创始人&CEO徐辉作为华映资本的被投企业代表进行了数字生态与数字化供应链等核心内容进行了精彩分享。6月16日,2023年华映资本年度大会在杭州成功举办。2023年华映资本年度大会以
把脉中国数据智能化
2023年,几乎可以被定义为中国互联网公司的“大模型元年”。ChatGPT的全球爆红,彻底点燃国内的大模型赛道,曾经的“创业英雄”、如今的商业领袖们亲自下场,接连发布生成式人工智能产品与大模型布局。大模型火了,沉寂许久的互联网行业又有了新的“战事”。同时,大模型的快速发展也改变了云市场的现状,企业对
近日,数字化市场研究咨询机构爱分析发布了《2022爱分析·数据智能厂商全景报告》,爱分析从技术研发能力、服务客户数量、收入规模等维度对厂商进行了全面专业的评估
2022年11月18日,首个国家级大数据产业创新赛事——2022第一届中国大数据大赛圆满落幕。工业和信息化部信息技术发展司数字经济推进处处长张建伦,中国电子技术标准化研究院副院长孙文龙出席颁奖典礼并致辞
2022年11月17日,在厦门市工业和信息化局的指导下,以“数据确权”为主题的2022数据资产(厦门)论坛在厦门成功举办。本次论坛以“数据确权”为主题,由厦门市互联网域名应用服务产业协会和构信网(公信.中国)联合主办
近日,国内知名数字化市场研究咨询机构爱分析正式发布《2022爱分析·信创厂商全景报告》(以下简称“报告”)。报告综合考虑企业关注度、行业落地进展等因素,遴选出在信创市场中具备成熟解决方案和落地能力的厂商。
10月31日下午,由数博会执委会主办、数据观(北京)传媒科技有限公司承办、贵阳大数据交易所协办的第四期数博思享会“实践先行观公共数据价值与应用”活动成功举办。
近日,由中国国际数字经济博览会组委会主办,中国电子技术标准化研究院、河北省工业和信息化厅承办的“第一届中国大数据大赛”(简称大数据大赛)正式启动。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台