业界最强开源大模型来了！通义千问720亿参数模型正式开源

2023-12-01 11:53 来源：互联网我来投稿撤稿纠错

12月1日，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩，成为业界最强开源大模型，性能超越开源标杆Llama 2-70B和大部分商用闭源模型。未来，企业级、科研级的高性能应用，也有了开源大模型这一选项。

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。力度之大，业界无出其右。

业界最强开源模型，填补中国LLM开源领域空白

Qwen-72B基于3T tokens高质量数据训练，延续通义千问预训练模型一贯以来的强势表现，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。

英语任务上，Qwen-72B在MMLU基准测试取得开源模型最高分；中文任务上，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准，得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

在10大权威测评中，通义千问720亿参数模型获得开源模型最优成绩

通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4

Qwen-72B可以处理最多32k的长文本输入，在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游应用集成。比如，Qwen-72B搭载了强大的系统指令（System Prompt）能力，用户只用一句提示词就可定制AI助手，要求大模型扮演某个角色或者执行特定的回复任务。

用户仅用一句提示词就可创建自己的AI助手

此前，中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白，以高性能、高可控、高性价比的优势，提供不亚于商业闭源大模型的选择。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI for Science等科研工作。

从1.8B到72B， 通义千问 率先实现全尺寸开源

如果说Qwen-72B“向上摸高”，抬升了开源大模型的尺寸和性能天花板；发布会上的另一开源模型Qwen-1.8B则“向下探底”，成为尺寸最小的中国开源大模型，推理2K长度文本内容仅需3G显存，可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模，通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果，也可通过阿里云灵积平台调用模型API，或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配，推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云是国内最早开源自研大模型的科技企业，8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单，得到中小企业和个人开发者的青睐，累计下载量超过150万，催生出150多款新模型、新应用。发布会现场，多位开发者伙伴现身说法，分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示，开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为“AI时代最开放的大模型”，与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化，多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步，当天，阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL，迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新，大幅提升通用OCR、视觉推理、中文文本理解基础能力，还能处理各种分辨率和规格的图像，甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化，一个月前发布的通义千问2.0版闭源模型，最近已进阶至2.1版，上下文窗口长度扩展到32k，代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: 大模型

首届通义千问AI挑战赛开赛，参赛者可畅玩通义开源模型家族

12月1日，首届“通义千问AI挑战赛”开赛，参赛者可免费畅玩通义开源模型家族，包括刚刚发布的720亿参数模型Qwen-72B。主办方为参赛者提供价值50万元的免费云上算力和丰厚奖金。赛事分为算法和Agent两大赛道，前者聚焦通义千问大模型的微调训练，希望通过高质量的数据探索开源模型的代码能力上限，后

标签：

大模型
最强开源大模型来了！通义千问720亿参数模型开源发布

12月1日通义千问发布会，阿里云开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩，成为业界最强开源大模型，性能超越开源标杆Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。通义千问当天还开源了18亿参数模型Qwen-1.

标签：

大模型
掰开安卓手机，满屏都是三个字：大模型

这年头，安卓厂商没个大模型，都不敢开手机发布会了。前脚OPPO刚用大模型升级了语音助手，后脚vivo就官宣自研手机AI大模型;小米发布会则直接将大模型当场塞进手机系统……其竞争激烈程度，不亚于抢芯片首发。到底是怎么回事?究其原因，还是智能终端已经成为了各类AIGC应用的落地“新滩头”。先是图像生成大

标签：

大模型
加速大模型落地，容联云发布多款生成式智能服务

基于容联云自主研发的赤兔大模型能力，容联云容犀机器人真正将大模型强大的理解能力、知识学习能力、总结能力、挖掘能力、推理能力融入于实际落地应用中。开创性的打造生成式场景化智能问答、生成式智能辅助、AI运营话术库，帮助企业洞悉更精准的客户真实需求，提升一线客服人员的专业服务能力，并代替人工完成大量低价值

标签：

大模型
从搜索到大模型，百度商业化的“惊险一跃”

文：向善财经关于百度，最近发生了这么两件事儿。一个是华尔街分析师重申了对百度股票的买入评级和目标价，但在该公司11月21日公布第三季度收益之前下调了第三季度收入预期。分析师给出的理由是，线下广告支出走软，以及2G资金减少之后，给智能交通带来挑战。另外一个是最近文心一言正式上线了专业版，并且开始收费，

标签：

百度

大模型

对话李军：人工智能是“第五范式革命”

2025国际人工智能程序设计精英挑战赛（IAEPC）在香港中文大学成功举办。作为主办方之一，欧美同学基金会理事长李军接受了大赛主持人艾诚采访。在采访中，李军认为IAEPC不仅是一场“冠军中的冠军”对决，更是一次全球AI人才的线下交流盛会。大赛“史无前例”的吸引了全球青年科技精英汇聚香港，更加推动和普
对话施韩原与杜瑜皓：与参赛选手一起改变世界

2025国际人工智能程序设计精英挑战赛（IAEPC）在香港中文大学成功举办。作为大赛发起人方之一及裁判委员会负责人，施韩原与杜瑜皓接受了大赛主持人艾诚采访。裁判委员会主席施韩原分享了此次大赛的亮点，IAEPC首次引入创新赛道，探索选手如何与AI合作进行答题。裁判委员会副主席杜瑜皓认为，选手最终目标并
吴林林专访IAEPC冠军：与全球参赛者交流是最重要的一课

2025国际人工智能程序设计精英挑战赛（IAEPC）在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员，采访了大赛冠军选手之一。在吴林林的采访中，选手认为与来自全球的参赛者交流是自己学到的最重要的一课。在科技与AI之前，选手们可以平等、开放、友好的交流。以下是采访实录（有删节）：吴林林
吴林林专访黄锦辉：年轻人要像懂中文一样懂A

2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员,采访了大会嘉宾:全国政协委员、香港特别行政区立法会议员、香港中文大学工程学院副院长、IAEPC联合发起人黄锦辉先生。在吴林林的采访中,黄锦辉教授勉励年轻人要像懂中文和英语一样懂AI,
本以为DeepSeek天下无敌了，没想到Manus更猛

昨天新出了一个AI，据说比DeepSeek还牛，而截止到今早，已经有10万人在排队申请Manus邀请码了，而且它邀请码已经炒到10万了。这是北京的一家人工智能公司蝴蝶科技，创始人是一名来自华中科技大学的90后毕业生肖弘，突然向全球宣布：世界上第一款真正的人工智能、通用智能体产品出现了，名叫Manus

标签：

ai智能
别让DeepSeek成了造谣者的“白手套”

谣言肆虐，擦亮眼睛

库克已纳投名状：苹果AI没得选，只能选百度

苹果16弄了两个版本，一个是专门给中国人用的，准备用百度的AI，还要交钱。第二个是全世界都可以用的，用了ChatGPT，包括台湾、香港、澳门都可以用。以后都这样了。好，问题就出在这，苹果和百度的合作出现问题了，新闻连起来看，才能明白其中含义。新闻一：苹果正在和腾讯、字节初步接洽，考虑将二者的AI模型

标签：

苹果AI

百度AI

库克
AI加速时代的“进度条”，我们拨动了百分之几？

“技术日新月异，人类生活方式正在快速转变，这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切，都开始变得陌生。”计算机之父约翰·冯·诺依曼曾这样说到。

标签：

ai智能
AI视频赛道，要变天了

“毁灭你，与你何干？”，这是在刘慈欣的科幻小说《三体》里用来形容人类与三体人之间的战争的一句话。

标签：

ai智能
“创造市场”与“算法进化”，中美AI竞速的岔路口

“人工智能的商业模式，是要创造一个市场，而非一个算法”。这是世界AI泰斗MichaelI.Jordan的观点。而当前的全球AI市场，占据主导地位的中美双方，却也走出了两条截然不同的技术路径，前者执着于前沿技术的探索，后者则发力应用优化和商业化落地。南辕北辙的两个方向，或许已经无法直接进行排位先后、优

标签：

ai智能

加载更多

业界最强开源大模型来了！通义千问720亿参数模型正式开源

相关文章

首届通义千问AI挑战赛开赛，参赛者可畅玩通义开源模型家族

最强开源大模型来了！通义千问720亿参数模型开源发布

掰开安卓手机，满屏都是三个字：大模型

加速大模型落地，容联云发布多款生成式智能服务

从搜索到大模型，百度商业化的“惊险一跃”

对话李军：人工智能是“第五范式革命”

对话施韩原与杜瑜皓：与参赛选手一起改变世界

吴林林专访IAEPC冠军：与全球参赛者交流是最重要的一课

吴林林专访黄锦辉：年轻人要像懂中文一样懂A

本以为DeepSeek天下无敌了，没想到Manus更猛

别让DeepSeek成了造谣者的“白手套”

库克已纳投名状：苹果AI没得选，只能选百度

AI加速时代的“进度条”，我们拨动了百分之几？

AI视频赛道，要变天了

“创造市场”与“算法进化”，中美AI竞速的岔路口

热门排行

编辑推荐