阿里云周靖人宣布通义千问720亿参数模型开源

周兴
2023-12-01 11:37

12月1日消息,阿里云CTO周靖人今天宣布阿里云开源通义千问720亿参数模型Qwen-72B。

据了解,Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。

format-jpg

阿里云CTO周靖人

图源网易科技

与此同时,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,在业界率先实现“全尺寸、全模态”开源。

关于首届通义千问AI挑战赛方面,周靖人表示,首届“通义千问AI挑战赛”开赛,参赛者可免费畅玩通义开源模型家族,包括刚刚发布的720亿参数模型Qwen-72B。即日起开发者可通过天池平台报名参赛。

format-jpg

通义千问发布会现场

图源网易科技

值得一提的是,国际数据公司(IDC)在近日发布了《中国金融云市场(2023上半年)跟踪》(以下简称为报告)。报告显示,阿里云2023年上半年继续保持金融云整体市场第一,市场整体份额为18.5%。此外,阿里云还在金融云基础设施、金融云解决方案、公有云基础设施、平台解决方案、银行解决方案、互联网金融解决方案等6个领域位居第一。

根据报告,2023年上半年中国金融云市场规模达到284亿、同比增速28%。其中,金融云平台解决方案市场增速在所有子市场中排名第一,阿里云的市场份额是第二名的1.9倍、第三名的2.1倍。另外,在公有云基础设施市场,阿里云整体份额是第二名的2.8倍、第三名的4.2倍。

format-jpg

阿里云位居公有云基础设施市场第一

图源阿里云公众号

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里通义发布会后,做了一场闭门分享。
9月19日消息,今日栖大会,阿里CTO发布通义新一代开源模型Qwen2.5,其中,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。截至2024年9月中旬,通义开源模型累计下载量已突破4000万,成为仅次于Llama的世界级模型群。
10月31日消息,2023栖大会现场,阿里首席技术官宣布阿里大模型家族全面升级发布,通义2.0正式升级发布。据介绍,通义2.0模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面的达到国际先进水平。与此同时,通义App也随之发布,用户开始可以下载相关APP进行体验。
9月25日消息,阿里智能首席技术官通义开源发布会上宣布,将全新开源性能更强的大模型Qwen-14B,该模型基于140亿参数,3万亿token训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的QWEN-7B模型能力普遍提升,核心指标最高提升22.5%。
12月4日消息,阿里近日开源了通义720亿参数模型Qwen-72B,这也是目前国内大模型开源的最大参数,至此,通义共开源了18亿、70亿、140亿、720亿参数的4款大模型。阿里CTO通义发布会后做了一场闭门分享,他提到:“我们能看到之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义和ChatGPT 4.0在使用体感上,是互有胜负的。”
表示,目前通义的API日调用量已突破亿次,企业用户数突破9万家,开源模型下载量突破700万次。
10月31日消息,阿里CTO宣布将在11月开源通义720亿参数模型,继续支持全球开发者开展模型和应用创新。阿里已先后开源通义70亿参数模型Qwen7B和140亿参数模型Qwen14B,模型累计下载量超过100万。通义72B将成为参数规模最大的中国开源大模型。目前国内外开源社区已经产生50多款基于通义开源模型训练的新模型和新应用,涵盖医疗、法律、机器人等众多领域。