阿里云周靖人:通义千问开源模型下载量突破2000万次

刘峰
2024-07-05 16:26

7月5日消息,2024世界人工智能大会期间,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展:今年5月21日,通义千问系列模型大幅降价,GPT-4级主力模型直降97%,低至百万tokens仅0.5元,降价后大批客户在阿里云上直接调用大模型。近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

图片

图源:阿里云公众号

周靖人表示:“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们宣布通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”

去年8月,通义率先加入开源行列,沿着“全模态、全尺寸”开源路线陆续推出了数十款模型,包括语言大模型、多模态大模型、混合专家模型、代码大模型等,在权威榜单多次创造中国大模型的“首次”。

周靖人在会上强调,开源开放战略正为阿里云带来新的商业增长,阿里云会将坚持拥抱开源开放,打造“一朵AI时代最开放的云”。阿里云将携手业界伙伴,持续通过开放的算力平台、开源的自研模型、优质的模型服务,帮助中国企业和开发者抓住大模型时代的机遇。

图片

图源:阿里云公众号

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里通义发布会后,做了一场闭门分享。
阿里CTO今天宣布阿里开源通义720亿参数模型Qwen-72B。
9月19日消息,今日栖大会,阿里CTO发布通义新一代开源模型Qwen2.5,其中,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。截至2024年9月中旬,通义开源模型累计下载量已突破4000万,成为仅次于Llama的世界级模型群。
9月25日消息,阿里智能首席技术官通义开源发布会上宣布,将全新开源性能更强的大模型Qwen-14B,该模型基于140亿参数,3万亿token训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的QWEN-7B模型能力普遍提升,核心指标最高提升22.5%。
12月4日消息,阿里近日开源了通义720亿参数模型Qwen-72B,这也是目前国内大模型开源的最大参数,至此,通义共开源了18亿、70亿、140亿、720亿参数的4款大模型。阿里CTO通义发布会后做了一场闭门分享,他提到:“我们能看到之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义和ChatGPT 4.0在使用体感上,是互有胜负的。”
表示,目前通义的API日调用量已突破亿次,企业用户数突破9万家,开源模型下载量突破700万次。
10月31日消息,阿里CTO宣布将在11月开源通义720亿参数模型,继续支持全球开发者开展模型和应用创新。阿里已先后开源通义70亿参数模型Qwen7B和140亿参数模型Qwen14B,模型累计下载量超过100万。通义72B将成为参数规模最大的中国开源大模型。目前国内外开源社区已经产生50多款基于通义开源模型训练的新模型和新应用,涵盖医疗、法律、机器人等众多领域。
10月31日消息,2023栖大会现场,阿里首席技术官宣布阿里大模型家族全面升级发布,通义2.0正式升级发布。据介绍,通义2.0模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面的达到国际先进水平。与此同时,通义App也随之发布,用户开始可以下载相关APP进行体验。
刘峰
关注人物,保持真实