阿里自研大模型最新进展公开 通义千问2.0正式发布

拾枫
2023-10-31 15:48

10月31日消息,在2023云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成AI时代全栈的云计算体系。

“目前,中国有一半大模型企业跑在阿里云上,280万AI开发者活跃在阿里云魔搭社区上,未来,阿里云将携手千行百业推动AI创新,共享技术红利。”周靖人说。

format-jpg智能时代的云计算技术体系

图源:阿里云

周靖人表示,2009年阿里云就提出“数据中心是一台计算机”的理念,今天,AI时代更加需要这样的技术体系。作为一台超级计算机的云计算,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务。

 为了保证大模型训练的稳定互联和高效并行计算,阿里云全新升级了人工智能平台PAI。PAI底层采用HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,远超业界水平;在大模型训练任务中,可节省超过50%算力资源

阿里云通义大模型系列就是基于人工智能平台PAI训练而成。除了通义大模型,中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

format-jpg

 阿里云全面升级AI基础设施

图源:阿里云

如今,阿里云已在全球30个地域建设了89个云计算数据中心,提供3000余个边缘计算节点阿里云已成为中国大模型的公共AI算力底座。截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。

周靖人说:“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”据悉,阿里云上有超过30款云产品接入了大模型能力,例如阿里云大数据治理平台DataWorks新增了全新的交互形态——Copilot,用户只需用自然语言输入即可生成SQL,并自动执行相应的数据ETL操作,整体开发与分析可提效30%以上。

阿里云容器、数据库等产品上也提供了类似的开发体验,可实现NL2SQL、SQL注释生成/纠错/优化等功能,未来这些能力还将集成到阿里云其他产品上。在2023云栖大会现场,周靖人公布了阿里自研大模型的最新进展,发布千亿级参数规模的通义千问2.0。通义千问2.0在10个权威测评中全面超越GPT-3.5和Llama2,加速追赶GPT-4。

format-jpg

通义千问2.0千亿级参数规模大模型发布

图源:阿里云

在云栖大会现场,周靖人发布一站式大模型应用开发平台——阿里云百炼,该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。

为推动大模型更易在千行百业集成落地,阿里云基于通义“打样”了8个行业大模型,并在现场公布进展:个性化角色创作平台通义星尘、智能投研助手通义点金、AI阅读助手通义智文等首次亮相;智能编码助手通义灵码已在阿里云内部大规模采用,广受好评;工作学习AI助手通义听悟每天处理5万余个音视频,累积用户超100万。

目前,央视网、朗新科技、亚信科技等企业已率先在阿里云百炼上开发专属模型和应用,朗新科技在云上训练出电力专属大模型,开发“电力账单解读智能助手”“电力行业政策解析/数据分析助手”,为客户接待提效50%、降低投诉70%。

“促进中国AI生态繁荣,是阿里云的首要目标。阿里云将坚定打造AI时代最开放的大模型平台,我们欢迎所有大模型接入阿里云百炼,共同向开发者提供AI服务。”周靖人表示。

目前,阿里云已开源通义千问7B、14B版本,下载量突破百万。在现场,周靖人宣布通义千问72B模型即将开源,将成为中国参数最大的开源模型。除了与开发者共享自研新技术,阿里云还大力支持三方大模型发展。在阿里云魔搭社区上,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家,都开源首发他们的核心大模型,阿里云则为开发者们“尝鲜”大模型提供免费GPU算力,截至目前已超3000万小时。

format-jpg阿里云魔搭社区模型下载量突破1亿

图源:阿里云

周靖人透露,魔搭社区现已聚集2300多款AI模型,吸引280万名AI开发者,AI模型下载量突破1亿,成为中国规模最大、开发者最活跃的AI社区。

2023云栖大会上,阿里云宣布了“云工开物计划”,给中国所有大学生每人送一台云服务器。此外,阿里云还将为签约高校提供更大规模的算力资源支持。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已首批达成合作。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
在2023云栖大会现场,阿里云首席技术官发言指出,除了传统的基础设施服务,正在到来的智能时代,阿里云也再一次在这个时代引领了云计算的发展。
阿里云CTO在接受澎湃科技采访。
4月11日消息,在今日的阿里云峰会上,阿里云智能首席技术官发表《云智一体,让智能创新触手可及》的演讲。他表示,云计算已经成为数字时代的创新引擎。阿里云通过全栈产品Serverless化,让技术使用门槛持续降低,产品服务更加易用实惠。在阿里云开发者生态上,他透露,目前已拥有开发者1000万,高校600所,创新创业企业300万。另外他宣布,飞天免费试用计划正式启动,让客户可以零门槛体验云服务。
10月31日消息,2023云栖大会上,阿里云首席技术官发布阿里云高校计划“云工开物”,计划将为中国所有在校大学生免费提供一台云服务器,所有高校学生可享受300元免费额度。此外,阿里云还将为签约高校提供更大规模的算力资源支持。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学和华南理工大学等高校已首批达成合作。
10月31日消息,2023云栖大会现场,阿里云首席技术官宣布阿里模型家族全面升级发布,通义问2.0正式升级发布。据介绍,通义问2.0模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面的达到国际先进水平。与此同时,通义问App也随之发布,用户开始可以下载相关APP进行体验。
阿里云CTO今天宣布阿里云开源通义问720亿参数模型Qwen-72B。
表示,目前通义问的API日调用量已突破亿次,企业用户数突破9万家,开源模型下载量突破700万次。
拾枫
抽丝剥茧,瀚自渺生