阿里云率先支持Llama2全系列训练部署 助力打造专属大模型

周兴
2023-07-26 05:30

7月26日消息,阿里云在国内率先推出针对Llama2全系列版本的训练和部署方案。官方表示,欢迎所有开发者来阿里云上打造专属大模型。

近日,Llama2大语言模型宣布开源,覆盖70亿、130亿及700亿参数版本。Llama2可免费用于研究场景和月活7亿用户以下的商业场景,为企业和开发者提供了大模型研究的新工具。然而,对Llama2的再训练和部署仍存在较高门槛,尤其是针对效果更胜一筹的大尺寸版本。

为方便开发者群体,阿里云机器学习平台PAI在国内率先对Llama2系列模型进行深度适配,推出了轻量级微调、全参数微调、推理服务等场景的最佳实践方案,助力开发者快速基于Llama2进行再训练,搭建自己的专属大模型。

format-jpg

(图源阿里云官网截图)

阿里云牵头发起的AI模型社区魔搭ModelScope,第一时间上架了Llama2系列模型。开发者可在魔搭社区Llama2模型页面点击“Notebook快速开发”,一键拉起阿里云机器学习平台PAI,对模型进行云上开发和部署;在其他平台下载的Llama2模型,也可使用阿里云PAI进行开发。

针对特殊的场景需求,开发者往往需使用微调训练的方法对模型进行“调整”,以获得特定领域的专业能力和知识。此时,PAI支持开发者在云上进行轻量级Lora微调或更深度的全参数微调。完成模型微调后,PAI支持开发者通过Web UI及API的方式部署Llama2,使模型可以通过网页或嵌入应用与使用者交互。

相比本地单机训练Llama2,在阿里云上可完成对超大尺寸模型的深度开发,且预置环境免运维,操作简单便捷,同时开发者可获得丰富的AI计算资源和极致弹性。本地单卡GPU只能完成Llama2 70亿参数版本的轻量级Lora微调和推理,更大尺寸版本及更深度训练均很难支撑。在阿里云上,通过PAI灵骏智算服务提供的分布式计算能力,可对Llama2全尺寸版本进行轻量级和全参数微调,并进行高效部署和推理。

format-jpg(图源魔搭ModelScope官网截图)

据了解,阿里云已构建完备的IaaS+PaaS+MaaS一体化AI服务。在基础设施层,阿里云拥有国内最强的智能算力储备,灵骏智算集群具备最大十万卡GPU规模扩展性,可承载多个万亿参数大模型同时在线训练;在AI平台层,阿里云机器学习平台PAI提供AI开发全流程的工程能力,PAI灵骏智算服务支撑了通义千问等超大模型的训练和应用,可将大模型训练性能提高近10倍,推理效率提升37%;在模型服务层,阿里云构建了国内最活跃的AI模型社区魔搭,并支持企业基于通义千问或三方大模型进行再训练。

今年7月初,阿里云宣布,将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务,并在资金和商业化探索方面提供充分支持。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
12月12日消息,中国权威的大模型评测平台OpenCompass日前更新了榜单,阿里通义千问72B模型登上开源基座大模型榜首。OpenCompass是上海人工智能实验室开源的大模型评测平台,涵盖学科、语言、知识、理解、推理等五大评测维度,可全面评估大模型能力。此前,通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace开源大模型排行榜。
4月22日消息,Meta开源最新Llama 3系列,阿里魔搭社区第一时间上架全部4款模型。今天,阿里百炼大模型服务平台宣布在国内推出针对Llama 3系列的限时免费训练、部署、推理服务,系国内首家。企业和开发者即日起即可在阿里上基于其打造自己的专属大模型。
7月24日消息,Meta开源最新Llama 3.1系列,包括4050亿参数 “超大杯”模型。阿里魔搭社区已上架全系列3款模型,同时,阿里百炼平台在国内推出针对Llama 3.1系列的训练、部署、推理服务,企业和开发者即日起可在阿里上基于其打造自己的专属大模型。
9月19日消息,今日栖大会,阿里CTO周靖人发布通义千问新一代开源模型Qwen2.5,其中,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。截至2024年9月中旬,通义千问开源模型累计下载量已突破4000万,成为仅次于Llama的世界级模型群。
6月16日消息,图灵奖得主、Meta首席AI科学家杨立昆近日联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBench AI,并公布首个测评榜单。阿里通义千问刚刚开源的大模型Qwen2-72B成为排名最高的开源大模型,是前十榜单中唯一的开源大模型、唯一的中国大模型,成绩超过Meta的Llama3-70B模型。6月15日,周鸿祎发视频祝贺阿里巴巴通义千问2登上世界榜单第一名。
3月10日消息,阿里通义灵码已独家中标建信金融科技有限责任公司的智能编码助手项目,建信金融科技有限责任公司是中国建设银行金融科技子公司。根据最新发布的中标公示,京东科技信息技术有限公司、北京智谱华章科技有限公司、阿里计算有限公司共同参与了项目竞标,最终阿里中标。
3月7日消息,阿里日前在巴塞罗那世界移动通信大会期间 举办“阿里全球峰会”。这标志着阿里以全新的AI形象闪亮登场,吹响全球化进攻号角。阿里智能集团资深副总裁、公共事业部总裁刘伟光表示,“从创立的第一天起,阿里就定位为全球化公司,经过十多年的技术长征和商业实践,已经跻身于国际厂商第一阵营。今年起,阿里会投入前所未有的资源,更加坚决地开拓海外市场。”
3月6日消息,阿里巴巴旗下的阿里宣布将面向日本企业推广基于生成式AI基础模型的商业提案,并与当地咨询公司和系统开发公司合作。阿里日本服务公司的区域总经理与谢野正宇表示,计划在未来三年内将使用该公司模型的项目增加到1000个以上。
2月27日消息,据国际权威分析机构沙利文发布的《中国金融大模型市场追踪报告,2024H1》显示:阿里以33%的市场份额夺得中国金融大模型整体市场第一。