零一万物发布AI模型 阿里云魔搭社区开源首发

王小孟
2023-11-07 14:21

11月7日消息,李开复带队创办的AI2.0公司零一万物近日正式发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

官方介绍,零一万物此次开源的Yi系列模型包含34B和6B两个版本;零一万物创始人及CEO李开复表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

format-jpg

图注:Yi-34B发布在魔搭社区

图源:阿里云公众号

据了解,Yi-34B已登顶全球英文及中文权威榜单No.1。在Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72分位列全球第一;在C-Eval中文权威榜单排行榜上,Yi-34B超越了全球所有开源模型;在全球大模型各项评测中最关键的MMLU(Massive Multitask Language Understanding大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

与此同时,Yi-34B模型将发布支持200K超长上下文窗口(context window)版本。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要;为此零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

format-jpg

图注:Yi-34B登顶Hugging Face英文测试公开榜单

图源:阿里云公众号

另外,借助AI Infra,Yi-34B模型实现40%训练成本下降。AI Infra(AI Infrastructure人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等;零一万物Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。

凭借强大的AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%;目前,零一万物Infra能力实现故障预测准确率超过90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。

format-jpg

图注:Yi-34B简介

图源:零一万物官网

同时,零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化;数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

未来零一万物将基于Yi系列大模型,打造更多To C超级应用。李开复强调:“AI 2.0是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。零一万物邀请开发者社群跟我们一起搭建Yi开源模型的应用生态系,协力打造AI 2.0时代的超级应用。”

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
这是万物首次通过厂商提供API服务。
11月6日消息,由创新工场董事长兼CEO李开复成立的AI公司“万物”发布了首款开源中英双语大模型“Yi”。从知情人士处获悉,万物已完成新一轮融资,由阿里投。目前,模型开放商用申请,已在阿里魔搭社区ModelScope首发。
慧博科技联合智篆商业、阿里羊全力为慧博客户商家助力,共同举办“2023双十增长战略集训会”。
4月2日消息,阿里原副总裁陈雪松已加入北京智谱华章科技有限公司 担任副总裁职,或继续负责数字政府方面的相关业务。目前,陈雪松脉脉实名账号已更新工作经历。据泰山教育智库公众号在《智谱AI副总裁秦舒一行来我院调研》一文中,也提到了履新智谱AI副总裁陈雪松的来访信息。
10月22日消息,阿里巴巴集团旗下全球研究机构达摩院推出云端人工智能短天气预测平台,可对未来六小时内的天气情况进行精细范围内的高精度预测。据了解,该平台可为阿里的中国客户提供公里网格范围的高分辨率图像,每十分钟更新一次。平台可追踪降雨量、风速以及包括雷暴、冰雹等在内的极端天气状况,为农业、物流、运输和可再生能源等天气敏感行业带来实际价值。
为进一步提升企业的数字化营销能力,有有食与阿里&羊联手探索营销系统解决方案。
5月28日消息,阿里今日召开2021阿里峰会,阿里智能总裁张建锋在会上宣布阿里”计划:推动自身节能减排,输出数字减碳能力,支持绿色技术创新。张建锋认为,计算本身就是一种绿色技术,提高了社会整体的CPU利用率。据了解,截至今年年5月,阿里巴巴五大超级数据中心使用清洁能源6.38亿千瓦时,累计减少碳排放51万吨,相当每年道路上减少10万辆汽车。
8月25日消息,阿里推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。用户可从魔搭社区直接下载模型,也可通过阿里积平台访问调用Qwen-VL和Qwen-VL-Chat,阿里为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。