阿里巴巴发布“通义”大模型系列,推动AI从单一智能向通用智能进化

电商报
2022-09-02 14:47

9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模预训练模型”主题论坛。会上,达摩院副院长周靖人发布阿里巴巴最新“通义”大模型系列,并宣布相关核心模型向全球开发者开源开放。面向大模型通用性与易用性仍欠缺的难题,通义打造了业界首个AI统一底座,并构建了大小模型协同的层次化人工智能体系,将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。

format-jpg

近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但大模型在实现全模态和全任务的通用性上仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。

2021年,阿里巴巴达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破,引领了中文大模型的发展。尤其引发关注的是,达摩院团队使用512卡V100 GPU即实现10万亿参数大模型M6,同等参数规模能耗仅为此前业界标杆的1%,极大降低了大模型训练门槛。

今年,阿里巴巴在解决大模型通用性及易用性难题上继续发力。达摩院副院长周靖人介绍,为了让大模型更加“融会贯通”,达摩院在国内率先构建了AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。通义统一底座中M6-OFA模型,作为单一模型,在不引入新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,且效果达到国际领先水平。这一突破最大程度打通了AI的感官,受到学界和工业界广泛关注。近期M6-OFA完成升级后,可处理超过30种跨模态任务。

format-jpg

“大模型模仿了人类构建认知的过程,这是当下我们面临的重要机遇。通过融合AI在语言、语音、视觉等不同模态和领域的知识体系,我们期望多模态大模型能成为下一代人工智能算法的基石,让AI从只能使用‘单一感官’到‘五官全开’,且能调用储备丰富知识的大脑来理解世界和思考,最终实现接近人类水平的认知智能。”周靖人表示。

同时,以统一底座为基础,达摩院构建了层次化的模型体系,其中通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律、金融、娱乐等行业。通用与专业领域大小模型协同,让通义大模型系列可兼顾性能最优化与低成本落地。为加快大模型规模化应用,达摩院还研发了超大模型落地关键技术S4框架,百亿参数大模型在压缩率达99%的情况下多任务精度可接近无损。

通过部署超大模型及轻量化版本,阿里巴巴通义大模型系列已在超过200个场景中提供服务,实现了2%~10%的应用效果提升。典型使用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等。

format-jpg

与本次发布同步,通义大模型系列中语言大模型AliceMind-PLUG、多模态理解与生成统一模型AliceMind-mPLUG、多模态统一底座模型M6-OFA、超大模型落地关键技术S4框架等核心模型及能力已面向全球开发者开源,最新文生图大模型近期将开放体验。(开源链接:https://github.com/alibaba/AliceMind/; https://github.com/OFA-Sys/OFA

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
9月2日消息,阿里巴巴达摩院今日主办世界人工智能大会“大规模预训练模型”主题论坛。会上,达摩院副院长周靖人发布阿里巴巴最新“通义模型系列,并宣布相关核心模型向全球开发者开源开放。面向模型通用性与易用性仍欠缺的难题,通义打造了业界首个AI统一底座,并构建了大小模型协同的层次化人工智能体系,将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。
达摩院副院长周靖人发布阿里巴巴最新“通义模型系列,并宣布相关核心模型向全球开发者开源开放。
公司的“通义千问”模型自2019年开始研究,目前,钉钉、天猫精灵等产品已接入通义千问测试,将在评估认证后正式发布新功能。报告中称,通义千问是由阿里巴巴达摩院研发的预训练语言模型,拥有多模态、多任务能力,擅长语言理解、文本生成、问答能力等,可应用到电商、设计、医疗、法律、金融等行业。
10月11日消息,据界面新闻,近日,原全球最大SaaS公司Salesforce执行副总裁、原阿里巴巴集团副总裁、达摩院语言实验室首席科学家、普渡大学终身教授司罗,正式加入阿里巴巴旗下汽车科技独角兽企业斑马智行,出任首席技术官 。据斑马智行内部消息,司罗将领导斑马智行技术团队,包含全栈自研的整车OS,基于通义模型的智舱AI,加速推进AI模型前沿技术研发,实现AIOS战略升级。
4月3日消息,阿里云正在内部全面推行AI编程,使用通义灵码辅助程序员写代码、读代码、查BUG、优化代码。天眼查知识产权信息显示,阿里巴巴达摩院科技有限公司已申请注册4枚“通义灵码”商标,国际分类为广告销售、科学仪器、网站服务、通讯服务。其中3枚商标已注册成功,另1枚商标状态为“初审公告”。
1月12日消息,阿里巴巴达摩院发布2023十大科技趋势预测,涵盖人工智能、云计算等领域的前沿科技。达摩院预计,这些技术将加速突破,并于经济和社会方面对各核心产业产生积极影响。其中,备受关注的生成式AI预计将进一步发展,不断拓宽应用边界并将为数字化内容的制作方式带来变革。生成式AI是利用现有文本、图像或音频文件创建新内容的技术。目前,生成式AI通常被用来生成产品原型及初稿,应用场景涵盖游戏、广告、平面设计等。
12月22日消息,阿里云官微披露,12月22日,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型。目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。
今日,阿里巴巴达摩院发布新型联邦学习框架FederatedScope,该框架支持大规模、高效率的联邦学习异步训练,能兼容不同设备运行环境,且提供丰富功能模块。