阿里云CTO周靖人:阿里云的平台非常欢迎第三方模型

周兴
2023-08-02 05:30

8月2日消息,MaaS是“Model as a Service”的缩写,即“模型即服务”,指以模型为核心提供服务。2022年11月,任阿里云“通义千问”大模型研发负责人的周靖人在云栖大会上最早提出这个词。此后,在国内伴随着ChatGPT热潮出现的“百模大战”中,这种商业模式广被提及,亚马逊云科技、字节跳动都选择了这条发展路径。

在这一场AI大模型热潮中,阿里云非常明显是以云计算服务商的自我认知参与其中。“阿里云的平台非常欢迎第三方模型。”近日,阿里云CTO周靖人在接受澎湃科技采访时表示。

在阿里云发起的AI模型社区魔搭中,集聚了180多万AI开发者和900多个AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、粤港澳大湾区数字经济研究院(IDEA研究院)、澜舟科技、清华大学人工智能研究院、深势科技、浙江大学、智谱AI等。

format-jpg

图注:阿里云CTO、“通义千问”大模型研发负责人周靖人

(图源澎湃网)

7月25日晚,阿里云又在其微信公众号上发布声明称,阿里云成为国内首家支持Meta公司的Llama 2全系列训练和部署方案的公司。Llama 2是Meta最新开源的类ChatGPT大语言模型,包括70亿、130亿及700亿参数版本。

“有算力、无模型,不够。有模型,无生态,也不够。发展大模型,算力、模型、生态,缺一不可。”周靖人说。

“大模型浪潮还处在早期阶段,人人都能感受到技术变革的来临,但对于如何降低大模型的研发门槛、如何实现大模型的落地应用,大家都还没有答案。”周靖人认为,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现。“大模型的研发,是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI和云计算的全栈技术能力。大模型的应用落地更是需要丰厚的生态土壤。”

format-jpg

(图源阿里云公众号,下同)

实际上,在2021年,任达摩院副院长的周靖人就在内部提及MaaS的概念。

周靖人解释道,MaaS最底层的含义是要把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,从模型的开发入手,包括数据处理、特征工程、模型的训练和调优、模型的服务等,提供各种各样的产品和技术。

更简单来说,MaaS最核心的就是让模型的使用更简洁,简单几行代码就可以调用模型。

format-jpg

这就涉及AI模型落地应用的现状,即一个AI模型难以覆盖各行各业的AI应用需求,面对新场景往往需要进行二次开发或优化,否则许多模型难以适配到特定环境应用中。而AI模型定制化门槛较高,同时目前缺乏AI模型开发和使用交流分享的平台。也就是说当开发者遇到相关问题后,无法找到对应的模型服务,也比较难找到人来解答相关问题。

周靖人曾在采访中表示,“最终的目标是,甚至小学生也可以调用模型,能做业务系统的开发。”

format-jpg

要实现这个目标,就要做一个“大模型自由市场”。在魔搭(ModelScope)平台上,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。从这个意义上说,魔搭社区是个充分开放的大模型自由市场。

魔搭是阿里达摩院与中国计算机学会(CCF)开源发展委员会在2022年联合推出的国内首个AI模型开源社区,把300多个模型开放给中国的AI研究者与团队,涵盖了自然语言处理,视觉、语音、多模态等模型。阿里巴巴在大型语言模型领域的研究主要由达摩院负责,由周靖人主导。

“一个模型的应用,不仅是接入模型,还会涉及到模型的微调、模型的一系列测试等。”7月,周靖人在2023世界人工智能大会上推出新的模型工具ModelScopeGPT(魔搭GPT),目的是有效帮助使用者在海量模型里面找到最合适的模型,“复杂的系统需要多个模型完成联合的任务,今天可以通过这样的一个流程自动化把各种模型融合在一起。”

format-jpg

(图源魔塔官网截图)

魔搭GPT(ModelScopeGPT)是一款大模型调用工具,经常被称为agent(智能代理),它能接收用户以自然语言发出的指令,通过“中枢模型”通义千问调用魔搭社区其他的AI模型,大小模型协同完成人类布置的复杂任务。

比如,用户在魔搭GPT的对话框输入任务:“用20字描述一款新的VR(虚拟现实)眼镜,并用女声朗读,随后转成视频。”魔搭GPT会展示整个任务规划过程,先由中枢模型生成一段描述VR眼镜的文案,接着调用语音生成模型,生成语音并用女声念出,最后调用视频生成模型,输出最终的视频内容。过程中,魔搭GPT先后调用了一大二小3个模型。

format-jpg

图注:魔搭GPT

(图源魔塔官网截图)

目前从全球来看,MaaS的订阅制收费早已经开始。根据海通证券研报总结:OpenAI在2月1日正式官宣ChatGPT Plus试点订阅计划。此外,嵌入其他产品获得引流式收入也是模式之一,例如微软推出高级付费版Microsoft Teams Premium,订阅者可享用“智能回顾”功能,用以提供自动生成的会议记录、推荐任务和个性化标亮。其它收费模式包括不同模型对不同客户需求和客户定价,客户要求越高,模型越好,收费也将越高。

周靖人认为,大模型的研发不应该是一场少数机构的竞赛,而应该通过大小模型的协同进化走向更高级的应用,尤其是适应中国本土需求的应用。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里通义千问发布会后,做了一场闭门分享。
7月7日消息,在今日举行的上海世界工智能大会上,阿里CTO在演讲中表示,阿里将把促进中国模型生态的繁荣作为首要目标,向模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。阿里魔搭社区现已聚集180万AI开发者和由20多家顶尖工智能机构贡献的900多个优质AI模型,找模型上魔搭,我们将努力把魔搭社区培育成中国最大的‘模型自由市场’。
9月25日消息,阿里智能首席技术官在通义千问开源发布会上宣布,将全新开源性能更强的模型Qwen-14B,该模型基于140亿参数,3万亿token训练的开源模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的QWEN-7B模型能力普遍提升,核心指标最高提升22.5%。
目前,钉钉、天猫精灵率先接入通义千问测试,将在评估认证后正式发布新功能。
在2023栖大会现场,阿里首席技术官发言指出,除了传统的基础设施服务,正在到来的智能时代,阿里也再一次在这个时代引领了计算的发展。
在2023中关村论坛工智能模型发展论坛,阿里智能集团CTO发表了《MaaS,智时代的AI新范式》的主题演讲。
12月4日消息,阿里近日开源了通义千问720亿参数模型Qwen-72B,这也是目前国内模型开源的最大参数,至此,通义千问共开源了18亿、70亿、140亿、720亿参数的4款模型阿里CTO在通义千问发布会后做了一场闭门分享,他提到:“我们能看到之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义千问和ChatGPT 4.0在使用体感上,是互有胜负的。”
4月11日,阿里智能CTO在北京峰会现场宣布:“我们将开放通义千问的能力,帮助每家企业打造自己的专属模型!”
4月11日消息,在今日的阿里峰会上,阿里智能首席技术官正式宣布推出语言模型通义千问。他介绍,通义千问支持多轮对话,文案创作,逻辑推理,多模态理解,多语言支持。在视频演示中,通过通义千问,可以提升工作效率、购物体验等等。比如调用差旅接口推荐差旅产品,视频会议中自动生成会议摘要;可以作为智能购物助手,自动推荐品牌、产品等。