张宇昕：华为云Stack 8.3相关服务将于9月底全面上市商用

9月22日消息，华为云CTO张宇昕在华为全联接大会2023主题演讲中表示，大模型重塑千行万业的背后，是众多复杂的技术挑战，需要核心技术的持续创新和突破。华为云以全局的系统性创新，不断攻坚克难，构建AI时代最佳云底座。

张宇昕指出，随着大模型出现能力涌现、多模态融合、MOE等趋势，模型参数将从现在的5400亿很快超过数万亿，对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求；同时，数据集规模和Token长度的激增也将带来新的挑战。这些挑战相互影响、环环相扣，可以说大模型及相关应用是迄今为止最复杂的软硬件系统工程。

为应对AI时代的挑战，华为云实现了软硬件结合的系统性创新：在系统架构层，华为云QingTian架构全新升级分布式QingTian架构，通过打破计算、存储、网络的边界，把过去主从式架构升级为对等架构，极大地提升了AI算力。

基于分布式QingTian架构，华为云昇腾AI云服务提供了算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts，为大模型和AI应用的开发、运行提供最佳算力服务。

format-jpg

图注：华为全联接大会2023海报

（图源华为企业业务公众号截图）

据张宇昕介绍，在数据处理层，华为云提供云上全流程一站式能力，包括数据存储、分析、共享、标注方案，让企业实现大模型数据“找得到”“存得下”“记得住”“用得了”。

在AI云存储方面，华为云独创了具备220TB超大带宽和微秒级超低时延的内存服务EMS，以此支持NPU/GPU的内存扩展，可以容纳PB级超大规模参数，让参数存得下；同时，基于SFS Turbo文件存储的大并发、高吞吐缓存服务，可提供千万级IOPS，将10亿条数据和元数据的准备时间从100小时缩短至5小时，让数据准备速度快；此外，基于OBS对象存储构建的低成本大容量知识湖服务，通过深度归档、智能存储分级和存储管理统计平台实现数据精细化管理，数据和向量的存储TCO降低30%，让海量数据存得起。

作为大模型的“超级外脑”，向量数据库是AI时代的刚需产品。华为云GaussDB向量数据库具备千亿级大规模向量数据快速查询更新的能力，检索规模提升10倍，查询时延<10ms，响应速度提升2倍。另外，GaussDB向量数据库具有千维查询能力，查询结果更精准，助力企业业务更智能。

张宇昕指出，数据是大模型的源泉，华为云数智融合平台通过统一的数据资源和元数据技术LakeFormation等四大关键技术为大模型提供更高效、高质量的数据底座。同时，华为云全新发布智能数据洞察产品DataArts Insight，对数据资产进行了语义扩展和领域知识关联，让大模型在消费阶段的调优和推理效率倍增。

format-jpg

图注：华为云CTO张宇昕

（图源中国网科学）

张宇昕表示，为了给大模型高质量“供数”、让大模型高安全“用数”，华为云推出了高质量、高安全的数据要素流通解决方案：基于TICS隐私计算和区块链BCS服务，提供可信数据开发环境，帮助客户把高价值数据变成高质量数据集产品，实现可用不可见、全流程可溯。EDS交换数据空间支持20多种控制策略，让数据在授权范围内可信地流通。

此外，为了给大模型训练打造安全高效的AI标注环境，华为云推出AI标注云桌面，让分散在各地的标注员可以远程接入；敏感数据始终保存在云端安全专区，满足安全合规的要求；同时，云端实时加载，结合华为云HDP高清显示协议毫秒级传输，实现图像本地显示时延降低50%以上。

在模型训练层，华为云通过盘古大模型的“5+N+X”的架构实现分层解耦，赋能千行万业，让每个行业、每个企业基于自己的场景都可以拥有自己的大模型。盘古大模型L0层提供了5个基础大模型，包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型，提供满足行业场景的多种技能；L1层包括N个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，也可以基于行业客户的自有数据，在盘古大模型L0或L1层基础上，为客户训练自己的专有大模型；L2层为客户提供更多专注于具体应用场景或特定业务的模型，提供开箱即用的模型服务。

在应用开发层，华为云整合了应用开发需要的开发生产线、低码/无码平台、AI应用框架及全新的AI应用工程套件，让客户轻松实现基于大模型的AI原生应用的零门槛构建。

format-jpg

图注：华为云Stack三大核心创新方向

（图源华为云公众号）

例如，大模型应用既需要多样化的AI原生技术，又需要强大的工程能力，同时也要具备小颗粒、敏捷部署能力。为此华为云打造了AI应用框架：首先，将一系列的AI原生技术构筑成后端服务，形成BaaS for AI能力，调用即可得；其次，将大模型的工程经验做成工程平台，让开发者以5倍速全链路开发行业大模型及应用；最后，基于Serverless技术，通过面向AI全新升级的FunctionGraph 3.0提供AI的前端开发框架，利用其“胶水”式拼接能力，将BaaS for AI后端和大模型工程套件快速拼接、无缝集成。

张宇昕表示，华为云这些系统性创新的云服务能力，可以跨云、网、边、端等多平台，以及公有云，边缘云、混合云等多形态，实现灵活自由的部署和应用。对于建立专属AI平台和大模型的需求，企业可通过华为云Stack平台，在自有数据中心部署AI云服务和大模型的关键产品，一站式建设专属大模型。会上，张宇昕正式发布华为云Stack 8.3，相关服务将于9月底全面上市商用。