百度王海峰：知识增强大语言模型具备人工智能四项基础能力

9月26日消息，由科学技术部、中国工程院、清华大学共同发起主办的长城工程科技会议“人工智能赋能高质量发展”主题大会于9月21日在清华大学召开。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以《人工智能技术生态与产业模式》为题作主旨报告。

会上，王海峰表示，人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的核心基础能力，这四项能力越强，越接近通用人工智能，而大语言模型具备了这四项能力，为发展通用人工智能带来曙光。

早在2019年，王海峰就曾提出，深度学习具有很强的通用性，并具备标准化、自动化和模块化的工业大生产特征，推动人工智能进入工业大生产阶段。四年来，深度学习技术和应用的发展充分验证了这一观点。深度学习技术的通用性越来越强，深度学习平台的标准化、自动化和模块化特征越来越显著，而预训练大模型的兴起，使得人工智能应用的深度和广度进一步拓展，技术生态更加完善。人工智能已进入工业大生产阶段。

标准化方面，框架和模型联合优化，多硬件统一适配，应用模式简洁高效，大幅降低人工智能应用门槛；自动化方面，从训练、适配，到推理部署，提升人工智能研发全流程效率；模块化方面，丰富的产业级模型库，支撑人工智能在广泛场景的便捷应用。

format-jpg

图注：百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰

（图源百度AI公众号，下同）

据了解，得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进，贯通了深度学习全产业链，飞桨生态愈加繁荣，已凝聚800万开发者，服务22万家企事业单位，基于飞桨创建了80万个模型。伴随大模型的发展，百度推出了星河大模型社区，寓意“文心加飞桨，翩然赴星河”，与开发者共享共创大模型生态。

王海峰表示，人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的核心基础能力，这四项能力越强，越接近通用人工智能，而大语言模型具备了这四项能力，为发展通用人工智能带来曙光。

具体而言，人工智能的典型能力如创作、编程、解题、规划等都依赖于理解、生成、逻辑、记忆等核心基础能力，依赖程度有所不同。以解题为例，从读懂题目、解答题目到最后写出答案，需要理解、记忆、逻辑及生成能力的综合运用。

效率方面，通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化，文心大模型训练速度达到原来的3倍，推理速度达到原来的30多倍。根据人民数据、新华网等多个公开测评，文心大模型3.5支持下的文心一言综合能力超过ChatGPT，遥遥领先于国内其他大模型。IDC《AI大模型技术能力评估报告，2023》显示，文心大模型3.5拿下12项指标的7个满分，得到“综合评分第一，算法模型第一，行业覆盖第一”三个绝对第一。

format-jpg

图注：IDC《AI大模型技术能力评估报告，2023》：百度获算法模型、行业覆盖唯一满分

应用方面，通过数据驱动、提示构建，以及插件增强进行场景适配，协同优化。文心一言已上线百度搜索、览卷文档、E言易图、说图解画、一镜流影等原生插件，使模型具备生成实时准确信息、长文本摘要和问答、数据洞察和图表制作、基于图片的创作和问答、文生视频等能力。插件机制扩展了大模型能力边界，更适应场景需要。

数据显示，文心一言在8月31日率先面向全社会开放服务，首日回答了网友3342万个问题，细分应用场景丰富，包括文案创意、教育咨询、代码生成等，目前已有15万企业和2万多插件开发者申请接入。

面对大模型产业化的挑战，王海峰表示，类似芯片代工厂，可以采用“集约化生产，平台化应用”的模式，即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务。这一产业化路径已在文心大模型产业实践中得到验证，百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型。以文心一言等大语言模型为代表的人工智能正在深入千行百业，加速产业升级和经济增长。