百度首席技术官王海峰谈文心大模型3.5

柏纳
2023-07-30 16:49

7月30日消息,主题为“通用智能,人机共生”的学术会议ACM中国图灵大会于7月28日-30日在武汉举办,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰解读文心大模型的核心技术,阐述人工智能产业模式。

据介绍,百度在“芯片-框架-模型-应用”人工智能四层技术栈全面布局,自研的深度学习平台飞桨支撑了文心大模型的高效训练和推理,截至目前飞桨平台开发者数量已达到750万。IDC报告显示,百度稳居中国深度学习平台市场综合份额第一。根据中国信通院发布的《深度学习平台报告(2022)》,飞桨是中国深度学习市场应用规模第一的深度学习框架和赋能平台。

format-jpg

图源:百度AI公众号

文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型3.5的核心技术创新,通过飞桨与文心协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

在基础模型训练上,采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。

format-jpg

百度文心大模型全景图;图源:百度AI公众号

在知识增强和检索增强基础上,文心大模型3.5提出了“知识点增强技术”,使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力,进而提升对世界知识的掌握和运用。

在推理方面,通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型3.5还新增了插件机制,包括官方插件百度搜索和ChatFile,使得文心一言能够生成实时准确信息和长文本摘要,拓展了大模型能力边界。

根据IDC最新发布的《AI大模型技术能力评估报告,2023》,百度文心大模型3.5在14个参评模型中拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

format-jpg

图源:百度AI公众号

王海峰在演讲中展示了文心一言的问答对话、文案生成、行程规划等能力,以及在办公、会议、编码等场景的应用。

工作中,文心一言化身“超级助理”,帮助总结工作沟通要点,实时记录会议内容,形成会议议题、摘要及总结等关键信息,可以通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等,也可以在工程师编码过程中自动推荐和生成代码。据悉,目前这些功能已通过智能工作平台“如流”应用于百度的工作流程中,Comate智能编码伙伴帮助80%百度工程师提升编程效率,吸引100多家合作伙伴。

对于大模型的产业模式,王海峰表示,在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,支撑产业智能化升级。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
百度首席技术海峰参加了第三届中国国际软件发展大会暨中国软件行业协会成立四十周年庆典。
百度首席技术海峰近日做客 CCTV-10《创新中国说》,展示大语言模型文心一言的能力。
百度首席技术海峰在2023世界人工智能大会上解读文心大模型3.5版核心技术,发布飞桨生态最新进展。
百度首席技术海峰详细解读了文心3.5在技术和工程上的升级。
百度首席技术海峰表示,当前规模化的AI大生产已然形成。
6月27日消息,百度首席技术海峰近日详细解读了文心3.5在技术和工程上的升级。对比数据显示,文心大模型3.5的训练速度提升2倍,推理速度提升17倍。功能方面,文心大模型最大的一个变化是新增了插件机制。海峰表示,下一阶段,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型。
百度WAVE SUMMIT+深度学习开发者大会2023上,百度首席技术海峰宣布,目前文心一言的用户累计数量已经超过1个亿。
9月13日消息,2023百度十大科技前沿发明发布会上,百度首席技术海峰表示,大语言模型具备了理解、生成、逻辑、记忆等人工智能的核心基础能力,为通用人工智能带来曙光。百度大模型专利申请量、授权量都是国内第一,深度学习专利申请量全球第一。十大科技前沿发明涉及大模型、基于大模型的端到端搜索、飞桨、AI芯片等,超过70%的发明都涉及到大模型和重构创新。
中国电子学会副理事长、百度首席技术海峰出席主论坛并做报告,阐释了大模型技术发展与产业模式。海峰展示了文心一言的对话问答、文学创作、多模态生成等能力。海峰表示,新一代知识增强大语言模型文心一言是百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕预训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型。