百度CTO王海峰:文心一言是百度技术积累和产业实践的水到渠成

刘峰
2023-03-17 09:22

3月17日消息,百度日前在北京总部召开新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官(CTO)王海峰出席。

会上,李彦宏展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力,王海峰解读了文心一言的技术特性及其背后的技术积累。

format-jpg

王海峰认为,文心一言是百度多年技术积累和产业实践的水到渠成,尤其是飞桨深度学习平台和文心大模型的联合优化,为文心一言提供了坚实的技术支撑。据介绍,文心大模型从2019年发布以来,已经从最初的自然语言理解大模型,发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台。

据了解,文心一言是新一代知识增强大语言模型,也是百度继文心一格之后的又一个生成式AI产品,具备对话交互、内容创作、知识推理、多模态生成等能力。王海峰表示,新一代知识增强大语言模型文心一言,是在ERNIE及PLATO系列模型的基础上研发的。

王海峰介绍,文心一言的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

format-jpg

图源:百度官微,下同

在知识增强方面,文心一言的知识增强主要是通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,是引入外部多源异构知识,做知识推理、提示构建等。

在检索增强方面,文心一言的检索增强,来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。

在对话增强方面,基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。

format-jpg

王海峰强调,飞桨深度学习平台支撑文心一言效果更好、效率更高、性能更强。他表示,文心大模型加上飞桨深度学习平台,夯实了产业智能化基座。随着文心一言与飞桨平台的进一步融合发展,人工智能技术和应用的研发将越来越标准化、自动化和模块化,加速人工智能的工业大生产,同时也反哺文心一言加速迭代进化,落地更多场景和行业,为千行百业智能化升级带来不竭动力。

据王海峰介绍,如今,飞桨平台已凝聚535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
中国电子学会副理事长、百度首席技术官海峰出席主论坛并做报告,阐释了大模型技术发展与产业模式。海峰展示了文心的对话问答、文学创作、多模态生成等能力。海峰表示,新一代知识增强大语言模型文心百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕预训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型。
36氪独家获悉,目前百度筹备“文心”的团队主要由TPG(技术中台事业群)、MEG(移动生态事业群)两大部门协同。
12月28日消息,在百度WAVE SUMMIT+深度学习开发者大会2023上,百度首席技术官海峰宣布,目前文心的用户累计数量已经超过1个亿。
11月10日消息,2023年世界互联网大会乌镇峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任海峰出席前沿数字技术创新与安全论坛和人工智能赋能产业发展论坛,解读文心大模型4.0最新技术,阐述大模型产业模式,海峰披露,文心用户规模现已达到7000万,场景4300个。
6月27日消息,百度首席技术官海峰近日详细解读了文心3.5在技术和工程上的升级。对比数据显示,文心大模型3.5的训练速度提升2倍,推理速度提升17倍。功能方面,文心大模型最大的一个变化是新增了插件机制。海峰表示,下一阶段,文心将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型。
截至目前,文心用户规模已破3亿,文心大模型日均调用次数超7亿,日均处理文本Tokens超1万亿。
2月28日消息,中国人工智能学会首届智能融合产业论坛日前在成都举办。海峰表示,深度学习在技术、生态、产业等多个维度已逐渐成熟,人工智能的技术创新和产业发展进入“深度学习+”阶段,正引领新一轮技术更迭。海峰表示,百度文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,已应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨深度学习平台赋能制造、能源、金融、通信、媒体等各行各业。
近日,百度首席技术官(CTO海峰做客人民网《人民会客厅》视频访谈。