李彦宏:大模型开源意义不大,闭源才能走通商业模式

刘峰
2024-04-11 20:58

4月11日消息,据新浪科技,李彦宏在一次内部讲话中,对大模型开源与闭源的路线选择以及AI创业者应该专注模型还是应用等业界焦点话题发表了看法。他认为,闭源模型在能力上会持续地领先,而不是一时地领先。模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如Linux、安卓等等很不一样。

李彦宏表示,“闭源是有真正商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才,闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。”

李彦宏认为,对于AI创业者来说,核心竞争力本就不应该是模型本身。创业者真正的优势应该是在某一个领域的知识、数据。

format-jpg

百度公司CEO李彦宏 图源:百度公众号

以下为李彦宏内部讲话实录的部分原文:

一、为什么不开源?

李彦宏:已经有足够多的开源大模型。一年前文心刚刚发布的时候,我们内部是有过非常激烈的讨论的,最后当然大家也知道这个结果,我们的决定是不开源。为什么不开源?当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。

我们今天看主流的开源模型:,像Llama,Mistral其实都是有相当影响力的,国内的智源、百川、阿里的通义也都是开源的,这个市场上不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本,这是不划算的。

更重要的是,在我们的认知里,闭源模型在能力上会持续地领先,而不是一时地领先。为什么会有这个判断?因为我们觉得模型开源的意义其实不是很大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。

而且模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如Linux、安卓等等很不一样,由于是模型带来的开源,我们也不知道参数为什么变成了那个样子,这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。

反观闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。其实也很简单,大家比较一下,比如硅谷有一个优秀的人才,他有OpenAI的offer,有Meta的offer,有Llama的offer,他会去哪儿?这是非常显而易见的选择。

大家以为开源是免费的,在成本上有优势,实际上我们认为也不是,闭源在成本上反而是有优势的。只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。反过来,同等参数的情况下,闭源模型的能力也是更强的。今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。

二、创业者为啥可以依赖文心?

李彦宏:首先,外界一些做模型的创业公司讲的所谓的“双轮驱动”不是一个好的模式。既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情哪个成功率更高是不言自明的。在任何情况下我们都非常讲专注力,“力出一孔”,当资源有限的时候更应该专注,而不是去搞所谓的“双轮驱动”。

第二,对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要非常长时间的坚持才能跑出来。创业者真正的优势应该是在某一个领域的知识、数据。假如说你今天想找一个“黄色的无兜的男士泳裤”,你在任何一个今天的电商平台上都找不到,这种需求目前的技术是解决不了的,大模型如果有领域知识就可以解决,这就是靠领域知识能够提供独特价值的例子。

市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。

基础模型不会通吃AI应用。外界担心如果用了文心或者闭源模型,做得好了它就抄你,就把你的饭吃掉了,实际上这种担心也是没有任何道理的。大家去看一看,在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力,它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。

当然更根本的就是文心的功能是最强的,性价比是最好的,我们会持续不断地投入,有了这一点,所有其他的东西才能够成立。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
2月29日消息,百度最新财报发布后,百度董事长兼CEO李彦宏,CFO罗戎,智能云事业群总裁沈抖和资深副总裁、智能驾驶事业群组总裁王云等高管出席随后召开的财报电话会议,解读财报要点并回答分析师提问。在财报会议中,李彦宏表示,2024年生成式人工智能与基础模型业务将为百度带来数十亿元人民币的增量收入,这也将为百度的总收入带来正向影响。
李彦宏百度正站在浪潮之巅。
李彦宏称,作为国内大型企业中首家发布“类ChatGPT”产品的企业,百度之所以选择最先发布,是因为市场有需求。
3月17日消息,百度日前召开新闻发布会。百度创始人、董事长兼首席执行官李彦宏介绍了其对标+ChatGPT的语言模型、生成式AI产品“文心”,并展示了文心在五个场景中的综合能力。多模态生成方面,李彦宏现场展示了文心生成文本、图片、音频和视频的能力。截止3月16日21点,申请文心API调用服务测试的企业已突破6.5万。
3月16日消息,百度今日14时在北京总部召开新闻发布会,宣布正式推出基于百度新一代语言模型的生成式AI 产品文心百度创始人、董事长兼首席执行官李彦宏百度首席技术官王海峰出席发布会,围绕文心进行介绍。
2月28日消息,百度官方宣布,计划于3月16日在北京总部召开新闻发布会,主题围绕文心。值得注意的是,这是百度首次明确该产品发布具体日期。届时,百度创始人、董事长兼首席执行官李彦宏百度首席技术官王海峰将出席。此前2月7日,百度宣布推出类ChatGPT应用文心百度官方表示,在人工智能四层架构中,有全栈布局,包括底层的芯片、深度学习框架、模型以及最上层的搜索等应用。文心位于模型层。
2月9日消息,百度正式官宣将在3月上线百度版ChatGPT“文心“后,百度创始人李彦宏今天表示,无论是AIGC还是ChatGPT,都是AI发展到一定阶段后新的机会。“怎么把这么酷的技术,变成人人都需要的好产品,这一步其实才是最难的,最伟大的,也是最能产生影响力的。”
11月15日消息,在深圳举行的西丽湖论坛上,李彦宏表示,百度已坚决对旗下各产品线进行AI原生化重构,百度每100行代码,20行就由AI完成。他表示,模型是基础底座,类似操作系统不会太多,重复开发模型是对基础资源的浪费。文心有了很大进步,其调用量比国内其他两百家还多。目前文心已有800万开发者,开发者可以通过插件调用文心
8月23日消息,百度创始人李彦宏今日在业绩电话会上表示,预计年底文心会有新版本推出。在新版本推出前的过渡期,百度将推动当前版本的使用,针对不同行业的应用和场景进行探索。