搜狗王小川:年底做出中国最好的大语言模型

大佬说
2023-04-13 23:31
一、王小川重新出山

“我们有信心,在年底做出中国最好的大语言模型。”

面对熙熙攘攘的入局者,搜狗创始人王小川气魄雄壮地放下一句豪言。

距离2021年10月腾讯与搜狐完成收购交易、王小川正式卸任搜狗CEO,已经过去了一年半的时间。

这段时间里,王小川身上几乎没有新闻。即使他曾经在马云与马化腾之间周旋谈判,与周鸿祎、李彦宏针锋相对,但互联网已经开始遗忘这位曾经的天才少年。

直到这次,AI的风猛烈吹动,大模型的机会摆在眼前,王小川重新站回了互联网的赛道上。能不能拼进中心,还不得而知。

“只是你们都忘了搜狗是一家AI公司,但我没有忘。”

但摆在王小川面前的,是一个竞争高度激烈的赛道。

百度率先释出了“文心一言”

一众国内厂商中,百度最先推出了大模型产品“文心一言”。这些年来,李彦宏曾在多个场合强盗,百度十年间向人工智能技术的研发投了1000亿资金。

对于逐渐掉队的百度来说,AI领域的技术积累是这家老牌互联网企业仅剩不多的优势项目。无论是因为技术积累足够,还是背水一战没有退路的原因,百度做了第一个吃螃蟹的人。

从观望到转身押注,各大厂商的动作都不算慢。360创始人周鸿祎不想落于人后紧随其后抱出一款“刚出生的孩子”。

逍遥子张勇宣布,阿里旗下所有产品,都将用AI重做一遍。阿里云和达摩院的技术实力,对此志在必读。

format-jpg

此外还有美团联合创始人王慧文带着数亿风投高调入局。商汤科技的“商量”、昆仑万维的“天工”,正在面世的途中一路狂奔。

字节也紧赶慢赶,旗下飞书推出了AI助手“My AI”,能以对话形式提供多种办公功能,支持创建日程、自动汇总会议纪要、优化与续写文字内容......虽然字节在大模型上的进展依然模糊,My AI这款产品也仍处在设计、开发阶段,但字节方面追热点的心思曝露无疑。

国内头部厂商齐聚,各路大佬出山,好不热闹。


二、既是红海,也是蓝海

但另一方面,是每一家厂商的准备,都还不够充足。

李彦宏高调宣布,百度的“文心一言”距离ChatGPT-3.5,只有2个月的差距。

王小川则毫不客气地“打脸”李彦宏,“怎么可能只差2个月!”

format-jpg

“用时间衡量的话,OpenAI比我们应该领先三年时间是有的。之前我们说追上GPT-3.5,可能一年时间是有机会的。但人家已经到4了,还有5在训练当中,所以我觉得有3年。”

王小川在公开信中写道:“这一次,百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。”

如果要达到这样的高度,目前来看,以OpenAI旗下产品为标准,国内技术水平还处在追赶状态。

除了技术和时间上的落后,更多难题困扰着新入局者。

前段时期牵头联署公开信,呼吁暂停人工智能开发6个月的马斯克,都做起了双面人的准备:马斯克紧急抢购了1万块GPU,用来训练大模型。

显示核心GPU又称图形芯片,是NVIDIA公司推出的一种特殊类型处理器,具有数百或数千个内核,经过优化,可并行运行大量计算。

曾经它被当做游戏和绘图等功能的主力,用来呈现复杂、逼真的视觉效果,但随着互联网时代的新技术爆发,人们对GPU的关注从消费电子领域转移到了更多维度。

挖矿让GPU在大众视角中爆红了一把。随后从加密货币到自动驾驶再到云端AI服务器,GPU的产量愈加走俏,价格水涨船高。

对于有志于训练大模型的互联网公司来说,算力极为关键,GPU是一切梦开始的地方。

“现在还能买到芯片吗?算力、数据对你来说是个困难的事儿吗?”

面对这样的发问,王小川在最近的采访中面露难色:“那太多困难了,你讲的每一个都是难点,都要解决。”

马斯克抢购的1万块GPU,绝不是个小数目。他收购的推特公司为此支付了数千万美元。

根据最近的官宣内容,王小川创立的“百川智能”启动资金为5000万美元,恰好也就是马斯克买GPU的花费。

王小川和王慧文这些官宣大模型创业的互联网大佬,虽然有着还算丰厚的家底和行业资源优势,但相较于投入巨大的大模型项目来说,这些启动资金可能并不够看。

在大语言模型的风口上,王小川也不敢妄言超车:我们首先是要讲先活下来,再追得上去。


三、人、钱、芯片,缺一不可

美团联合创始人王慧文在朋友圈广发英雄帖:“我的人工智能宣言:5000万美元,带资入组,不在意岗位、薪资和title,求组队。”就遭到了行业内人士的批评

format-jpg

海通证券的电子研究首席分析师郑宏达也在朋友圈发文,称:

“5000万美元够干什么的?”

“互联网的人啥都不懂,就只会营销,一点都不踏实。”

这样的评论也不无道理,OpenAI一次大模型训练就花费了500万美元。这意味着5000万美元的资金,只够10次大模型训练。

还有人才。搜狗有着强AI、语言核心的背景,但顶尖人才并不容易寻觅。

“今天大模型的成功,核心是语言方向的成功,AI是贯穿始终的能力。我们做输入法、语音识别、搜索、同传、数字人,背后都是大量的AI的东西,从识别到生成,都在干。”

format-jpg

搜狗曾经走在行业之前,但随着搜索行业见顶,更多人才与王小川失之交臂。挖人,成了当下的难关。如何让人才人尽其才,在一个新创组织中发挥效能,则考验着创业者的管理水平。

“我们是要去挖人,但挖了人不代表能打赢这场仗,不是零零散散凑几个人、收个团队就能做成的。”

“你们能在文章里放上我们的招聘邮箱吗?”在最近的一次采访中,王小川发问媒体。

这个时候,他的幽默和焦虑同时显露无疑。

招人、找钱、买芯片,每一件事都任重而道远。但面对大模型、人工智能奇点这样的宏大图景,一切困难又显得微不足道。


1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
4月10日消息,搜狗创始人小川今日正式对外宣布开启人工智能模型领域创业。小川与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国OpenAI基础模型及颠覆性上层应用。据介绍,百川智能早前已获得5000万美元启动资金,来自小川与其业内好友个人支持。小川今日在接受腾讯新闻《深》专访时透露。小川表示,预计在4月底公司将打造一只50人规模AI团队,有信心在年底做出中国最好语言模型。
5月27日消息,据新京报获悉,全国政协委员、搜狗公司CEO小川今日表示,疫情期间,互联网企业激发出了更活力,展示出了担当和创造性。小川称,在疫情期间武汉,互联网科技公司承担了平台责任,并列举盒马、滴滴、搜狗等公司在疫情防控期间采取措施。另外,他表示,在后疫情时代,更多民众走出家门线下消费,这种创造性体现在利用微信、支付宝发放消费券,成为政府和企业合作典范。
7月9日消息,019年中国互联网大会今日举行,搜狗CEO小川发表演讲称,消费互联网开始走向线下市场,开始走进民生。”互联网医疗能力要与医院数据打通是非常难事情”,在小川看来,在未来5-10年,互联网和传统医疗体系开始会有新融合出现。
5月26日消息,搜狗CEO小川发表演讲表示,2016年给他最大冲击是阿尔法狗,他们称之为一场启蒙运动。相对以前文艺复兴,它是在探寻人和人,以及人和神之间关系。阿尔法狗之后,他们关注是人与机器关系。其还表示,目前人工智能在感知和认知领域方面还存在着不小局限。
4月4日消息,有自称搜狗员工曝料称,搜狗开始统计加班时长裁员,身边很多同事每天坚持够至少11个小时。搜狗CEO小川评论称,“公司没这样要求。”其表示,不认同公司制度人,要么适应,要么反馈建议努力帮助公司提升改进。
3月7日消息,搜狗公司CEO小川表示,我国在公共数据开放方面仍面临许多问题,一方面,我国公共数据开放程度有限;另一方面,现有公共数据开放质量欠佳,制约人工智能在民生领域应用。
3月4日消息,全国政协委员、搜狗公司CEO小川表示,今年提案关注人工智能和医疗。谈及科创板时,他表示,公司已在美国上市,回归并不紧迫。科创板试点注册制是好事儿,有助于创新发展。
小川表示,技术与人类不是“取代”关系,“我们叫做数据智能,它只能对以前他学过东西进行重复性一种表现。
大佬说
汇聚大佬真知灼见,看商界谁主沉浮。