字节跳动布局大模型 分别在语言和图像两种模态上发力
2月23日消息,据36氪报道,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。
一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。
另有知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,“搜索业务部门、AI Lab和AML(应用机器学习)团队都调了一部分人支援语言大模型,团队目前的预期是在今年年中推出大模型”。
据悉,语言大模型团队负责人与图像大模型团队负责人的间接和直接汇报对象,均为Tik Tok产品技术负责人朱文佳。加入字节跳动前,朱文佳曾在百度担任搜索部主任架构师。朱文佳于2015年进入头条,被称为“头条里算法技术的Top 3人选”。四年后,他成为今日头条CEO。2021年2月,他又调任成为Tik Tok产品技术负责人,向Tik Tok CEO周受资汇报。
朱文佳,图源:今日头条官微
此外,一名AI资深从业者透露,字节并不缺GPU。字节旗下的企业技术服务平台火山引擎,在2021年正式进军基础云市场(IaaS层),为大模型所需的算力奠定了基础。
上述从业者表示:“从训练大模型的角度而言,工程团队和云服务团队一样关键,在两者上均无短板的字节跳动具有一定优势。”
对AI领域的布局,字节的反应速度一直较快。据了解,目前AIGC(AI生成内容)技术也已结合到头条的内容创作以及抖音的图文内容生成中。比如2021年,抖音上线的可以把人脸卡通画的“漫画脸”特效就小有出圈。
但ChatGPT的成功模式已证明,大模型的训练是入场费高昂的长跑。另有知情人士表示,在ChatGPT公开前,字节内部对大模型的投入依然较为犹疑,“对于字节的产品矩阵来说,目前的算法已经够用”。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn