张一鸣不能再等了，抖音必须拿下大模型市场

1.抖音社交负责人调岗大模型团队

近日，抖音又迎来了新的人员调整。

具体来说，抖音社交负责人陆游，调岗到大模型团队担任相关负责人，向大模型团队负责人朱文佳汇报。另外，字节内部正在研发新的大模型项目，代号“O”。

在此次调整之前，陆游主要负责抖音的社交体系和项目。任职期间，陆游曾孵化了虚拟社交功能“抖音仔仔”、密友社交“抖音时刻”等多个社交项目。

再来看朱文佳，他曾担任百度搜索部主任架构师，2019年成为今日头条CEO。朱文佳在推荐算法和搜索业务上有着丰富的经验，被称为“头条里算法技术的top 3人选”。2021年2月，朱文佳调任为Tik Tok产品技术负责人，向Tik Tok CEO周受资汇报。

陆游、朱文佳调岗至大模型团队担任相关负责人，被外界视为抖音或想通过调动部分技术和管理高管加码大模型业务的信号。

一位接近字节的人士透露，字节内部研发和探索的大模型、AI产品，不在少数，涉及生成式AI、AI机器人、AI绘画等赛道，而且正加大对大模型相关人才的招聘。

实际上，今年以来抖音在大模型的投入力度不减。

4月18日，抖音旗下火山引擎召开“2023春季火山引擎FORCE原动力大会”，发布了自研DPU等系列云产品，并推出火山引擎的新版机器学习平台：支持万卡级大模型训练、微秒级延迟网络，弹性计算可节省70%算力成本。

火山引擎总裁谭待透露，“国内大模型领域的数十家企业，超过七成已经在火山引擎云上”。

format-jpg （图源：抖音）

6月9日，有消息称，字节跳动正在内部测试一款代号叫“Grace”的AI对话类产品。对此，抖音相关负责人回应称：Grace是一个AI对话类测试项目的内部代号，目前还处于初级阶段，仅用于内部体验测试。

随后就在6月底，火山引擎又发布了大模型服务平台“火山方舟”。火山引擎总裁谭待坦言，“火山方舟”还在起步阶段，工具链和下游应用插件需要持续完善。平台将接入更多大模型，并逐步扩大邀测范围，与企业客户共建开放合作的多模型生态，加速大模型在各行各业的应用落地。

据介绍，“火山方舟”集成了百川智能、出门问问、复旦大学MOSS等多家AI科技公司及科研院所的大模型。

种种迹象表明，抖音将会在大模型的道路上继续狂奔，以期更快地在“百模大战”中胜出。

2.“百模大战”仍在继续

从今年开始，各大互联网公司在AI大模型领域打得火热，甚至到了目前的白热化阶段。据中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示，截至5月28日，国内10亿级参数规模以上基础大模型至少已发布79个。

format-jpg （图源：财经十一人）

与此同时，随着大模型数量的大幅增加，大模型战争已经由通用大模型转向领域更细分的行业大模型。

当前，更受企业关注的是在交通+大模型方向的解决方案和应用场景探索。

例如，3月底，百度发布行业首个智慧公路AI数字人“简璐璐”，它能够通过对话完成业务处理，对发生的道路事件、问题进行智能决策处理，智能生产需要的内容，并自动撰写高速公路事件处理报告。

4月18日，商汤科技“日日新SenseNova”大模型体系首次展示其中文语言大模型“商量SenseChat”与车舱的结合。

商汤绝影智能车舱副总裁许亮表示，“日日新SenseNova”拥有语言大模型和数字人等多种生成式AI能力，可为车舱提供智能化的多模态人车交互体验。

5月，在赛文交通网主办的第十二届（2023）中国智能交通市场年会-中国智能交通市场经济管理论坛（暨智能交通产业领袖论坛）上，阿里云智能交通物流行业总经理张磊表示，阿里云具备研发生成大模型的关键要素，愿携手客户与伙伴共同探索大模型在交通物流行业的智能化应用。

除了在交通大模型行业的布局，各大公司也有自己的专攻领域。例如，阿里的绘画大模型“通义万相”、华为云盘古气象大模型、腾讯“混元”AI大模型、中国电信的类ChatGPT产品“TeleChat大模型”、第四范式专注企业软件领域的“式说”大模型等纷纷出现，各大互联网企业和科技公司唯恐自己掉队。

7月6日，2023世界人工智能大会在上海开幕，大会围绕大模型、生成式人工智能、科学智能等前沿话题展开前瞻性探讨。据了解，参展企业数量、展览面积均创历届之最。

根据《经济观察报》报道，据不完全统计，有10多款大模型新品发布或宣布。

format-jpg （图源：中新网）

可以说，大模型已经在各个领域上加速落地。

3.抖音的出路

从各大公司的大模型业务进展情况来看，抖音在大模型的研发的确有些缓慢，不得不加快追赶的速度。

我们再回到抖音旗下的大模型服务平台“火山方舟”，它是面向企业提供模型精调、评测、推理等全方位的MaaS平台服务。也就是说，“火山方舟”采用的是“模型即服务”的商业模式。

这种商业模式的运作方式，即有能力的大公司提供预训练模型，使得垂直行业的小公司能够构建和部署AI模型，而无需投资构建和维护自己的模型所需的基础设施、硬件和专业知识。

format-jpg （来源：财联社）

“火山方舟”提供的就是这样一种服务，简单来说，企业可以通过“火山方舟”同步试用多个大模型，选用更适合自身业务需要的模型组合，不需要前期大笔资金投入就可以完成大模型训练、推理。

据火山引擎智能算法负责人吴迪介绍，对模型提供方来说，火山方舟能够帮助企业以更低的成本触达海量客户，用更小的代价在ToB市场规模化。对模型使用者来说，火山方舟可以便捷地接触到众多高质量的基座模型。

format-jpg （图源：南方都市报）

吴迪还透露，抖音集团内部已有十多个业务团队试用“火山方舟”。

从运营模式来看，抖音旗下的火山引擎仅仅与大模型生产方合作，为它们提供大模型服务，火山引擎自己不做大模型。

因为大模型的成本很高，尤其是针对大模型的训练，需要很大的资金投入。 “我们相信，到2024年秋天之后，以推理为主的大模型应用消耗，将超过预训练消耗的60%，并且在2025年的某个时刻，超越预训练算力消耗。”吴迪坦言。

大模型的训练成本有多高？我们来看看微软OpenAI的GPT-3，它的参数量达到1750亿，GPT-3的存储需求高达350GB、训练成本超过1200万美元。

结合大模型训练成本过高的缺点以及MaaS平台服务更低成本和更高效的优点，或许可以理解火山引擎不做大模型的原因。

在火山引擎总裁谭待看来，性价比合适很重要。火山引擎需要做的，就是把平台做好，服务好大模型企业。

不过，抖音并非不会涉足大模型，而是在探索相关的大模型业务。

在AI大模型训练算力基础设施的GPU上，抖音也有自身的优势。内部人士透露，字节方面并不缺少GPU，由于火山引擎和抖音、Tik Tok在算力上的需求，字节内部一直储备着足量的高性能GPU资源。

未来，大模型市场将会是开放合作的多模式生态，抖音或许可以通过火山引擎，结合自身业务需要加强与其他大模型企业的合作，探索更多的模态。