支付宝CTO陈亮:AI大规模落地,需要解决算力、成本和用户体验
2月21日消息,支付宝在今年春节推出了AI创新玩法。据支付宝透露,2024支付宝五福节活动期间,有近6亿人次通过支付宝AI科技体验新年味,年轻人涌入支付宝玩“飙戏小剧场”,“大家来找福”……五福热度不减。其中,“大家来找福”成为最受欢迎的集福卡方式,共有近30亿个AI生成的福字被用户找到。《热辣滚烫》换脸片段上线五福“飙戏小剧场”后,一天吸引近百万网友AI“参演””。
“今年的五福节,是支付宝首次由AI全面驱动的五福活动,推动AI在支付宝上规模化落地应用的同时,也推动了支付宝的第二次技术迭代。”支付宝方面表示。
图源:支付宝APP
近日,新浪科技《科创100人》与支付宝CTO陈亮(花名俊义)进行一场深入访谈,探讨支付宝技术迭代方法论等。据介绍,从技术角度,支付宝成立迄今,主要经历了两轮技术迭代。其中,第一次技术迭代是由双11倒逼发生的,主要是解决海量高并发数据场景下的安全顺滑问题,过程中逼出了以OceanBase和绿色计算为代表的分布式技术和架构。第二轮技术变革,则是支付宝加速布局AI应用,推动解决AI应用大规模落地过程中产生的算力、成本可控等问题,目的在于为用户和商家打造一个全面AI化的“新支付宝”。
而此时此刻,“支付宝正经历第二轮技术迭代”。在俊义看来,今年的五福节,便是一届由AI全面驱动的五福节,“整个AI在支付宝上已融入了日常生活中,不仅仅是对用户,对我们日常工作都有非常大的影响和驱动。”
在前后两轮技术迭代过程中,支付宝所采用的是一种“开飞机换引擎”的方式。此前的技术并没有瞬间被抛弃,而是会沿用到当下的场景中,与新的AI技术进行融合,然后在不断地实践和场景打磨中,不断融合淬炼,迭代进步。
图源:支付宝官微
以本届AI驱动的五福为例,据俊义介绍,在有了第一轮技术迭代中产生的分布式技术支撑后,“当开奖时候数亿人涌入支付宝时,也不再担心宕机的风险。与此同时,此时忽然出现的大量用户密集体验AI创新玩法,也能够得到很好地支撑”。
“9年前第一次集五福遇到最大的挑战是这么多人一起开奖,这在中国历史上是没有过的,技术上想了非常多的办法,改造了非常多。”俊义表示,支付宝五福期间同时在线用户有几亿,这是一般没遇到过的,“所以这几年五福很好地继承了支付宝分布式的技术”。
“蚂蚁集团自主研发的硬核科技,如分布式数据库、云原生分布式计算架构、智能风控等,一直引领行业的技术方向,也都是被国民级项目倒逼出来。可以说,支付宝的技术淬炼,是在一个又一个‘大型战场’上磨炼升级突破的。”俊义表示。
图源:支付宝官博
俊义透露,他作为在支付宝工作了17年的老员工,从第一届双11开始,已完整经历双11十余年的支付压测与技术保障,他身上的一个大标签就是“双11技术总指挥”。也主导了支付宝小程序云的技术和产品上线。在用AI改造支付宝业务这条路径上,俊义也是技术的总指挥。
在他看来,由AI驱动的五福,不管面向To C也好,还是To企业级用户和内部员工,本质都是解决大规模落地的问题。而在AI大规模落地应用过程中,目前需要解决以下两个关键问题:第一,算力支撑得住、成本可控;第二,用户体验好。
据他介绍,在保证算力支撑得住上,目前蚂蚁基础大模型平台已具备万卡异构集群,其中千卡规模训练MFU可达40%,集群有效训练时长占比达90%以上。此外,数据层面,除了全网通用语料与金融领域的优质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁也从真实场景萃取了超60万条以上的专属指令。
图源:支付宝官网
为控制成本,蚂蚁集团在软件解决GPU焦虑上做了很多探索实践。目前,蚂蚁的CPU利用率从2017年的不到10%,提升到了2022年的33%。此外,蚂蚁万卡异构集群的硬件算力效率(HFU)也超过了60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下吞吐性能较业界方案提升3.59倍。与此同时,目前约50%的蚂蚁程序员,也在写代码时通过自研的CodeFuse提升代码开发效率,AI生成代码占比超过10%。
据了解,目前,支付宝已实践出了一套完整的AI Copilot的解决方案。这些被倒逼出来的技术突破,在扛住国民级项目后,开始运用到支付宝日常的技术支持,再又通过开源和对外商业化,服务外部合作伙伴和更多普通人。
“AI应用能否大规模落地,关系到AI是否能够真正服务社会并走向真正的AGIC时代,支付宝在解决这个行业难题,并提出了一些解决方案。未来百灵大模型将会被用于全面改造支付宝的应用场景,期待一个全新的支付宝。”俊义表示。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn