快手张迪:可灵让每一个人都能够用AI讲出一个好故事

田宁
2025-04-20 14:38

4月20日消息,2025(第十七届)商界木兰年会近日在北京举办。围绕可灵AI的技术进展和实际应用,快手科技副总裁、大模型团队负责人张迪发表了主题演讲。

他提到,可灵AI这个业务的愿景是建设全球领先的AI视觉与表达平台,让每一个人都能够用AI讲出一个好故事,“这是我们做这件事情的初衷,我们想让每一个人都可以把自己的创意转化成一个好的视觉的故事”。

111-800.jpg

图源:中国企业家杂志公众号

据介绍,可灵已经发展成了一个全球化的产品,在全球范围之内累计超过2200万的用户,用户使用可灵生成了1.68亿个视频,其中包括3.44亿张图片,可灵在阿根廷、智利等8个国家和地区的iOS应用市场下载排到了第一,在北美市场的分类下载也排到了第一。

4月15日,快手发布了可灵2.0,在可灵发布的时候有两个最核心的模型,一个是可图大模型2.0,做的是图像生成的工作,用户输入一段文字,其就可以按照文字指令生成一个图片;第二个是可灵视频生成大模型,用户输入一段文字或者输入一张图片,就可以生成对应的想要的视频片段。

张迪表示:“从指标上来说,我们发布的新版本在全球范围之内,在这个领域仍然是行业领先的,包括我们的可图在评测上超过了我们的竞品,包括大家比较了解的Midjourney,我们可灵大模型在模型的性能上比谷歌Veo2和OpenAI的Sora,包括非常知名的Runway要更好一点,这是一个模型指标的参考。”

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
12月12日消息,副总裁、大模型团队负责人在“2024AIGC视觉应用论坛”上透露,AI上线半年以来经历过16次迭代,目前已有超过600万用户,累计生成超6500万个视频和超1.75亿张图片。他表示,AI将于近期推出全新的1.6版本模型,在文本遵循、动态表现、风格一致性等方面将有大幅提升。
9月9日消息,宣布正式启动“AI”电影共创计划,联合李少红、贾柯、叶锦添、薛晓路、俞白眉、董润年、吃鱼、王子川、王卯卯等9位顶尖导演共同推出9部AIGC电影短片。据悉,9部短片将全部由AI进行视频生成,电影导演完全依托视频生成大模型,群体深度参与电影级内容创作,这在中国尚属首次。
8月23日消息,AI推出会员订阅计划,其中连续包月月最低价仅19元,生成约66个视频或3300图片,还享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。刚发布的二季度财报显示,AI已有超百万用户,累计生成了超千万视频。联合创始人、董事长兼CEO程一笑表示,未来将进一步升级大模型,同时力争尽快实现可观的商业化变现规模。
3月26日消息,科技创始人兼首席执行官程一笑在2024Q4及全年业绩电话会上披露,2024年Q4,平台上的AIGC营销素材和虚拟数字人直播解决方案的日均消耗超过3000万人民币。程一笑表示,根据内部测算,AI大模型预计可以把客户的短视频营销素材制作成本降低60-70%甚至更高。目前致力于逐步把磁力引擎全面升级下一代的AI智能商业引擎。目前,AI已与包括小米、亚马逊云科技、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。
8月27日消息,主站业务与社区科学线负责人盖坤在2024光合创作者大会上披露,AI不断深入创作者的内容生产环节。截至目前,已有超过160万人使用过的视频生成大模型AI,并累计生成超1600万视频。7月30日,AI正式面向全球上线会员体系,成为全球首个用户可用的真实影像级视频生成大模型。
3月26日消息,金发布研报称,考虑到内循环短期让利及AI投入的部分影响,该行下调-W 25/26年Non-IFRS净利润9%/8%至200.7/236.4亿元。当前股价对应12/10倍25/26年Non-IFRS P/E。维持跑赢行业评级,考虑到AI的行业领先性,具备估值溢价,维持目标价66港元,对应13.6/11.4倍25/26年Non-IFRS目标P/E。
9月27日消息,里昂发布研究报告称,维持-W“跑赢大市”评级,AI增强的内容创建及推荐,同时大型生成模型亦最多创建1分钟的影片,预计下半年的GMV将增长约15%,调整后纯利约85亿元人民币。报告称,在投资者日公布电商与行销策略以及AI应用。当中公司提到,其电商策略的重点是推动产品销售而不是补贴,将透过推广平台及简化的广告产品,来持续提升内部广告提成率。
据悉,大模型为AI团队自研,基于在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。大模型生成的视频分辨率高达1080p,时最高达2分钟,且支持自由的宽高比。
田宁
电商脉搏,媒体前沿洞察。