阿里云推出数字人视频生成工具Live Portait

柏纳
2023-08-16 15:26

8月16日消息,阿里云推出数字人视频生成工具Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。

根据魔搭社区上的信息显示,在Live Portait上传照片后,用户可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。

format-jpg截自魔搭社区

这次上线的Live Portait工具由运动模块和生成模块组成,采用阿里云自研的口型预测算法,生成的口型准确度相比传统方法大幅提高。在训练阶段,Live Portait增加了姿态的显式控制,不需要底板视频也可以生成任意动作的视频,大幅提升数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。据介绍,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。

该工具算法负责人张邦表示:“Live Portait集成了团队多项自研创新技术,例如仅需单张图片就能生成逼真的面部动画,突破了传统对抗生成网络的局限。随着技术的进一步迭代,图生视频有巨大的应用空间,有望成为企业降本增效的生产工具。”

据悉,该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文。

format-jpg

截自魔搭社区

阿里巴巴集团近日公布2023年六月底止季度业绩。其中,云智能集团(包括阿里云及钉钉)收入增长4%至251.23亿元,经调整EBITA利润增长106%至3.87亿元。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。

报告期内,阿里云正把促进大模型的生态繁荣作为首要目标,积极发展大模型的开源社区。财报透露,截至7月底,旗下魔搭社区集聚了200多万AI开发者、1000多个优质AI模型,模型累计下载总量超过4500万。

format-jpg

截自阿里巴巴2023年六月底止季度业绩公告

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里推出数字视频生成工具Live Portait
阿里推出NFT解决方案
阿里巴巴旗下阿里官方在社交媒体上宣布其已推出NFT解决方案。
10月31日消息,2023栖大会上,阿里首席技术官周靖发布阿里高校计划“工开物”,计划将为中国所有在校大学生免费提供一台服务器,所有高校学生可享受300元免费额度。此外,阿里还将为签约高校提供更大规模的算力资源支持。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学和华南理工大学等高校已首批达成合作。
6月13日消息,今日,阿里智能总裁张建锋在2022年阿里峰会上正式发布CIPU ,这是为新型数据中心设计的专用处理器,未来将替代CPU成为计算的管控和加速中心。据介绍,在这个全新体系架构下,CIPU向下对数据中心的计算、存储、网络资源快速化并进行硬件加速,向上接入飞天操作系统,将全球数百万台服务器连成一台超级计算机。
近日,阿里教育结合课后服务的政策要求和现实需求,推出业内首个数字化课后服务平台。
8月8日消息,阿里在万网焕新发布会上,宣布域名产品服务完成AI化系列改造,推出首个基于通义大模型的域名AI应用,并上线“.ai”等40余个全新的热门域名后缀、2000万个全球域名资源。升级后的阿里万网,实现了智能起名。用户输入只需输入品牌信息与所属行业,一键点击后,基于通义大模型就能批量生成创意域名。同时,大模型将会自动进行语义解析,输出域名含义,并通过多维评估与可用性筛查,提供可用选择。
7月24日消息,Meta开源最新Llama 3.1系列,包括4050亿参数 “超大杯”模型。阿里魔搭社区已上架全系列3款模型,同时,阿里百炼平台在国内推出针对Llama 3.1系列的训练、部署、推理服务,企业和开发者即日起可在阿里上基于其打造自己的专属大模型。