字节发布文生图开放模型SDXL-Lightning

柏纳
2024-02-23 20:46

2月23日消息,据界面新闻报道,字节发布文生图开放模型SDXL-Lightning。AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。

与SDXL-Lightning一同上榜的,是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

format-jpg

截自界面新闻

在图像生成领域,先进模型的生成技术依赖于扩散过程,就是把噪声逐步转化为图像样本的迭代。这个过程通常需要20到40次调用神经网络,不仅会耗费巨大的计算资源,生成速度也比较慢。生成一张高质量图像,大约需要5秒。

据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。

字节跳动智能创作团队对回应称,开源开放的浪潮已成为推动人工智能迅猛发展的关键力量,SDXL-Lightning模型基于已有繁荣生态的文生图开放模型SDXL,设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。

format-jpg

图源:66秒未来科技公众号

值得一提的是,近日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

format-jpg

截自微博

此外,据Tech星球2月18日报道,目前抖音集团多部门加大AI技术研发,并调集多位高管跟进,现在已有多款AI产品开启内测。

其中,Flow部门是抖音在AI技术研究和产品研发的排头兵,进展最快。该部门已经推出了豆包(Cici)、扣子(Coze)等AI产品外,另有AI角色互动APP“话炉”、AI产品“PicPic”正在内测和研发阶段。

除了Flow,抖音集团的其他重要业务部门也正在加码AI产品服务,包括抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育、剪映等。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
5月15日消息,在今日的2024春季火山引擎FORCE原动力大会,字节跳动正式发布自研大模型“豆包大模型”,该大模型包含豆包通用模型、语音合成模型模型等一共9个模型,已在字节跳动内部50多个业务和场景进行过应用。
5月15日消息,火山引擎主办的FORCE原动力大会在京举行。会上发布的数据显示,截至目前,字节跳动旗下大模型豆包App目前总下载量已经突破1亿,双端月活跃用户突破2600万,智能体创建总数800万。会上,字节豆包大模型正式开启对外服务,据悉,豆包大模型包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·模型、豆包·Function Call模型
1月22日消息,字节跳动发布豆包大模型1.5Pro版本。目前,Doubao-1.5-pro已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。据介绍,该模型具有低训练/推理成本,高效模型结构,全面提升了多模态能力、推理能力。在知识、代码、推理、中文等多项公开测评基准成绩全球领先。同时,在模型训练过程中,Doubao-1.5-pro未使用任何其他模型生成的数据。
12月18日消息,在火山引擎Force大会字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。
火山引擎总裁谭待表示,“国内大模型领域的数十家企业,超过七成已经在火山引擎云”。
3月3日消息,字节跳动发布AI编程工具Trae国内版,模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3。据了解,这是国内首个AI原生集成开发环境工具(AI IDE),能充分释放AI的潜力,帮助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发效率。用户可通过Trae中国官网下载体验。
6月27日消息,字节跳动发布基于豆包大模型打造的智能开发工具“豆包MarsCode”,面向国内开发者免费开放。豆包MarsCode产品的两种形态分别为编程助手和Cloud IDE,具备项目问答、代码补全、单测生成、Bug Fix等功能。