快手自研文生图大模型“可图”已开启内测

柏纳
2023-09-19 11:17

9月19日消息,从8月下旬开始,快手AI团队已在公司内部开启了可图大模型平台的内测,面向内部业务团队提供AI绘画创作能力。据介绍,“可图”文生图大模型有着三个突出特点,分别是强大的文本理解、丰富的细节刻画,以及多样的风格转化。

目前,“可图”大模型在快手站内也落地到了评论区,9月15日开放内测的“AI玩评”功能,便由“AI玩评”提供技术支持。用户通过“AI玩评”功能可一键生成海量风格图片,更便捷的在评论区进行趣味互动。

format-jpg

截自快手App

快手AI团队表示,可图大模型仍在持续优化效果、丰富能力。未来,可图将会与快手的更多业务开展合作,用AI技术丰富业务的想象力,探索更多有趣、有价值的创新应用落地,让人机共创成为现实。

此前,快手已推出大语言模型“快意”(KwaiYii)。快意GitHub页面介绍显示:快意大模型(KwaiYii) 是由快手AI团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

format-jpg

截自快意GitHub页面

基于目前在大模型的技术积累,快手已经实现了多个应用场景的落地。今年7月8日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。

8月8日,快手AI对话开启小范围测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态。快手AI对话依托于快手社区内容生态,通过互动对话的形式,可以帮助用户快速查找短视频、达人、百科等内容,体验全新的信息获取形态。

此外,据Tech星球报道,快手旗下的视频剪辑类产品“快影”和功能拍摄类产品“一甜相机”,已于6月下旬陆续内测包括“AI动漫视频”、“AI文案推荐”、“AI瞬息宇宙”、“AI简笔画”在内的多款AIGC创作功能。这些功能可以让用户轻松地将自己的照片或视频转换为不同风格和效果的内容,如动漫、水彩、国风、油画等,并自动生成符合内容语境的文案。

format-jpg

图源:Tech星球公众号

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
9月19日消息,在 AIGC 领域的最新进展-模型“可图” 已在公司内部全面开启内测,据悉,“可图”模型有着三个突出特点,分别是强大的文本理解、丰富的细节刻画,以及多样的风格转化。目前,“可图”模型站内也落地到了评论区,9月15日开放内测的“AI 玩评”功能,便由“可图”提供技术支持。
5月31日消息,模型“可图”已于近日正式对外开放。“可图”模型目前支持图和图图两类功能,可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用,这也是首次将其的系列模型对外开放。
3月21日消息,在业绩电话会上,创始人兼CEO程一笑透露,2023年公司启动AI战略后,一步步扎实推进模型的研发训练。“我们有信心在未来半年内,使模型的综合性能达到GPT4.0的水平。”据透露,模型“可图”,综合性能已经超过Midjourney V5水平。
3月20日消息,创始人兼首席执行官程一笑在公司2023年度业绩电话会上表示,2023年公司启动AI战略后,一步步推进模型的研发训练,并加速模型的场景化落地。对于视频,已于去年底推进专项研发,程一笑表示,这对短视频生态是巨大的机会,未来会把生成模型和生产者工具结合起来,不断帮助创作者降低创作门槛,提升短视频制作质量和效率。
“快意”是由AI团队研发的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。
参与测试的用户点击搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话。
8月18日消息,公布基于语言模型应用的最新进展——“AI对话”功能已经在安卓版本开放内测。参与测试的用户点击搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发“搜索智能问答”卡片,通过底部入口可以启用该功能。
8月23日消息,程一笑在二季度财报电话会上表示,研发团队正在按计划推进模型的开发和训练。目前,语言模型“快意”已开启内测,并为业务团队提供了标准API和定制化项目合作方案。基于目前在模型方面的技术积累,已经实现了多个应用场景的落地。打造了全模态模型AIGC的解决方案。
据悉,可灵模型AI团队,基于在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项技术创新,效果对标Sora。可灵模型生成的视频分辨率高达1080p,时长最高可达2分钟,且支持自由的宽高比。