首页
快讯
观察
Toggle theme
阿里巴巴
多
模态
对话专利公布 可丰富人机对话方式
2023-03-25 17:02:20
3月25日消息,天眼查资料显示,3月24日,阿里巴巴达摩院 科技有限公司申请的“
多
模态
对话方法、装置、设备及存储介质”专利公布。该申请使得用户可以通过多种
模态
信息对同一问题和该问题针对的目标对象进行描述,使得人机对话系统可以从多个
模态
理解同一问题,并生成一个或多个回复信息,如果是多个回复信息,则多个回复信息的
模态
不同,从而实现了
多
模态
对话,使得用户和人机对话系统之间的对话方式灵活多样,提高了用户体验。
蚂蚁集团推出20亿参数
多
模态
遥感基础模型SkySense
2024-02-28 12:05:55
蚂蚁集团
多
模态
研究成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
字节跳动开源
多
模态
AI Agent—UI-TARS-1.5
2025-04-23 10:21:12
4月23日消息,字节跳动开源了
多
模态
AI Agent UI-TARS的最新1.5版本。与上一代相比,1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。
阿里联合清华大学发布中文
多
模态
预训练AI模型M6
2021-03-03 10:06:52
3月3日消息,阿里巴巴与清华大学联合发布中文
多
模态
预训练AI模型M6。据介绍,预训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
360孙浩:结合物联网的
多
模态
大模型将是下一个风口
2023-06-05 11:43:53
针对360智慧生活的相关话题,360视觉云业务线总经理孙浩发表了自己的观点。
余承东:华为P60引入
多
模态
大模型技术 可实现智慧搜图
2023-03-23 17:46:55
3月23日消息,华为任余承东介绍,华为带来全新智慧搜图功能,基于
多
模态
大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。智慧搜图功能将于2023年5月陆续上线,支持搭载HarmonyOS 3.1及以上版本的手机或平板电脑。
腾讯AI聊天专利可
多
模态
回复消息
2023-04-07 15:44:35
4月7日消息,天眼查App显示,4月7日,腾讯科技 有限公司申请的“一种智能互动方法、装置、计算机设备和存储介质”专利获授权。本申请可以在对话过程中,用文本搭配
多
模态
内容等来回复用户,丰富了虚拟用户与用户的对话形式,极大地增加了聊天的趣味性和对用户的吸引力。
阿里云开源通义千问
多
模态
大模型Qwen-VL
2023-08-25 11:47:09
8月25日消息,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
齐心集团:公司目前暂未投入
多
模态
技术研发
2023-12-13 09:37:19
12月13日消息,齐心集团近日在互动平台表示:公司目前暂未投入
多
模态
技术研发,公司十分注重前沿技术的发展及应用,将密切关注新技术、新趋势的发展。
消息称字节跳动正秘密研发
多
模态
数字人等多个AI产品
2024-02-29 09:18:13
2月29日消息,据报道,字节跳动正在AI大模型领域秘密研发多个产品,其中包括
多
模态
数字人产品以及AI生图、AI生视频产品等。一位知情人士透露,其在去年下半年见到了字节跳动
多
模态
数字人产品的demo,整体感觉还不错。另据了解,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。对此消息,字节跳动方面尚未回应。
钉钉AI助理升级 加入
多
模态
、工作流等能力
2024-03-28 14:17:58
3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索
多
模态
、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
字节跳动将上线全新
多
模态
视频生成模型
2025-02-07 18:00:20
2月7日消息,字节跳动旗下一站式AI创作平台即梦AI将上线
多
模态
视频生成模型OmniHuman,仅需一张图片与一段音频便可生成一条AI视频,该模型为字节自研闭源模型。即梦AI相关负责人透露,该模型未来会进行小范围内测,官方也会对这一功能设置严格的安全审核机制,并对输出的视频标注水印以作提醒。
值得买科技CTO王云峰:还在同步开展
多
模态
工作,如直播数字人等
2023-08-31 10:45:49
8月31日消息,在“什么值得买”上线多款AIGC应用之际,值得买科技CTO王云峰接受媒体采访,他谈到除了已上线的应用,值得买科技还在同步开展
多
模态
的工作,具体包括:包括“图生图”和“文生图”的模型,短视频脚本的生成,短视频的自动生成,以及直播数字人等,包括可供内容创作者使用的创作辅助工具也在推进研发之中。
京东副总裁何晓冬:大模型下一步必将会从语言模型走向
多
模态
模型
2023-05-26 15:22:41
在2023小蛮腰科技大会上,京东集团副总裁何晓冬表示,ChatGPT代表了未来大模型的走向,下一步必将会从语言模型走向
多
模态
模型。
百度智能云事业群总裁沈抖:随着大模型能力的提高,
多
模态
大模型会很快成熟
2023-07-03 17:28:44
7月3日消息,河北省人大常委会近日邀请百度集团执行副总裁、百度智能云事业群总裁沈抖作《大模型:产业智能化的新引擎》专题讲座。沈抖表示,随着大模型能力的提高,融合文字、语音和视觉的
多
模态
大模型也会很快成熟。这将进一步促进人工智能与实体经济深度融合,进一步提升钢铁、汽车、工业制造、文旅以及自动驾驶等领域的智能化水平和生产力。
阿里通义千问大模型入驻钉钉 提供文图视频等
多
模态
服务
2024-01-09 15:51:14
1月9日消息,阿里云通义千问大模型入驻钉钉服务号,成为首个通过办公应用开放服务端口的大模型。用户在搜索“通义千问”就可找到对话窗口,通过文字或语音交互,让大模型提供文生文、文生图、图像理解等
多
模态
服务。
腾讯刘煜宏:腾讯混元大模型正在积极发展
多
模态
模型及应用
2024-04-02 16:39:23
4月2日消息,腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,
多
模态
大模型将重构内容产业,基于
多
模态
的应用也会百花齐放。他介绍,腾讯混元大模型技术架构已升级为混合专家模型架构,参数规模达万亿,擅长处理复杂场景和多任务场景。目前正积极发展
多
模态
模型,进一步加强文生图、文生3D以及文/图生视频能力。同时探索基于大模型全面升级的数智人、语音对话虚拟人、具身智能机器人等应用,提升效率和体验。
前微软亚研院视觉专家胡瀚加入腾讯 负责
多
模态
大模型研发
2025-01-08 15:08:35
据“AI科技评论”公众号,胡瀚不久前加入腾讯,接替已离职的前腾讯混元大模型技术负责人之一的刘威,负责
多
模态
大模型的研发工作。
天猫精灵发布首款大模型
多
感知学习机Z20
2023-10-18 17:35:50
10月18日消息,阿里旗下天猫精灵推出真智能大屏护眼学习机Z20。据介绍,该款产品兼具大模型和
多
模态
AI感知能力,还具有个性化对话、学科辅导等特性。产品团队介绍,随着生成式AI基础模型成熟后,其与通义大模型团队联合进行双语大模型的继续训练和微调,模型在口语化、语言分级、情景生成上有进一步提升;近期,相关能力会先通过专项应用对Z20用户公测。该产品已进入2023双11预售阶段,售价2799元起。
通义千问全
模态
模型Qwen2.5-Omni开源
2025-03-27 09:22:23
3月27日消息,通义千问发布并开源首个端到端全
模态
大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。在权威的
多
模态
融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。
‹‹
‹
1
2
3
›
››