通义千问全模态模型Qwen2.5-Omni开源

2025-03-27 09:22:23
分享

3月27日消息,通义千问发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。

更加详细情况,请关注本站最新动态。