钉钉AI助理升级:上线图片理解、文档速读等功能

王小孟
2024-03-29 01:30

3月29日消息,钉钉AI助理近日宣布完成升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉AI助理拥有更强的视觉推理能力和长文本速读能力。

目前,用户在钉钉IM消息框或点击魔法棒按钮进入AI助理对话框,发送长文件、在线文档、网页链接、视频内容,即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字,甚至可以通过多轮交互进一步做智能问答。

format-jpg

图源:钉钉黑板报公众号

据了解,基于通义千问Qwen-VL-Max视觉理解模型,钉钉AI助理能够准确描述和识别图片信息,并根据图片进行信息推理、扩展创作、文字提取、翻译等,相当于一个全能的“图片小百科”。

不管图片展示的是某件物体、某个人物、风景,还是菜谱、社交梗图、数学题和衣服标签,AI助理都能一秒识别图片内容,并在此基础上进行多轮对话问答。比如,旅游时看到一个很美的建筑,拍照发给钉钉AI助理,就能迅速了解它的历史背景和相关故事。

format-jpg

图源:钉钉黑板报公众号

利用这一能力,用户还可以实现识图翻译或提取图片中的文字,让信息获取更加便捷。比如,不知道某件衣服的洗涤方式,把衣服标签拍个照发给钉钉AI助理,就可以翻译上面的英文。

通义千问Qwen-VL-Max拥有更强的视觉推理和中文理解能力,整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界最佳水平。

此外,AI助理也支持视频内容的速读。发送给AI助理的短视频、直播切片或培训视频可以被快速“观看”,AI助理会根据视频内容生成字幕,提取关键词,并生成一份智能摘要,对于最高2GB的视频内容,仅需3分钟即可完成智能解读。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
4月18日消息,正式上线AI助理市场,首批将推出超过200个AI助理,覆盖企业服务、行业应用、效率工具、财税法务、教育学习、生活娱乐类目,用友、携程商旅、墨见Molook各领域SaaS企业已上架AI助理,加入AI生态。现在,用户在搜索“AI助理市场”,即可选择启用各AI助理。截至2024年3月底,AI已超过220万家企业使用,月活跃企业超过170万家。
3月28日消息,AI助理升级,上线图片理解、文档速读、工作流产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
4月24日消息,实在智能上个月与达成战略合作,双方基于平台共同打造AI Agent解决方案,随着双方合作不断深化,首批用于获取数据、查询信息的办公助手“实在Agent系列”已上架AI助理市场,面向7亿用户免费开放。打开最新版,选择右上角彩色“魔法棒”,进入AI助理页面,通过点击切换,就可以找到实在Agent助理“工商信息一键查、转评赞取数宝、爆品评价取数宝”。
九州通医药集团股份有限公司打造的企业内部问答AI助理——“智能九哥”正式投入运营。
4月30日消息,浙江省网信办发布“生成式人工智能服务已备案信息公告”,AI助理通过国家大模型服务备案。截至2024年3月底,AI已超过220万家企业使用,月活跃企业超过170万家。
该方案基于AI助理与知识库,仅需短短10分钟,即可为学校量身定制一个全天候、全方位的智能迎新助手。这个“百事通”不仅能够7*24小时不间断地回答新生关于入学流程、校园生活、学习资源各方面的疑问,还能根据学校各部门的具体需求,灵活创建专属的AI助理服务,为师生提供更加个性化、精准的信息支持。
3月13日消息,浙江实在智能科技有限公司昨日与 信息技术有限公司签署战略合作协议,达成战略合作伙伴关系,双方将在企业数字化、AI Agent、全域数据分析领域展开全面深度合作。目前,已计划打造推出上百个AI Agent,并有望于4月底上线AI助理市场。
截至2024年3月底,AI已超过220万家企业使用,月活跃企业超过170万家。
老板电器打造的企业内部AI智能问答助理——“小T”正式上线。