阿里云通义听悟新增自动提取PPT等三大功能

柏纳
2023-08-02 15:48

8月2日消息,阿里云通义听悟上线三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序。

format-jpg

截自通义大模型官网

今年6月,阿里云首次宣布通义听悟开放公测。此次升级,在原有实时记录、音视频文件转写、全文概要、章节速览等功能之上,新增“提取PPT”功能。该功能通过引入视觉AI算法,自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。

通义听悟还增加了浏览器插件和移动端的支持。用户开会、上网课、看直播、看视频时,Chrome和Edge浏览器插件功能可全程录制,并实时生成双语字幕,帮助用户更轻松地浏览视频内容。

format-jpg

截自通义大模型官网

在移动端,通义听悟钉钉和微信小程序不仅支持PC端的基础功能,还可以一键转写手机和聊天记录的音视频文件。

本次新功能上线期间,阿里云继续联合各大平台和社区推出定制口令码,用户根据口令码可随机抽取20h、30h、66h、88h、100h的免费转写时长。通义听悟集成了阿里云的语音、语言和视觉AI技术,未来还将陆续上线适用于更多场景的新功能。

据悉,阿里云自2019年启动大模型研发以来,通义大模型逐步从单一模态真正升级为多模态大模型。今年4月,阿里云正式推出大语言模型“通义千问”,它能够响应人类以自然语言提出的指令,完成回答问题、创作文字、编写代码、角色扮演对话等各项任务。

在7月举行的2023世界人工智能大会期间,阿里云宣布推出通义大模型家族新成员通义万相,用户可以在通义万相中输入提示词,以输出相应图像。除文生图以外,通义万相也推出了包括风格迁移、相似图生成等功能。

format-jpg

截自通义大模型官网

阿里云智能集团首席技术官周靖人在2023世界人工智能大会透露,通义千问已有累计超30的申请用户,超过100家深度共创企业,而通义听悟发布首月已有36万用户。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
8月2日消息,阿里通义今天上线了三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序,帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。今年6月,阿里首次宣布通义开放公测,此次升级,在原有实时记录、音视频文件转写、全文概要、章节速览等功能之上,新增“提取PPT”功能
通义还推出“高校公益计划”,赠送价值数千元的500小时音视频转写时长。
阿里峰会·粤港澳大湾区在广州举行。
6月1日消息,阿里智能于今日发布通义,6月1日正式公测。阿里智能CTO周靖人表示,通义是依托通义千问大模型和音视频AI模型的AI助手,可进行实时语音识别,实现对话的实时记录、多语言翻译、发言总结、提取PPT、内容规整等。
10月17日消息,浙江省自然资源阿里甲级测绘资质注销一事作出回应:“阿里云系主动申请注销,依照《中华人民共和国测绘法》和国家、省测绘资质管理的有关规定,经杭州市规划和自然资源局西湖分局、杭州市规划和自然资源局初审,我复审,同意阿里计算有限公司的注销申请,并于11月14日作出决定,按规定在网上公开。阿里与国安部通报的国内B公司不是一家公司。”
1月27日消息,阿里通义于今日凌晨开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。
1月16日消息,阿里通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队还开源首个步骤级的评估标准 ProcessBench,填补了大模型推理过程错误评估的空白。
1月8日消息,阿里通义灵码AI程序员已全面上线,成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员产品。此次上线的AI程序员相比传统AI辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,通过全程对话协作的方式,就能完成从0到1的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。
11月28日消息,阿里通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。