阿里云通义听悟新增自动提取PPT等三大功能

柏纳

2023-08-02 15:48

8月2日消息，阿里云通义听悟上线三大新功能，包括国内音视频AI领域首创的视频自动提取PPT，以及浏览器插件、钉钉和微信小程序。

format-jpg

截自通义大模型官网

今年6月，阿里云首次宣布通义听悟开放公测。此次升级，在原有实时记录、音视频文件转写、全文概要、章节速览等功能之上，新增“提取PPT”功能。该功能通过引入视觉AI算法，自动将PPT讲解视频分割为演示文稿，并对每页PPT进行要点总结，形成一份图文并茂的大纲，解决培训、网课学习等场景“求PPT难”的问题。

通义听悟还增加了浏览器插件和移动端的支持。用户开会、上网课、看直播、看视频时，Chrome和Edge浏览器插件功能可全程录制，并实时生成双语字幕，帮助用户更轻松地浏览视频内容。

format-jpg

截自通义大模型官网

在移动端，通义听悟钉钉和微信小程序不仅支持PC端的基础功能，还可以一键转写手机和聊天记录的音视频文件。

本次新功能上线期间，阿里云继续联合各大平台和社区推出定制口令码，用户根据口令码可随机抽取20h、30h、66h、88h、100h的免费转写时长。通义听悟集成了阿里云的语音、语言和视觉AI技术，未来还将陆续上线适用于更多场景的新功能。

据悉，阿里云自2019年启动大模型研发以来，通义大模型逐步从单一模态真正升级为多模态大模型。今年4月，阿里云正式推出大语言模型“通义千问”，它能够响应人类以自然语言提出的指令，完成回答问题、创作文字、编写代码、角色扮演对话等各项任务。

在7月举行的2023世界人工智能大会期间，阿里云宣布推出通义大模型家族新成员通义万相，用户可以在通义万相中输入提示词，以输出相应图像。除文生图以外，通义万相也推出了包括风格迁移、相似图生成等功能。

format-jpg

截自通义大模型官网

阿里云智能集团首席技术官周靖人在2023世界人工智能大会透露，通义千问已有累计超30的申请用户，超过100家深度共创企业，而通义听悟发布首月已有36万用户。

声明

1、该内容为作者独立观点，不代表电商派观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、电商号平台仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。
3、如对本稿件有异议或投诉，请联系：info@dsb.cn