阿里巴巴达摩院发布语音产品“听悟”

宋妤
2021-10-22 15:25

10月22日消息,据天下网商消息,昨日,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。

据介绍,相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,其集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。

format-jpg

针对传统语音产品存在“听不准、分不清、看不懂”;在噪音下识别准确率较低,无法区分不同说话人,转写内容冗长难以阅读和沉淀等问题,达摩院语音实验室通过让AI深度参与,让线上及线下会议更智能、高效、协同。

值得注意的是,“听悟”内置达摩院独创声纹融合方位算法,能对多达10位说话人进行角色分离。此外,它还融入达摩院新一代端到端语音识别模型,中文识别准确率可达98%,支持14种方言及中英文“自由说”;可嵌入线上音视频会议,实时出字幕及纪要。

format-jpg

除听力方面的功能外,“听悟”还能模仿人工整理,进行智能纠错和分段,自动过滤语气词。同时,“听悟”擅长抓重点,可秒速生成关键词、核心结论、重点内容和待办,用户能同屏编辑、标注摘要、一键分享、安全保存。

值得一提的是,在2021云栖大会上,阿里达摩院XR实验室负责人谭平分享了他对于元宇宙的理解。他表示,本质上认为元宇宙是AR、VR眼镜上的整个互联网,是互联网在新计算平台上的一种呈现方式。

format-jpg

在谭平看来,元宇宙的范畴非常广泛,包括社交、电商、游戏、教育,甚至是支付。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
10月22日消息,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品”。据介绍,“”是面向未来会议的AI助理,集成了达摩院最新语音及自然语言处理技术,不仅“”得准,且“”性高,可秒速生成智能会议纪要及待办。
阿里巴巴达摩院1月18日公开一项“语音检测方法、会话记录产品及计算机存储介质”专利。
公司的“通义千问”大模型自2019年开始研究,目前,钉钉、天猫精灵等产品已接入通义千问测试,将在评估认证后正式发布新功能。报告中称,通义千问是由阿里巴巴达摩院研发的预训练语言模型,拥有多模态、多任务能力,擅长语言理解、文本生成、问答能力等,可应用到电商、设计、医疗、法律、金融等行业。
2月20日消息,春节前夕,首批由中国聋人协会指导研发、阿里巴巴达摩院免费提供精准语音技术及算力的字幕机顶盒,入驻全国上百个聋人家庭及社区。同时,第三方评测显示,达摩院语音AI对新闻节目识别准确率高达,在同类技术中处于领先水平。阿里巴巴达摩院语音实验室负责人鄢志杰表示,达摩院将持续输出最先进的语音技术帮助障群体消除与外部世界的信息鸿沟,为他们实现无障碍沟通、生活、工作提供长期公益支持。
7月5日消息,2023全球数字经济大会近日在京举办,阿里巴巴达摩院语音实验室负责人鄢志杰、阿里云智能瓴羊区域发展负责人杨霄凡等人出席论坛并发表演讲。在“人工智能高峰论坛”上,阿里巴巴达摩院与北京工业大学计算机学院、北京集智未来人工智能产业创新基地签署合作协议。此外,北京市西城区人民政府与阿里云计算有限公司等单位签订战略合作框架协议。未来西城区将与阿里云在智慧城市、产业升级等多方面展开更深度的合作。
阿里巴巴达摩院1月14日公开一项“语音识别方法、语音识别模型、电子设备和存储介质”专利。
阿里巴巴达摩院12月17日公开一项“语音处理方法、设备及存储介质”专利。
此次展出的饿了么新款智能头盔主打语音交互,基于阿里巴巴达摩院语音识别底层能力,骑手能够像使用Siri一样控制手机APP。