阿里巴巴联合中科院研发AI“听音识人”

王小孟
2021-03-25 09:36

3月25日消息,阿里巴巴联手中科院,实现AI“听音识人”。通过训练AI模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,AI将为该声音找到“主人”。经验证明,准确率达到90%。在“1对N”的匹配实验中,AI还能对声音归属人脸的“可能性”进行排序。

值得一提的是,在2020云栖大会上,阿里达摩院曾公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。

据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。

彼时,达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用,正全面对外开放。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
5月3日消息,阿里巴巴宣布对北京先声互联科技进行全资收购,先声互联创始人、中科院声学所前研究员付强博士,近日入职阿里达摩院机器智能技术实验室,负责语音交互前端处理技术和方案的研发。
2月1日消息,据36氪报道,阿里巴巴达摩院表示,目前其已设立14个实验室,在AI、量子、芯片、自动驾驶等领域获得60多项世界第一,在国际学术会议和期刊发表论文1000多篇,并先后孵化平头哥和小蛮驴两家技术公司。资料显示,阿里巴巴达摩院阿里在全球多点设立的科研机构,立足基础科学、颠覆性技术和应用技术的研究。
2月8日消息,澎湃新闻编辑从阿里巴巴处获悉,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。阿里方面人士表示:“后续如有更多信息,会第一时间同步。”此前,有媒体报道称,阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。从曝光截图来看,阿里巴巴可能将AI大模型技术与钉钉生产力工具深度结合。
阿里巴巴达摩院(杭州)科技有限公司发生工商变更,注册资本由1000万人民币增至3亿人民币。
阿里巴巴达摩院近日公开一项“人机协同对话交互系统及方法”专利。
阿里巴巴达摩院近日公开一项“机器客服训练系统及其方法、语音回复方法和电子设备”专利。
阿里巴巴达摩院7月1日公开一项“人机对话系统及方法”专利。
阿里巴巴达摩院近日公开一项“模型处理方法、预测方法、装置、设备及存储介质”专利。
阿里巴巴达摩院6月28日公开一项“数据处理方法、装置和电子设备”专利。
阿里巴巴达摩院近日公开一项“预测交通流量的方法、车辆和可读存储介质”专利。