小米自研声音识别算法性能国际排名第一

云合
2023-09-13 11:38

9月13日消息,小米自研声音识别算法近日取得了最新进展,算法模型领先其他机构,性能国际排名第一。

小米是在Google发布的AudioSet音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的ImageNet (注:计算机视觉领域最著名的数据集,由著名学者李飞飞等主持发布),有较高的权威性。

format-jpg

图源:小米公司公众号

Google将AudioSet数据集分为三个子集,前两个子集用于训练,被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。

这项技术的突破意味着小米的声音识别算法能力再次精进,小米的众多智能硬件设备应用此项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。

format-jpg

图源:小米公司公众号

这项算法技术还广泛应用于小米机器人的研发中,大幅提升了机器人的感知能力。小米历时10个月全栈自研的第一代全尺寸人形机器人CyberOne,可以识别85种环境声音,能够通过听觉感知6类、45种人类情绪。而小米第二代仿生四足机器人CyberDog 2则可以识别38种环境声音,实现更强大的动态响应能力。

目前,小米的声学语音团队已将自研声学语音技术全面应用于小米手机、音箱、电视、耳机、手表、机器人等79个品类,共计5000多款智能产品中。而小爱同学的月活跃用户数量则达到了1.15亿,是世界上最忙的语音助手之一。

据悉,小米自2016年组建AI团队以来,人工智能团队经过7年6次扩展,人员规模已达3000多人。同时,小米AI的技术能力目前已经覆盖了视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态等众多方向,并全面赋能了手机、汽车、AIoT、机器人等多个业务板块。今年4月,小米还正式组建了AI大模型团队,全面拥抱大模型,目前陆续有了一些应用尝试。其中第一个应用大模型,就是将智能语音助理小爱同学升级了大模型版本,并开启邀请测试。

format-jpg

图源:小米公司公众号

值得一提的是,9月11日,小米正式成立集团科协暨院士专家工作站。

中国工程院院士丁文华成为小米院士专家工作站的首位进站院士。他指出,在以手机镜头为代表的成像技术领域,小米实现了光学镜头小型化的重大突破,是行业的佼佼者。小米已经牵头成立了智能图像处理北京市工程研究中心,他希望未来能够努力升级为国家工程研究中心。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
9月13日消息,小米声音识别算法近日取得了最新进展,算法模型领先其他机构,性能国际排名第一小米是在Google发布的AudioSet音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的ImageNet,有较高的权威性。
9月1日消息,小米汽车宣布,车外唤醒防御功能正式上线小米SU7。据介绍,基于小米声音大模型,针对车外语音唤醒行为抑制率达99%。
7月11日消息,中国网络安全审查技术与认证中心 近日向小米智能终端可信执行环境操作系统2.0颁发国内首张最高安全认证等级EAL5+证书。通过认证,表明MiTEE OS的信息安全保障能力已达到行业领先水平,体现了小米以用户为中心的发展理念以及引领行业合规稳健发展的使命感。据了解,中国网络安全审查技术与认证中心为国家市场监督管理总局直属正司局级事业单位。
天眼查App显示,近日,上海玄戒技术有限公司发生工商变更,注册资本由15亿人民币增至19.2亿人民币,增幅28%。
12月24日消息,小米将于12月28日召开新品发布会,发布小米首款充电芯片也是小米的第三款芯片——澎湃P1,首次实现120W单电芯充电方案。据悉,小米称这款芯片历经18个月,旗下四大研发中心通力合作,耗资过亿。
5月25日消息,针对哲库关停事件,在小米财报会议上,小米集团总裁卢伟冰表示,小米芯片的投入决心不会动摇,要充分意识到芯片投入的长期性、复杂性,尊重芯片行业的发展规律,做好持久战的准备,做长期奋斗10年、20年的准备;此外,芯片的目的是为了提升终端产品的竞争力、用户体验。
11月27日消息,小米IoT生态伙伴大会近日在北京举办,宣布小米物联网嵌入式操作系统Vela面向全球软硬件开发者正式开源,并面向全球启动合作计划。兆易创新作为首批全球合作伙伴,受邀出席Xiaomi Vela生态合作计划启动仪式,这标志着小米与兆易创新将共同为全球开发者构建科技引领的IoT智能生态。
12月12日消息,小米公司发言人发布澄清声明称:近日,余承东先生无端针对我司“龙骨转轴”技术发布不实言论,与事实严重不符。声明称,无论是设计思路,还是机械结构,小米的龙骨转轴与余承东所宣称的所谓双旋水滴铰链,都完全不同。
12月29日消息,在昨日举办的小米新品发布会上,小米正式发布小米12系列手机,售价3699元起。据官方介绍,小米12 Pro搭载小米充电芯片澎湃P1,可实现大容量单电芯120W安全快充。此外,小米还发布了MIUI 13,小米手表S1,小米真无线降噪耳机3。雷军在个人微博表示,目前小米新品已可在小米商城、京东商城、天猫预定。