小米声音识别算法性能新突破:国际排名第一

日期:2023-09-13 来源:手游巴士 作者:快科技

9月13日消息,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。

以公开数据集AudioSet-2M的音频数据作为训练集的音频标记模型,首次突破50 mAP的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一。

小米声音识别算法性能新突破:国际排名第一

据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。

此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。

小米声音识别算法性能新突破:国际排名第一

这项技术的突破意味着小米的声音识别算法能力再次精进,小米的众多智能硬件设备应用此项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。

小米声音识别算法性能新突破:国际排名第一

小米此次精进后的声音识别算法,具有极高的应用价值。它能够广泛应用于小米的智能设备中,大幅提升用户的智能生活体验。具体来说,音频标记算法能够识别广泛的环境声音,比如婴儿的啼哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让环境中的声音以文字等模态表达。

此外,这项算法技术还广泛应用于小米机器人的研发中,大幅提升了机器人的感知能力。人形机器人CyberOne可以识别85种环境声音,能够通过听觉感知6类、45种人类情绪。而小米第二代仿生四足机器人CyberDog 2则可以识别38种环境声音,实现更强大的动态响应能力。

小米声音识别算法性能新突破:国际排名第一

上一篇:一键清除农残、细菌!小米米家果蔬清洗机开启众筹:449元

下一篇:比5G强10倍!华为率先完成5G-A全部功能测试:下行万兆、上行千兆

相关推荐

憋尿睡觉危害有多大:严重可导致尿路感染

9月13日消息,今日“憋尿睡觉危害有多大”的词条登上热搜,引发广大网友的讨论。 所谓“憋尿”,就是膀胱中蓄存的尿液超过了“膀胱生理性容量”,却

开云电竞大平台报道:剑啸九州之炫酷可爱的坐骑

《剑啸九州》新服【落霞蝶舞】重磅来袭!不少玩家的战力都提升得飞快~在提升战力的同时,《剑啸九州》游戏中也有许多炫酷可爱的坐骑等着玩家探索,今天就来带着大家一起看看!

开云电竞大平台报道:剑侠世界打造情义江湖美学

西山居剑侠情缘26年传承之作《剑侠世界:起源》手游由剑侠金牌美术团队原班人马打造,继承了剑侠世界端游极具特色的2D美术风格,在“纯武侠、真江湖”的理念指导下,用

开云电竞大平台报道:风云 青铜秘境新版震撼上线

踏入《青铜秘境》,您将穿越于古老而神秘的场景之中,迎接一场精彩纷呈的冒险之旅。以呈现出独特的风貌与挑战,让勇士们能够在游戏中体验到前所未有的刺激与乐趣。 我们引入了全

开云电竞大平台报道:方舟生存进化奇翼龙图谱公开

在《方舟:生存进化》次世代版本新生物投票中,发现于中国河北的奇翼龙成为了将在“畸变”地图登场的新生物。 奇翼龙是一种生活在侏罗纪晚期的杂食性恐龙,在《方舟:

查看更多