
图源:摄图网
9月13日,小米公司重磅宣布,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。
据介绍,以公开数据集 AudioSet-2M 的音频数据作为训练集的音频标记模型,首次突破 50 mAP 的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一。
小米公司表示:“未来我们将不断探索科技新高度,在手机、音箱、手环、CyberDog 等丰富的设备使用场景中,给用户带来更高效更准确的声音识别体验。”
语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,用户交互体验水平将得到大幅提升,用户认知和习惯得以培养,全球语音识别市场规模将会继续保持稳步扩张态势。
随着技术端的快速发展,语音识别市场得到的快速发展。语音识别准确率得到了极大的提升。

2019年中国语音识别行业市场规模为95.6亿元,语音识别市场规模保持高速增长,2020-2024年复合增长率预计为19.2%。2020年中国语音识别行业市场规模将突破百亿元。

随着语音技术和自然语言理解技术的快速进步,AI语音语义技术已在智能翻译、智能医疗、智能汽车、智能客服、互联网语音审核等多个领域实现场景应用。
前瞻产业研究院预计到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。

AI领域专家吴恩达认为语音识别技术的发展将推动人机交互方式的变革,使得人们可以通过语音与智能设备进行更自然、便捷的交流。
摩根士丹利在研报中预计全球语音识别市场规模将继续增长,并且随着人工智能技术的不断发展,语音识别将在各个行业中得到广泛应用。
前瞻经济学人APP资讯组
精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论