近(jìn)日,阿里(lǐ)巴巴公开一项“语音识(shí)别方法及装置”相关专(zhuān)利,该专利(lì)于2019年7月(yuè)4日申请,2021年1月22日公开,公开号(hào)为CN112259089A。
根据(jù)专利(lì)摘要(yào),本申请实施例提供了一种(zhǒng)语(yǔ)音识别方(fāng)法及装置,涉及人工智能领域。其中,所述方法包括:获(huò)取(qǔ)第(dì)一(yī)音频样(yàng)本的(de)音频数据帧(zhēn)与第(dì)一音频样本对应的文本标注数据的上下文相关(guān)音素的第一强制对齐(qí)结果;基于第一强制对齐结果,确定第一音频(pín)样本(běn)的音频数据帧关(guān)于待训练的唤醒(xǐng)声学模型(xíng)的音素标注(zhù)数据;基于音素标(biāo)注数据,对待(dài)训练的唤(huàn)醒声(shēng)学模型进行训练,其中(zhōng),唤醒声学模型的(de)输出(chū)层中(zhōng)设置有针对唤(huàn)醒(xǐng)词的(de)唤醒(xǐng)词相关(guān)输出(chū)部分和唤(huàn)醒词无关输出部分。
通(tōng)过本(běn)申请实施例,使(shǐ)得训练后(hòu)的唤醒声学模型在(zài)兼顾语(yǔ)音唤醒(xǐng)性能的(de)同时,能够有(yǒu)效降(jiàng)低对设备端的(de)计算资源的使用。
阿里巴(bā)巴的(de)这项专利很(hěn)有(yǒu)可能用在智(zhì)能设备上,如(rú)智能音(yīn)响。2017年7月5日(rì),阿(ā)里巴巴集团阿里云智能事业群推(tuī)出AI智能终端品(pǐn)牌——天猫精灵(líng),让用户以自(zì)然语言对话(huà)的交互方(fāng)式,实现影音娱乐、购物、信(xìn)息(xī)查询、生活服务等功能(néng)操作,成为作为消费者的家庭助手。
去年5月(yuè),在天猫精灵发布会上,提(tí)出了“双(shuāng)百(bǎi)计划”,即将(jiāng)投入 100亿元进(jìn)行生态(tài)建设,与合作伙伴共同推出 100 款千万级智(zhì)能产品(pǐn)。