[0009] 针对现有技术中语音识别存在的识别率不高的问题,本发明提供一种基于声纹识别的来电身份识别系统及其识别方法,在通信设备中植入声纹识别模块用来判别联系人身份。
[0010] 本发明的技术方案如下:
[0011] 一种基于声纹识别的来电身份识别系统,包括声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元;所述声纹获取单元、声纹数据存储单元、声纹识别单元分别与声纹处理器单元相连,声纹获取单元向声纹处理器单元单向通信,声纹识别单元向声纹处理器单元单向通信,声纹数据存储单元和声纹处理器单元相互通信,声纹识别单元向声纹数据存储单元单向通信。
[0012] 一种基于声纹识别的来电身份识别系统的识别方法,包括如下步骤:
[0013] (1)声纹特征提取:
[0014] 当有未知声纹源进入声纹获取单元后,自动触发保存提示功能,提示使用者保存该声纹数据以便下一次通话时自动识别该联系人;使用者确认保存该声纹数据后,声纹处理器单元将形成由所有联系人的声纹模型构成的声纹模型库,所述声纹模型是从联系人的声音中提取声学特征构建而成,声纹模型中的声学特征和身份信息相互关联绑定在一起;
[0015] (2)声纹特征通讯录的存储:
[0016] 将所述声纹模型库存储于声纹数据存储单元中,所述声纹数据存储单元设置于手机内存中,或者设置于外部存储卡中;
[0017] (3)模式识别:
[0018] 当已保存的联系人来电时,声纹识别单元提取来电者的声学特征形成待识别的特征矢量序列并通过模式匹配来判别联系人身份;当新联系人与机主通话时,声纹识别单元无法识别,但仍提取来电人的声学特征,通话结束后自动提醒机主是否将来电者存为新联系人。
[0019] 进一步,所述提取声学特征构和存储声纹特征的具体过程为:
[0020] (1)当来电通话开始时,启动声纹获取模块,获取来电者的声音片段并存储;
[0021] (2)通过分析声音片段提取来电者的声学特征;
[0022] (3)模式匹配,将已获得的声纹特征与声纹模型库中已存储的声纹模型进行比对;
[0023] (4)判定,将得分与预先设定的得分判定阈值进行比较;
[0024] (5)输出,当匹配成功后,输出匹配结果,即识别到的联系人相关信息;当匹配不成功时,通话结束后输出提示信息提示用户存储该声纹信息以及相关电话号码姓名信息,以便下次通话时实时识别;
[0025] (6)存储,当通话结束后,使用者采纳提示建议,系统将该声纹信息及其相关身份信息存入存储单元,并加入声纹模型库;反之,不存储。
[0026] 进一步,步骤(1)中,声纹获取单元获取来电者通话的一段声音片段,存入声纹数据存储单元中分配的一块临时存储区中,以备对其进行声学特征分析;当分析结束后,声纹特征被保留,其余被声音数据自动删除。
[0027] 进一步,步骤(2)中,提取声音片段中能反映通话者的可分性强、稳定性高的声纹特征,并将之存放在临时存储区。
[0028] 进一步,步骤(3)中,将待识别的特征矢量序列与模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分,也即对数似然得分或似然得分或得分。
[0029] 进一步,步骤(4)中,当得分大于或等于阈值时判定为匹配成功;当得分小于阈值时判定为匹配失败。
[0030] 进一步,步骤(5)中,输出方式为语音提示、震动、屏幕显示,或三种方式的两两组合、又或以上三种方式组合在一起。
[0031] 本发明的有益效果是:
[0032] 本发明一种基于声纹识别的来电身份识别系统建立了一个声纹模型库(相当于我们现在的通讯录),通讯录是以声学特征为标识并与联系人身份信息绑定形成声纹模型,在通话中将通话人的声学特征与预先存入的已知联系人的声纹模型逐一作对比来判别通话人的身份信息。当无法通过电话号码判别来电身份时,可以通过声学特征匹配来判别来电者的身份。当通信设备中存储的联系人换了号码或用未知电话给机主通话时,机主仍能及时判断通话人的身份。