首页 > 专利 > 江苏大学 > 一种基于声纹识别的来电身份识别系统及其识别方法专利详情

一种基于声纹识别的来电身份识别系统及其识别方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2013-12-13
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2014-04-30
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2017-10-20
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2033-12-13
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201310677837.5 申请日 2013-12-13
公开/公告号 CN103700371B 公开/公告日 2017-10-20
授权日 2017-10-20 预估到期日 2033-12-13
申请年 2013年 公开/公告年 2017年
缴费截止日
分类号 G10L15/28G10L15/06 主分类号 G10L15/28
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 5
权利要求数量 6 非专利引证数量 0
引用专利数量 6 被引证专利数量 0
非专利引证
引用专利 CN101794577A、CN101321387A、CN102724278A、CN102831890A、CN102708867A、JP特开2001-274907A 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 江苏大学 当前专利权人 江苏大学
发明人 马世典、韩牟、赵宏杰、汪少华 第一发明人 马世典
地址 江苏省无锡市学府路301号 邮编
申请人数量 1 发明人数量 4
申请人所在省 江苏省 申请人所在市 江苏省无锡市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
南京知识律师事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
汪旭东
摘要
本发明公开了一种基于声纹识别的来电身份识别系统及其识别方法,该系统包括声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元;所述声纹获取单元、声纹数据存储单元、声纹识别单元分别与声纹处理器单元相连,声纹获取单元向声纹处理器单元单向通信,声纹识别单元向声纹处理器单元单向通信,声纹数据存储单元和声纹处理器单元相互通信,声纹识别单元向声纹数据存储单元单向通信。本发明在通信设备中建立一个声纹模型库,在通话中将通话人的声学特征与预先存入的已知联系人的声纹模型逐一作对比来判别通话人的身份信息。即当某已知联系人使用不同通信设备中未记录号码电话与机主通话时都能通过来电者的声音来辅助判别其身份。
  • 摘要附图
    一种基于声纹识别的来电身份识别系统及其识别方法
  • 说明书附图:图1
    一种基于声纹识别的来电身份识别系统及其识别方法
  • 说明书附图:图2
    一种基于声纹识别的来电身份识别系统及其识别方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2017-10-20 授权
2 2014-04-30 实质审查的生效 IPC(主分类): G10L 15/28 专利申请号: 201310677837.5 申请日: 2013.12.13
3 2014-04-02 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于声纹识别的来电身份识别系统的识别方法,所述系统包括声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元;所述声纹获取单元、声纹数据存储单元、声纹识别单元分别与声纹处理器单元相连,声纹获取单元向声纹处理器单元单向通信,声纹识别单元向声纹处理器单元单向通信,声纹数据存储单元和声纹处理器单元相互通信,声纹识别单元向声纹数据存储单元单向通信;所述方法包括如下步骤:
(1)声纹特征提取:
当有未知声纹源进入声纹获取单元后,自动触发保存提示功能,提示使用者保存该声纹数据以便下一次通话时自动识别该声纹数据对应的联系人;使用者确认保存该声纹数据后,声纹处理器单元将形成由所有联系人的声纹模型构成的声纹模型库,所述声纹模型是从联系人的声音中提取声学特征构建而成,声纹模型中的声学特征和身份信息相互关联绑定在一起;
(2)声纹特征通讯录的存储:
将所述声纹模型库存储于声纹数据存储单元中,所述声纹数据存储单元设置于手机内存中,或者设置于外部存储卡中;
(3)模式识别:
当已保存的联系人来电时,声纹识别单元提取来电者的声学特征形成待识别的特征矢量序列并通过模式匹配来判别联系人身份;当新联系人与机主通话时,声纹识别单元无法识别,但仍提取来电人的声学特征,通话结束后自动提醒机主是否将来电者存为新联系人;
所述提取声学特征构和存储声纹特征的具体过程为:
(1)当来电通话开始时,启动声纹获取模块,获取来电者的声音片段并存储;
(2)通过分析声音片段提取来电者的声学特征;
(3)模式匹配,将已获得的声纹特征与声纹模型库中已存储的声纹模型进行比对;
(4)判定,将得分与预先设定的得分判定阈值进行比较;
(5)输出,当匹配成功后,输出匹配结果,即识别到的联系人相关信息;当匹配不成功时,通话结束后输出提示信息提示用户存储该声纹信息以及相关电话号码姓名信息,以便下次通话时实时识别;
(6)存储,当通话结束后,使用者采纳提示建议,系统将该声纹信息及其相关身份信息存入存储单元,并加入声纹模型库;反之,不存储。

2.根据权利要求1所述的一种基于声纹识别的来电身份识别系统的识别方法,其特征在于,步骤(1)中,声纹获取单元获取来电者通话的一段声音片段,存入声纹数据存储单元中分配的一块临时存储区中,以备对其进行声学特征分析;当分析结束后,声纹特征被保留,其余被声音数据自动删除。

3.根据权利要求1所述的一种基于声纹识别的来电身份识别系统的识别方法,其特征在于,步骤(2)中,提取声音片段中能反映通话者的可分性强、稳定性高的声纹特征,并将之存放在临时存储区。

4.根据权利要求1所述的一种基于声纹识别的来电身份识别系统的识别方法,其特征在于,步骤(3)中,将待识别的特征矢量序列与模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分,也即对数似然得分。

5.根据权利要求1所述的一种基于声纹识别的来电身份识别系统的识别方法,其特征在于,步骤(4)中,当得分大于或等于阈值时判定为匹配成功;当得分小于阈值时判定为匹配失败。

6.根据权利要求1所述的一种基于声纹识别的来电身份识别系统的识别方法,其特征在于,步骤(5)中,输出方式为语音提示、震动、屏幕显示,或三种方式的两两组合、又或以上三种方式组合在一起。
说明书

技术领域

[0001] 本发明涉及声纹识别技术,即根据说话人的发音特征,自动识别说话人身份的一种生物识别方法。

背景技术

[0002] 所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。
[0003] 声纹识别的一般过程:
[0004] (1)从待识别人的声音中提取声学特征形成待识别的特征矢量序列;
[0005] (2)将待识别的特征矢量序列与该模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分(也称为对数似然的分,或似然得分,或得分),并进行判决;计算特征矢量序列与说话人模型匹配分数;
[0006] (3)根据声纹的识别方法的类型(闭集声纹鉴别、开集声纹鉴别和声纹确认),在需要的时候进行拒识判决,从而得出结果。
[0007] 声纹识别可以说有两个关键问题,一是特征提取,二是模式匹配(模式识别)。特征提取的任务是提取并选择声音片段中具有可分性强、稳定性高等特性的声学或语言特征。与语音识别不同,声纹识别的特征必须是“个性化”特征,而说话人识别的特征对说话者本人来讲必须是“共性特征”。
[0008] 现有的语音识别装置当通信设备中存储联系人换了号码或用未知电话给机主通话时,机主不能及时判断通话人的身份。

发明内容

[0009] 针对现有技术中语音识别存在的识别率不高的问题,本发明提供一种基于声纹识别的来电身份识别系统及其识别方法,在通信设备中植入声纹识别模块用来判别联系人身份。
[0010] 本发明的技术方案如下:
[0011] 一种基于声纹识别的来电身份识别系统,包括声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元;所述声纹获取单元、声纹数据存储单元、声纹识别单元分别与声纹处理器单元相连,声纹获取单元向声纹处理器单元单向通信,声纹识别单元向声纹处理器单元单向通信,声纹数据存储单元和声纹处理器单元相互通信,声纹识别单元向声纹数据存储单元单向通信。
[0012] 一种基于声纹识别的来电身份识别系统的识别方法,包括如下步骤:
[0013] (1)声纹特征提取:
[0014] 当有未知声纹源进入声纹获取单元后,自动触发保存提示功能,提示使用者保存该声纹数据以便下一次通话时自动识别该联系人;使用者确认保存该声纹数据后,声纹处理器单元将形成由所有联系人的声纹模型构成的声纹模型库,所述声纹模型是从联系人的声音中提取声学特征构建而成,声纹模型中的声学特征和身份信息相互关联绑定在一起;
[0015] (2)声纹特征通讯录的存储:
[0016] 将所述声纹模型库存储于声纹数据存储单元中,所述声纹数据存储单元设置于手机内存中,或者设置于外部存储卡中;
[0017] (3)模式识别:
[0018] 当已保存的联系人来电时,声纹识别单元提取来电者的声学特征形成待识别的特征矢量序列并通过模式匹配来判别联系人身份;当新联系人与机主通话时,声纹识别单元无法识别,但仍提取来电人的声学特征,通话结束后自动提醒机主是否将来电者存为新联系人。
[0019] 进一步,所述提取声学特征构和存储声纹特征的具体过程为:
[0020] (1)当来电通话开始时,启动声纹获取模块,获取来电者的声音片段并存储;
[0021] (2)通过分析声音片段提取来电者的声学特征;
[0022] (3)模式匹配,将已获得的声纹特征与声纹模型库中已存储的声纹模型进行比对;
[0023] (4)判定,将得分与预先设定的得分判定阈值进行比较;
[0024] (5)输出,当匹配成功后,输出匹配结果,即识别到的联系人相关信息;当匹配不成功时,通话结束后输出提示信息提示用户存储该声纹信息以及相关电话号码姓名信息,以便下次通话时实时识别;
[0025] (6)存储,当通话结束后,使用者采纳提示建议,系统将该声纹信息及其相关身份信息存入存储单元,并加入声纹模型库;反之,不存储。
[0026] 进一步,步骤(1)中,声纹获取单元获取来电者通话的一段声音片段,存入声纹数据存储单元中分配的一块临时存储区中,以备对其进行声学特征分析;当分析结束后,声纹特征被保留,其余被声音数据自动删除。
[0027] 进一步,步骤(2)中,提取声音片段中能反映通话者的可分性强、稳定性高的声纹特征,并将之存放在临时存储区。
[0028] 进一步,步骤(3)中,将待识别的特征矢量序列与模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分,也即对数似然得分或似然得分或得分。
[0029] 进一步,步骤(4)中,当得分大于或等于阈值时判定为匹配成功;当得分小于阈值时判定为匹配失败。
[0030] 进一步,步骤(5)中,输出方式为语音提示、震动、屏幕显示,或三种方式的两两组合、又或以上三种方式组合在一起。
[0031] 本发明的有益效果是:
[0032] 本发明一种基于声纹识别的来电身份识别系统建立了一个声纹模型库(相当于我们现在的通讯录),通讯录是以声学特征为标识并与联系人身份信息绑定形成声纹模型,在通话中将通话人的声学特征与预先存入的已知联系人的声纹模型逐一作对比来判别通话人的身份信息。当无法通过电话号码判别来电身份时,可以通过声学特征匹配来判别来电者的身份。当通信设备中存储的联系人换了号码或用未知电话给机主通话时,机主仍能及时判断通话人的身份。

实施方案

[0035] 以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。本例以手机为例对本发明具体实施方式进行说明。
[0036] Step1 系统建立。如图1所示,基于声纹识别的来电身份识别系统包含如下部分:声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元。本发明包含的功能主要有以下方面:
[0037] 声纹特征提取:
[0038] 当有未知声纹源进入声纹采集单元后,自动触发保存提示功能,提示使用者保存该声纹数据以便下一次通话时自动识别该联系人。使用者确认保存该声纹数据后,将会形成一个特殊的通讯录,即声纹模型库:从联系人的声音中提取声学特征构建声纹模型,所有联系人的声纹模型构成声纹模型库。声纹模型中会有联系人的声学特征及其身份信息,身份信息包括电话号码、姓名等,声学特征和身份信息是相互关联绑定在一起的。
[0039] 声纹特征通讯录的存储:
[0040] 声纹模型库可以建在手机内存中,也可以建在外部存储卡中,便于未知号码来电时,通话开始后自动调用声纹数据,并开展比对确认通话者身份。
[0041] 模式匹配(模式识别):
[0042] 与一般手机通讯录不同的是,一般都是以电话号码为标识并与联系人身份信息绑定,通过电话号码匹配来识别来电者的身份;而此通讯录是以声学特征为标识并与联系人身份信息绑定形成声纹模型,当无法通过电话号码判别来电身份时,可以通过声学特征匹配来判别来电者的身份;
[0043] 当已保存的联系人来电时,声纹识别模块将提取来电者的声学特征形成待识别的特征矢量序列并通过模式匹配来判别联系人身份;当新联系人与机主通话时,声纹识别模块无法识别,并会提取来电人的声学特征,通话结束后便会自动提醒机主是否要将刚才的通话人存为新联系人。
[0044] Step2 当来电通话开始时,启动声纹模块,获取来电者的声音片段;
[0045] Step21 获取来电者通话的一段声音片段,存入声纹存储单元中分配的一块临时存储区中,以备对其进行声学特征分析。当分析结束后,声纹特征被保留,其余被声音数据自动删除。
[0046] Step3 通过分析声音片段提取来电者的声学特征;
[0047] Step31手机中植入的声纹识别模块会对获取的声音片段进行声学特征提取。提取声音片段中能反映该通话者的可分性强、稳定性高的声纹特征,并将之存放在临时存储区。
[0048] Step4模式匹配;将已获得的声纹特征与声纹模型库中已存储的声纹模型进行比对;
[0049] Step41 将待识别的特征矢量序列与该模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分,也称为对数似然得分或似然得分或得分;
[0050] Step5 判定,将得分与预先设定的得分判定阈值进行比较;
[0051] Step51当得分大于或等于阈值时判定为匹配成功;
[0052] Step52当得分小于阈值时判定为匹配失败;
[0053] Step6 输出,当匹配成功后,输出匹配结果,即识别到的联系人相关信息;当匹配不成功时,通话结束后输出提示信息提示用户存储该声纹信息以及相关电话号码姓名等信息,以便下次通话时实时识别。
[0054] Step61 输出方式有多种,可以是语音提示、震动、屏幕显示、或三者组合。
[0055] Step7 存储,当通话结束后,使用者采纳提示建议,系统将该声纹信息及其相关身份信息存入存储单元,并加入声纹模型库。反之,不存储。

附图说明

[0033] 图1是基于声纹识别的来电身份识别系统的示意图;
[0034] 图2是识别来电者身份的方法流程图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号