首页 > 专利 > 李建新 > 一种音频信号的传输处理方法专利详情

一种音频信号的传输处理方法   0    0

实质审查 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2021-05-06
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2021-08-20
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2041-05-06
基本信息
有效性 实质审查 专利类型 发明专利
申请号 CN202110490065.9 申请日 2021-05-06
公开/公告号 CN113207058A 公开/公告日 2021-08-03
授权日 预估到期日 2041-05-06
申请年 2021年 公开/公告年 2021年
缴费截止日
分类号 H04R3/00H04R3/04 主分类号 H04R3/00
是否联合申请 独立申请 文献类型号 A
独权数量 1 从权数量 3
权利要求数量 4 非专利引证数量 1
引用专利数量 11 被引证专利数量 0
非专利引证 1、由延军等: "综合海洋战场环境分布交互仿真系统研究", 《系统仿真学报》;
引用专利 JP2014115316A、US9111542B1、US2016086619A1、US2018167747A1、CN108235181A、CN109660911A、US2019341047A1、CN209994549U、WO2020108614A1、CN111462744A、CN111756764A 被引证专利
专利权维持 99 专利申请国编码 CN
专利事件 事务标签 公开、实质审查
申请人信息
申请人 第一申请人
专利权人 李建新 当前专利权人 李建新
发明人 李建新、李三红、李军利 第一发明人 李建新
地址 云南省昆明市官渡区北京路237号 邮编 650000
申请人数量 1 发明人数量 3
申请人所在省 云南省 申请人所在市 云南省昆明市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
厦门原创专利事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
高巍
摘要
本发明公开了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。
  • 摘要附图
    一种音频信号的传输处理方法
  • 说明书附图:图1
    一种音频信号的传输处理方法
  • 说明书附图:图2
    一种音频信号的传输处理方法
  • 说明书附图:图3
    一种音频信号的传输处理方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-08-20 实质审查的生效 IPC(主分类): H04R 3/00 专利申请号: 202110490065.9 申请日: 2021.05.06
2 2021-08-03 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种音频信号的传输处理方法,其特征在于,所述方法包括:
若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。

2.如权利要求1所述的方法,其特征在于,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。

3.如权利要求1所述的方法,其特征在于,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。

4.如权利要求1所述的方法,其特征在于,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
说明书

技术领域

[0001] 本公开涉及音频信号传输技术领域,特别涉及一种音频信号的传输处理方法。

背景技术

[0002] 随着科技的发展,智能电子设备的功能越来越完善。现目前,绝大部分的智能电子设备支持音频传输,从而方便日常办公和业务生活。在通信网络不断优化的信息时代,许多数据信息需要通过通信网络进行远程传输,这样可能导致音频信号在传输过程中出现一些问题。比如,在采用相关技术对音频信号进行传输时,可能出现音频信号的一些显著特征的缺失,从而难以实现无损传输。

发明内容

[0003] 为改善相关技术中存在的技术问题,本公开提供了一种音频信号的传输处理方法。
[0004] 本发明提供了一种音频信号的传输处理方法,所述方法包括:
[0005] 若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
[0006] 基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
[0007] 基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0008] 在一种可替换的实施方式中,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
[0009] 基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0010] 确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
[0011] 将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0012] 在一种可替换的实施方式中,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
[0013] 对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
[0014] 基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
[0015] 所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0016] 所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
[0017] 所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0018] 在一种可替换的实施方式中,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
[0019] 获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0020] 基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
[0021] 基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
[0022] 所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
[0023] 基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
[0024] 基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0025] 所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
[0026] 获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
[0027] 基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0028] 所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
[0029] 基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0030] 本发明还提供了一种音频信号的传输处理装置,所述装置包括:
[0031] 状态信息确定模块,用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
[0032] 状态模型更新模块,用于基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
[0033] 音频信号特征确定模块,用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0034] 在一种可替换的实施方式中,所述状态信息确定模块,包括:
[0035] 基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0036] 确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
[0037] 将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0038] 在一种可替换的实施方式中,所述状态模型更新模块,包括:
[0039] 对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
[0040] 基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
[0041] 所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0042] 所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
[0043] 所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0044] 在一种可替换的实施方式中,所述音频信号特征确定模块,包括:
[0045] 获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0046] 基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
[0047] 基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
[0048] 所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
[0049] 基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
[0050] 基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0051] 所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
[0052] 获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
[0053] 基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0054] 所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
[0055] 基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0056] 本发明还提供了一种计算机设备,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现上述所述的方法。
[0057] 本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述所述的方法。
[0058] 本公开的实施例提供的技术方案可以包括以下有益效果。
[0059] 本公开提供了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步基于第二音频交互状态特征和第二混响音频交互状态模型,确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。

实施方案

[0064] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0065] 请结合参阅图1,提供了一种音频信号的传输处理方法的流程示意图,具体执行以下步骤S110‑步骤S130所描述的内容。
[0066] 步骤S110,若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息。
[0067] 在本实施例中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征。
[0068] 可以理解,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,可以具体包括:基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0069] 其中,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还可以具体包括:获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型。
[0070] 其中,所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还可以具体包括:基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0071] 步骤S120,基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态。
[0072] 进一步地,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,具体包括:对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;在上述实施例的基础上,所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0073] 步骤S130,基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0074] 其中,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,还可以具体包括:获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。进一步地,所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0075] 在执行上述步骤S110‑步骤S130所描述的方法时可以达到如下有益技术效果:能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步基于第二音频交互状态特征和第二混响音频交互状态模型,确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。
[0076] 在上述基础上,请结合图2,本发明还提供了一种音频信号的传输处理装置200,应用于与用户终端以及多个医疗终端通信的数据传输服务器,所述装置包括以下功能模块。
[0077] 状态信息确定模块210,用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
[0078] 状态模型更新模块220,用于基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
[0079] 音频信号特征确定模块230,用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0080] 其中,所述状态信息确定模块210,包括:
[0081] 基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0082] 确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
[0083] 将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0084] 其中,所述状态模型更新模块220,包括:
[0085] 对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
[0086] 基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
[0087] 所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0088] 所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
[0089] 所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0090] 其中,所述音频信号特征确定模块230,包括:
[0091] 获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0092] 基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
[0093] 基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
[0094] 所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
[0095] 基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
[0096] 基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0097] 所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
[0098] 获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
[0099] 基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0100] 所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
[0101] 基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0102] 在上述基础上,请结合参阅图3,提供了一种计算机设备110,包括处理器111以及与所述处理器111连接的存储器112和总线113;其中,所述处理器111和所述存储器112通过所述总线113完成相互间的通信;所述处理器111用于调用所述存储器112中的程序指令,以执行上述的方法。
[0103] 进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
[0104] 应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

附图说明

[0060] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
[0061] 图1是本发明实施例提供的一种音频信号的传输处理方法的流程图。
[0062] 图2是本发明实施例提供的一种音频信号的传输处理装置框图。
[0063] 图3是本发明实施例提供的一种计算机设备的硬件结构示意图。
专利联系人(活跃度排行)
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号