[0003] 为改善相关技术中存在的技术问题,本公开提供了一种音频信号的传输处理方法。
[0004] 本发明提供了一种音频信号的传输处理方法,所述方法包括:
[0005] 若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
[0006] 基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
[0007] 基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0008] 在一种可替换的实施方式中,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
[0009] 基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0010] 确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
[0011] 将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0012] 在一种可替换的实施方式中,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
[0013] 对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
[0014] 基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
[0015] 所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0016] 所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
[0017] 所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0018] 在一种可替换的实施方式中,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
[0019] 获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0020] 基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
[0021] 基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
[0022] 所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
[0023] 基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
[0024] 基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0025] 所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
[0026] 获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
[0027] 基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0028] 所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
[0029] 基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0030] 本发明还提供了一种音频信号的传输处理装置,所述装置包括:
[0031] 状态信息确定模块,用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
[0032] 状态模型更新模块,用于基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
[0033] 音频信号特征确定模块,用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0034] 在一种可替换的实施方式中,所述状态信息确定模块,包括:
[0035] 基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0036] 确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
[0037] 将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
[0038] 在一种可替换的实施方式中,所述状态模型更新模块,包括:
[0039] 对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
[0040] 基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
[0041] 所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
[0042] 所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
[0043] 所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
[0044] 在一种可替换的实施方式中,所述音频信号特征确定模块,包括:
[0045] 获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0046] 基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
[0047] 基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
[0048] 所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
[0049] 基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
[0050] 基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
[0051] 所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
[0052] 获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
[0053] 基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
[0054] 所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
[0055] 基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
[0056] 本发明还提供了一种计算机设备,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现上述所述的方法。
[0057] 本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述所述的方法。
[0058] 本公开的实施例提供的技术方案可以包括以下有益效果。
[0059] 本公开提供了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步基于第二音频交互状态特征和第二混响音频交互状态模型,确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。