[0059] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0060] 请参阅图1所示,本发明的第一方面提供一种短视频分析处理方法,包括如下步骤:
[0061] S1、视频帧图像获取:将短视频平台中待上传短视频记为目标短视频,并将目标短视频按照设定的视频帧划分方式进行视频划分,获取目标短视频中各视频帧图像。
[0062] S2、视频帧图像组成要素识别:对目标短视频中各视频帧图像进行组成要素识别,分析目标短视频中各视频帧图像内各组成要素对应的属性类型。
[0063] 在上述实施例的基础上,所述步骤S2中对应的详细具体步骤如下:
[0064] 将目标短视频中各视频帧图像进行图像处理,获得处理后的目标短视频中各视频帧图像;
[0065] 对处理后的目标短视频中各视频帧图像进行AI图片组成要素识别,获取目标短视频中各视频帧图像对应的各组成要素;
[0066] 提取短视频平台数据库中存储的各标准组成要素对应的属性类型,对比筛选目标短视频中各视频帧图像内各组成要素对应的属性类型。
[0067] 作为本发明的一个具体实施例,上述中将目标短视频中各视频帧图像进行图像处理,包括:
[0068] 将目标短视频中各视频帧图像进行几何归一化处理,变换为固定标准形式的各视频帧图像,同时强化变换后的各视频帧图像的高频分量,得到目标短视频中各视频帧强化图像,并对目标短视频中各视频帧强化图像分别进行滤波降噪处理和增强处理,得到处理后的目标短视频中各视频帧图像。
[0069] S3、视频帧图像组成要素处理分析:根据目标短视频中各视频帧图像内各组成要素对应的属性类型,进行对应属性类型的处理分析。
[0070] 在上述实施例的基础上,所述步骤S3中对应的具体步骤包括:
[0071] 当目标短视频中某视频帧图像内某组成要素对应的属性类型为物品属性类型时,则获取目标短视频中该视频帧图像内该物品组成要素对应的物品图片,同时提取短视频平台数据库中各预设非法物品的标准图片,将目标短视频中该视频帧图像内该物品组成要素对应的物品图片与各预设非法物品的标准图片进行对比,得到目标短视频中该视频帧图像内该物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度,并统计目标短视频中各视频帧图像内各物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度;
[0072] 当目标短视频中某视频帧图像内某组成要素对应的属性类型为人物属性类型时,则获取目标短视频中该视频帧图像内该人物组成要素对应的人物行为动作图片,同时提取短视频平台数据库中各预设不雅行为动作的标准图片,将目标短视频中该视频帧图像内该人物组成要素对应的人物行为动作图片与各预设不雅行为动作的标准图片进行对比,得到目标短视频中该视频帧图像内该人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度,并统计目标短视频中各视频帧图像内各人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度。
[0073] S4、视频帧图像健康检测结果统计:根据目标短视频中各视频帧图像的处理分析数据,分析统计目标短视频中各视频帧图像对应的健康检测结果。
[0074] 在上述实施例的基础上,所述步骤S4中对应的具体详细步骤包括:
[0075] S41、提取目标短视频中各视频帧图像内各物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度,并分别和预设的各相似度等级对应的相似度阈值进行对比,统计目标短视频中各视频帧图像内各物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度等级;
[0076] S42、根据目标短视频中各视频帧图像内各物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度等级,筛选目标短视频中各视频帧图像内各物品组成要素对应的健康检测结果;
[0077] 作为本发明的一个具体实施例,上述步骤S42中具体详细筛选步骤包括:
[0078] 若目标短视频中某视频帧图像内某物品组成要素对应物品图片与各预设非法物品对应标准图片的相似度等级均为第一相似度等级,则目标短视频中该视频帧图像内该物品组成要素对应的健康检测结果为合格健康检测结果;
[0079] 若目标短视频中某视频帧图像内某物品组成要素对应物品图片与某预设非法物品对应标准图片的相似度等级为第三相似度等级,则目标短视频中该视频帧图像内该物品组成要素对应的健康检测结果为不合格健康检测结果;
[0080] 除此之外,则目标短视频中该视频帧图像内该物品组成要素对应的健康检测结果为未确定健康检测结果。
[0081] S43、提取目标短视频中各视频帧图像内各人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度,并分别和预设的各相似度等级对应的相似度阈值进行对比,统计目标短视频中各视频帧图像内各人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度等级;
[0082] S44、根据目标短视频中各视频帧图像内各人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度等级,筛选目标短视频中各视频帧图像内各人物组成要素对应的健康检测结果;
[0083] 作为本发明的一个具体实施例,上述步骤S44中具体详细筛选步骤包括:
[0084] 若目标短视频中某视频帧图像内某人物组成要素对应人物行为动作图片与各预设不雅行为动作对应标准图片的相似度等级均为第一相似度等级,则目标短视频中该视频帧图像内该人物组成要素对应的健康检测结果为合格健康检测结果;
[0085] 若目标短视频中某视频帧图像内某人物组成要素对应人物行为动作图片与某预设不雅行为动作对应标准图片的相似度等级为第三相似度等级,则目标短视频中该视频帧图像内该人物组成要素对应的健康检测结果为不合格健康检测结果;
[0086] 除此之外,则目标短视频中该视频帧图像内该人物组成要素对应的健康检测结果为未确定健康检测结果。
[0087] S45、根据目标短视频中各视频帧图像内各物品组成要素和各人物组成要素对应的健康检测结果,分析统计目标短视频中各视频帧图像对应的健康检测结果。
[0088] 作为本发明的一个具体实施例,上述步骤S45中具体详细分析步骤包括:
[0089] 若目标短视频中某视频帧图像内各物品组成要素和各人物组成要素对应的健康检测结果均为合格健康检测结果,则目标短视频中该视频帧图像对应的健康检测结果为合格健康检测结果;
[0090] 若目标短视频中某视频帧图像内某物品组成要素或某人物组成要素对应的健康检测结果为不合格健康检测结果,则目标短视频中该视频帧图像对应的健康检测结果为不合格健康检测结果;
[0091] 除此之外,则目标短视频中该视频帧图像对应的健康检测结果为未确定健康检测结果。
[0092] 需要说明的是,上述中各相似度等级分别包括第一相似度等级、第二相似度等级和第三相似度等级,其中第一相似度等级对应的相似度阈值为0≤θ<θ1′,第二相似度等级对应的相似度阈值为θ1′≤θ<θ2′,第三相似度等级对应的相似度阈值为θ2′≤θ≤100%,且θ1′<θ2′。
[0093] S5、健康检测结果分析处理:根据目标短视频中各视频帧图像对应的健康检测结果,进行对应的分析处理。
[0094] 在上述实施例的基础上,所述步骤S5中对应的详细分析处理步骤包括:
[0095] 当目标短视频中某视频帧图像为不合格健康检测结果时,表明其目标短视频未通过初审,则禁止其目标短视频上传至短视频平台;
[0096] 当目标短视频中某视频帧图像为未确定健康检测结果时,则通过短视频平台工作人员进行人工审核,并根据人工审核结果进行对应的处理;
[0097] 当目标短视频中各视频帧图像均为合格健康检测结果时,表明其目标短视频通过初审,则发出语音识别指令。
[0098] 作为本发明的一个具体实施例,上述中根据人工审核结果进行对应的处理,包括:
[0099] 若目标短视频通过人工审核,则其目标短视频通过初审,并发出语音识别指令,若目标短视频未通过人工审核,则禁止其目标短视频上传至短视频平台。
[0100] 在本实施例中,本发明通过获取目标短视频中各视频帧图像,对目标短视频中各视频帧图像进行组成要素识别,分析目标短视频中各视频帧图像内各组成要素对应的属性类型,并进行对应属性类型的处理分析,得到目标短视频中各视频帧图像对应的健康检测结果,并进行对应的分析处理,从而实现对短视频进行初步审核,进一步减少短视频的审核时间,在极大程度上提高短视频平台的短视频审核效率,进而确保用户上传的短视频能够及时发布,保证短视频的发布及时性和有效性。
[0101] S6、目标短视频语音内容识别:对目标短视频对应的语音内容进行识别,得到目标短视频对应的语音文字内容,并进行敏感词汇识别统计。
[0102] 在上述实施例的基础上,所述步骤S6中对应的具体详细步骤包括:
[0103] 采用语音识别技术对目标短视频对应的语音内容进行识别,得到目标短视频对应的语音文字内容;
[0104] 提取短视频平台数据库中存储的各预设敏感词汇,将目标短视频对应的语音文字内容与各预设敏感词汇进行对比,统计目标短视频对应的语音文字内容中各预设敏感词汇出现的频次,将目标短视频对应的语音文字内容中各预设敏感词汇出现的频次标记为xi,其中i表示为第i个预设敏感词汇,i=1,2,...,n。
[0105] 作为本发明的一个具体实施例,上述中采用的语音识别技术包括以下步骤:
[0106] h1、对目标短视频对应的语音内容进行滤波、分帧预处理,除去冗余信息;
[0107] h2、提取目标短视频对应语音内容内影响语音识别的关键信息和表达语音含义的特征信息;
[0108] h3、根据目标短视频对应语音内容内特征信息,用最小单元识别字词,并根据目标短视频对应语音内容的语法,按照先后顺序依次识别字词;
[0109] h4、按照语义分析将目标短视频对应语音内容中识别出的字词进行连接,同时根据语句意思调整句子构成,得到目标短视频对应的语音文字内容。
[0110] S7、语音文字内容对比分析:对目标短视频对应的语音文字内容进行分句,得到目标短视频中各句语音文字内容,并分析目标短视频对应语音文字内容的健康度权重指数。
[0111] 在上述实施例的基础上,所述步骤S7中对应的具体详细步骤包括:
[0112] S71、对目标短视频对应的语音文字内容进行分句,得到目标短视频中各句语音文字内容,将目标短视频中各句语音文字内容标记为aj,j表示为第j句语音文字内容,j=1,2,...,m;
[0113] S72、提取短视频平台数据库中存储的各预设禁忌语句对应文字内容和对应健康度影响比例系数,将目标短视频中各句语音文字内容与各预设禁忌语句对应文字内容进行对比,统计目标短视频中各句语音文字内容与各预设禁忌语句对应文字内容的匹配度,筛选目标短视频中各句语音文字内容对应的最高匹配度,将目标短视频中各句语音文字内容对应的最高匹配度标记为δj,并将各句语音文字内容对应最高匹配度的预设禁忌语句记为各句语音文字内容对应目标预设禁忌语句,筛选各句语音文字内容对应目标预设禁忌语句的健康度影响比例系数,记为σj;
[0114] S73、分析目标短视频对应语音文字内容的健康度权重指数α、β分别表示为预设的敏感词汇影响因子、预设的禁忌语句影响因子,γi表示为第i个预设敏感词汇对应的健康度影响比例系数,X允许表示为预设的敏感词汇允许出现频次,m表示为目标短视频对应语音文字内容的分句数目,δ预设表示为预设的匹配度阈值。
[0115] S8、健康度权重指数分析处理:根据目标短视频对应语音文字内容的健康度权重指数,分析目标短视频对应语音文字内容的健康度检测结果,并进行对应的处理。
[0116] 在上述实施例的基础上,所述步骤S8中分析目标短视频对应语音文字内容的健康检测结果,具体分析包括:
[0117] 将目标短视频对应语音文字内容的健康度权重指数与预设的各健康度检测结果对应的标准健康度权重指数范围进行对比,筛选目标短视频对应语音文字内容的健康度检测结果,其中健康度检测结果包括健康度合格、健康度不合格和健康度未确定。
[0118] 作为本发明的一个具体实施例,所述步骤S8中根据目标短视频对应语音文字内容的健康度检测结果进行对应的处理,包括:
[0119] 当目标短视频对应语音文字内容的健康度检测结果为健康度合格时,则将其目标短视频上传至短视频平台;
[0120] 当目标短视频对应语音文字内容的健康度检测结果为健康度不合格时,则禁止其目标短视频上传至短视频平台;
[0121] 当目标短视频对应语音文字内容的健康度检测结果为健康度未确定时,则通过短视频平台工作人员进行人工审核。
[0122] 在本实施例中,本发明通过获取目标短视频对应的语音文字内容,统计目标短视频对应的语音文字内容中各预设敏感词汇出现的频次,并通过分句得到目标短视频中各句语音文字内容,分析目标短视频对应语音文字内容的健康度权重指数,筛选目标短视频对应语音文字内容的健康度检测结果,并进行对应的处理,从而避免审核结果主观性的问题,有效保证健康不合格内容的审核准确性和可靠性,进一步提高短视频平台用户的体验感,增加用户对短视频平台黏度,进而促进短视频平台的发展。
[0123] 第二方面,本发明还提供一种短视频分析处理系统,包括视频帧图像获取模块、视频帧图像组成要素模块、图像组成要素处理分析模块、图像健康检测结果统计模块、健康检测结果分析处理模块、目标短视频语音内容识别模块、语音文字内容对比分析模块、健康度权重指数分析处理模块和短视频平台数据库;
[0124] 所述视频帧图像获取模块用于将短视频平台中待上传短视频记为目标短视频,并将目标短视频按照设定的视频帧划分方式进行视频划分,获取目标短视频中各视频帧图像;
[0125] 所述视频帧图像组成要素模块用于对目标短视频中各视频帧图像进行组成要素识别,分析目标短视频中各视频帧图像内各组成要素对应的属性类型;
[0126] 所述图像组成要素处理分析模块用于根据目标短视频中各视频帧图像内各组成要素对应的属性类型,进行对应属性类型的处理分析;
[0127] 所述图像健康检测结果统计模块用于根据目标短视频中各视频帧图像的处理分析数据,分析统计目标短视频中各视频帧图像对应的健康检测结果;
[0128] 所述健康检测结果分析处理模块用于根据目标短视频中各视频帧图像对应的健康检测结果,进行对应的分析处理;
[0129] 所述目标短视频语音内容识别模块用于对目标短视频对应的语音内容进行识别,得到目标短视频对应的语音文字内容,并进行敏感词汇识别统计;
[0130] 所述语音文字内容对比分析模块用于对目标短视频对应的语音文字内容进行分句,得到目标短视频中各句语音文字内容,并分析目标短视频对应语音文字内容的健康度权重指数;
[0131] 所述健康度权重指数分析处理模块用于根据目标短视频对应语音文字内容的健康度权重指数,分析目标短视频对应语音文字内容的健康度检测结果,并进行对应的处理;
[0132] 所述短视频平台数据库用于存储各标准组成要素对应的属性类型、各预设非法物品的标准图片和各预设不雅行为动作的标准图片,并存储各预设敏感词汇、各预设禁忌语句对应文字内容和各预设禁忌语句对应健康度影响比例系数。
[0133] 第三方面,本发明还提供一种计算机存储介质,包括存储器和处理器;
[0134] 所述存储器用于存储计算机程序;
[0135] 所述处理器用于执行所述存储器中存储的计算机程序;
[0136] 所述计算机程序用于执行本发明所述的一种短视频分析处理方法。
[0137] 以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。