[0003] 本发明的目的在于提供一种基于大数据的下载推荐系统及方法,以解决上述背景技术中提出的问题。
[0004] 为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的下载推荐系统,所述推荐系统包括聊天输入采集模块、标识识别模块、文字监测模块和分析推荐模块,所述聊天输入采集模块用于获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字,所述标识识别模块获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,在聊天标识为第一标识时,令文字监测模块工作,在聊天标识为第二标识时,令文字监测模块停止工作;所述文字监测模块将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,其中,用户表情包库为用于存储用户收藏的表情包,在用户表情包库里不存在表情包与输入文字相匹配时,令分析推荐模块采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包。。
[0005] 进一步的,所述推荐系统还包括标识设置模块,所述标识设置模块包括第一聊天记录获取模块、发送信息采集模块、标识综合值计算模块和标识综合值比较模块,所述第一聊天记录获取模块用于获取用户与聊天对象在预设第一时间段内的聊天记录,所述发送信息采集模块用于统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数、获取相邻两个表情包之间间隔的发送信息的条数以及相邻两个表情包之间间隔的发送信息的条数,所述标识综合值计算模块根据发送信息采集模块采集到的数据计算聊天对象的标识综合值,所述标识综合值比较模块将标识综合值与标识综合阈值进行比较,在标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,在标识综合值大于等于标识综合阈值时,设置该聊天对象的聊天标识为第二标识。
[0006] 进一步的,所述分析推荐模块包括主体对象选取模块、候选表情包选取模块、待推荐表情包选取模块和识别下载模块,所述主体对象选取模块采集用户最近一段时间所使用的表情包,并从中选取待推荐表情包的主体对象,所述候选表情包选取模块在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包,所述待推荐表情包选取模块包括文字高度宽度采集模块、文字个数采集模块、综合参照值计算模块和综合参照值排序模块,所述文字高度宽度采集模块采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0,所述文字个数采集模块统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0,所述综合参照值计算模块根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx,所述综合参照值排序模块将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包,所述识别下载模块获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库。
[0007] 进一步的,所述主体对象选取模块包括参考表情包选取模块、相似度比较模块和优选表情包选取模块,所述参考表情包选取模块采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,所述相似度比较模块获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,在相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,所述优选表情包选取模块统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象。
[0008] 一种基于大数据的下载推荐方法,所述下载推荐方法包括以下步骤:
[0009] 步骤S1:获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字;
[0010] 步骤S2:获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,当聊天标识为第一标识时,开启输入文字监测,转步骤S3;当聊天标识为第二标识时,关闭输入文字监测;
[0011] 步骤S3:将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,否则,转步骤S4,其中,用户表情包库用于存储用户收藏的表情包;
[0012] 步骤S4:采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包。
[0013] 进一步的,所述预设的聊天对象的聊天标识包括:
[0014] 采集用户与聊天对象在预设第一时间段内的聊天记录,统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数p,
[0015] 依次分别获取相邻两个表情包之间间隔的发送信息的条数N1、N2、…、Np‑1,对各个数据进行归一化处理得到处理值Qi=(Ni‑Nmin)/(Nmax‑Nmin),其中,Ni表示第i个表情包与其相邻的第i+1个表情包之间间隔的发送信息的条数,Qi表示第i个条数的归一化处理得到的处理值,计算条数N1、N2、…、Np‑1所对应的处理值的平均值Qx,Nmin为条数N1、N2、…、Np‑1中的最小值,Nmax为条数N1、N2、…、Np‑1中的最大值,
[0016] 那么标识综合值U=0.68*(1‑p/M)+0.32*Qx,
[0017] 如果标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,否则,设置该聊天对象的聊天标识为第二标识。
[0018] 进一步的,所述步骤S4进一步包括:
[0019] 采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,分别获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,当相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象,[0020] 在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包;通过表情包的主体对象进行筛选,一方面能够达到减小表情包比较选取范围,提高表情包推荐效率的技术效果,另一方面能到达到提高推荐的表情包的合理性的技术效果;
[0021] 采集优选表情包的信息,并据此从候选表情包中选出待推荐表情包,将待推荐表情包推送给用户。
[0022] 进一步的,所述据此从候选表情包中选出待推荐表情包包括以下:
[0023] 分别采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0;
[0024] 分别统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0,
[0025] 根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx,
[0026] 将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包。
[0027] 进一步的,所述计算各个候选表情包的综合参照值Wx包括:
[0028] Wx=|Fx‑F0|/F0+|Gx‑G0|/G0,其中,Fx为候选表情包的文字参照值。
[0029] 进一步的,所述下载推荐方法还包括:
[0030] 获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库,从而达到了对用户表情包库动态调整的技术效果。
[0031] 与现有技术相比,本发明所达到的有益效果是:本发明通过采集用户与聊天对象的历史聊天记录并据此判断是否要为用户推送表情包,在用户表情包数据库没有相应的表情包时,根据用户历史所使用的表情包的特征,为用户推荐表情包,在用户选取推荐的表情包,下载相应的表情包,丰富了用户表情包库。