[0065] 实施例一
[0066] 如图1所示,本实施例通过大数据预估行车伤亡事故率的方法包括如下步骤:
[0067] A:通过大数据库获取各种不同车辆类型的车辆在各种交通事故中的交通事故发生率,并通过交通事故基于车辆类型权重的数据挖掘计算方法得出各种车辆类型在交通事故中的比值数据;具体地,车辆类型包括车型特征、品牌特征和颜色特征中的任意一种或多种组合,进一步地,交通事故基于车辆类型权重的数据挖掘计算方法为公式①,即:
[0068] An’=1
[0069] =X*(X1*T1+X2*T2+X3*T3+…Xn*Tn)+Y(Y1*B1+Y2*B2+…Yn*Bn)+Z*(Z1*C1+Z2*C2+…Zn*Cn) ①
[0070] 其中,An’为交通事故对于车辆类型时的变量且其变量为1;
[0071] T1、T2、T3…Tn分别为车辆类型中的不同车型特征的权重;
[0072] X1、X2、X3…Xn分别为不同车型特征在交通事故中的交通事故发生率的比值;
[0073] B1、B2…Bn分别为车辆类型中的不同品牌特征的权重;
[0074] Y1、Y2、Y3…Yn分别为不同品牌特征在交通事故中的交通事故发生率的比值;
[0075] C1、C2…Cn分别为车辆类型中的不同颜色特征的权重;
[0076] Z1、Z2、Z3…Zn分别为不同颜色特征在交通事故中的交通事故发生率的比值;
[0077] X、Y、Z分别为车型特征、品牌特征和颜色特征在交通事故中所占的比值;
[0078] 其中,车型特征包括微型车、小型车、紧凑型车、中型车、SUV车型、MPV车型、中大型车、大型车、跑车车型、微面车型、皮卡车型以及电动车车型等车型;
[0079] 品牌特征包括日系车辆、德系车辆、国产车辆、美系车辆、法系车辆以及韩系车辆等品牌;
[0080] 颜色特征包括红色、黑色、黄色、白色、棕色、蓝色、银色、绿色以及灰色等颜色;
[0081] B:通过大数据库获取各种不同用户类型的用户在各种交通事故中的交通事故发生率,并通过交通事故基于用户类型权重的数据挖掘计算方法得出各种用户类型在交通事故中的比值数据;具体地,在步骤B中,用户类型包括年龄特征、性别特征和婚姻特征等特征;进一步地,交通事故基于用户类型权重的数据挖掘计算方法为公式②,即:
[0082] An”=1
[0083] =U*(U1*N1+U2*N2…Un*Nn)+V*(V1*A+V2*B)
[0084] +W*(W1*M1+W2*M2) ②
[0085] 其中,An”为交通事故对于用户类型时的变量且其变量为1;
[0086] N1、N2…Nn分别为用户类型中的不同年龄特征的权重;
[0087] U1、U2…Un分别为不同年龄特征在交通事故中的交通事故发生率的比值;
[0088] A、B分别为用户类型中的不同性别特征的权重;
[0089] V1、V2分别为不同性别特征在交通事故中的交通事故发生率的比值;
[0090] M1、M2分别为用户类型中的不同婚姻特征的权重;
[0091] W1、W2分别为不同婚姻特征在交通事故中的交通事故发生率的比值;
[0092] U、V、W分别为年龄特征、性别特征和婚姻特征在交通事故中所占的比值;
[0093] 其中年龄特征按年龄大小划分年龄段;
[0094] 性别特征为男性或女性;
[0095] 婚姻特征为已婚或未婚;
[0096] C:结合步骤A和B中得到的比值数据并通过事故发生概率算法计算得出不同车辆类型和不同用户类型在交通事故中发生交通事故的概率,获得交通事故易发生人群信息和/或交通事故易发生车辆信息;进一步地,事故发生概率算法为公式③,即:
[0097] An=T*(T1*An’+T2*An”) ③
[0098] 其中,An为不同交通事故对于车辆类型和用户类型发生交通事故的概率;
[0099] T为An交通事故在总交通事故中的事故比率;
[0100] T1、T2分别为车辆类型和用户类型在An交通事故所占比重;
[0101] D:手动监控管理模块4通过步骤C得出的不同车辆类型和不同用户类型在交通事故中发生交通事故的概率获得交通事故易发生人群信息和/或交通事故易发生车辆信息,并对交通事故易发人群和/或交通事故易发生车辆的拥有者进行监控及管理。
[0102] 在步骤A-D中,交通事故包括多车事故、单车事故与单车侧翻等事故。
[0103] 为了方便计算和理解,本实施例抽象出多车事故、单车事故、单车侧翻3类交通事故,分别用变量A1、A2、A3(Accident)来表示;抽象出3类车辆型号,分别用T1、T2和T3(Type)来表示;抽象出2类车辆品牌,分别用变量B1、B2(Brand)来表示;抽象出3类车辆颜色,分别用C1、C2、C3(Color)来表示:
[0104] 车型=Type(T1(small),T2(media),T3(large))
[0105] 品牌=Brand(B1,B2)
[0106] 颜色=Color(C1(Black),C2(White))
[0107] 通过大数据,获取比例,比如我们通过大数据得到如下的数据:
[0108] A1交通事故中车型T1、T2、T3发生的概率分别为10%、30%、60%,即T1:T2:T3=1:3:6。品牌B1、B2发生的概率分别为20%、80%,即B1:B2=1:4。颜色C1、C2发生的概率分别为
45%、55%,即C1:C2=9:11。通过上面的数据可以发现车型、品牌对事故A1发生的影响较大,按照经验值,可以做出这样的分配:(A1)型号:品牌:颜色=5:4:1,这样,我们可以得到A1对于车辆型号的计算公式:
[0109] (如果所有T1、T2、T3、B1、B2、C1和C2等变量都为1)
[0110] A1(车辆型号)=A1’=1
[0111] =0.5*(0.1*T1+0.3*T2+0.6*T3)+0.4(0.2*B1+0.8*B2)+0.1*(0.45*C1+0.55*C2)[0112] 用同样的方法可以得到A2,A3的计算公式:
[0113] (A2)Type:Brand:Color=3:5:2
[0114] T1:T2:T3=3:4:3
[0115] B1:B2=3:7
[0116] C1:C2=4.2:5.8
[0117] A2(车辆型号)=A2’=1
[0118] =0.3*(0.3*T1+0.4*T2+0.3*T3)+0.5(0.3*B1+0.7*B2)+0.2*(0.42*C1+0.58*C2)[0119] (A3)Type:Brand:Color=2:3:5
[0120] T1:T2:T3=1:1:1
[0121] B1:B2=6:4
[0122] C1:C2=7.5:2.5
[0123] A3(车辆型号)=A3’=1
[0124] =0.2*(0.33*T1+0.33*T2+0.34*T3)+0.3(0.6*B1+0.4*B2)+0.5*(0.75*C1+0.25*C2)
[0125] 具体计算中,T1、T2、T3、B1、B2、C1和C2在满足对应特征的时候为1,否则为0。
[0126] 同样的,为了方便计算和理解,本实施例抽象出3类用户类型,并进行如下表示。
[0127] 年龄=Age(N1(<30),N2(>=30))
[0128] 性别=Sex(A(Female),B(Male))
[0129] 婚姻=Marriage(M1(married),M2(single))
[0130] 按照上面第一步中的方法,通过大数据获得相关的比值,然后得到如下的针对用户类型获得的交通事故发生率计算公式:
[0131] (如果所有N1、N2、A、B、M1和M2等变量都为1)
[0132] (A1)Age:Sex:Marriage=5:3:2
[0133] N1:N2=8:2
[0134] A:B=6.5:3.5
[0135] M1:M2=4.5:5.5
[0136] A1(用户类型)=A1”=1
[0137] =0.5*(0.8*N1+0.2*N2)+0.3*(0.65*A+0.35*B)+0.2*(0.45*M1+0.55*M2)[0138] (A2)Age:Sex:Marriage=3:4:3
[0139] N1:N2=5:5
[0140] A:B=6.5:3.5
[0141] M1:M2=5:5
[0142] A2(用户类型)=A2”=1
[0143] =0.3*(0.5*N1+0.5*N2)+0.4*(0.65*A+0.35*B)+0.3*(0.5*M1+0.5*M2)[0144] (A3)Age:Sex:Marriage=1:7:2
[0145] N1:N2=5:5
[0146] A:B=9:1
[0147] M1:M2=4.5:5.5
[0148] A3(用户类型)=A3”=1
[0149] =0.1*(0.5*N1+0.5*N2)+0.7*(0.9*A+0.1*B)+0.2*(0.45*M1+0.55*M2)[0150] 同样的,在具体计算中,N1、N2、A、B、M1和M2等变量在满足对应特征的时候为1,否则为0。
[0151] 然后,基于上面的方法,得到了事故种类对应车辆型号的计算方式,和事故种类对应用户类型得计算方式,但是车辆型号和对应用户类型的比重,也有相对应的数据进行参考,比如按照实际情况,会出现A1事故按照3:7分配,或者A2是4:6的情况等。目前我们按照大数据以及经验值来统一将车辆型号的影响和用户类型对所有事故种类按照4:6的配比计算。
[0152] 另外,对于事故Accident来说,每个种类也是有权重的,比如A1事故的发生率要大于A2的情况,这里我们可以参考大数据,假设获得这样的事故比率:
[0153] A1:A2:A3=5:4:1
[0154] 最后获得总的事故计算公式:
[0155] (如果所有T1、T2、T3、B1、B2等变量都为1)
[0156] A1=0.5*(0.4*A1’+0.6*A1”)=0.5*[
[0157] 0.4*(0.5*(0.1*T1+0.3*T2+0.6*T3)+0.4(0.2*B1+0.8*B2)+0.1*(0.45*C1+0.55*C2))
[0158] +0.6*(0.5*(0.8*N1+0.2*N2)+0.3*(0.65*A+0.35*B)+0.2*(0.45*M1+0.55*M2))[0159] ]=0.5;
[0160] A2=0.4*(0.4*A2’+0.6*A2”)=0.4*[
[0161] 0.4*(0.3*(0.3*T1+0.4*T2+0.3*T3)+0.5(0.3*B1+0.7*B2)+0.2*(0.42*C1+0.58*C2))
[0162] +0.6*(0.3*(0.5*N1+0.5*N2)+0.4*(0.65*A+0.35*B)+0.3*(0.5*M1+0.5*M2))[0163] ]=0.4;
[0164] A3=0.1*(0.4*A3’+0.6*A3”)=0.1*[
[0165] 0.4*(0.2*(0.33*T1+0.33*T2+0.34*T3)+0.3(0.6*B1+0.4*B2)+0.5*(0.75*C1+0.25*C2))
[0166] +0.6*(0.1*(0.5*N1+0.5*N2)+0.7*(0.9*A+0.1*B)+0.2*(0.45*M1+0.55*M2))[0167] ]=0.1。
[0168] 同样的,在具体计算中,T1、T2、T3、B1、B2等变量在满足对应特征的时候为1,否则为0。
[0169] 其中,由于本实施例的事故被抽象为A1、A2和A3三类事故,所以这三类事故的概率总和为1。
[0170] 为了更加清晰地理解本方案,在此进行具体案例分析:
[0171] 假如有3个用户,他们信息及购买的车辆情况如下:
[0172] 用户1:25岁女未婚,购买小车,品牌B1,颜色白色
[0173] 用户2:35岁男已婚,购买中型车,品牌B1,颜色黑色
[0174] 用户3:28岁女已婚,购买中型车,品牌B2,颜色黑色
[0175] 这样,我们可以得到如下可以计算的参数:
[0176] 用户1:N1、A、M2、T1、B1、C2
[0177] 用户2:N2、B、M1、T2、B1、C1
[0178] 用户3:N1、A、M1、T2、B2、C2
[0179] 按照步骤3中的计算公式可以得到如下分值:
[0180] 用户1:
[0181] A1=0.5*[0.4*(0.05+0.08+0.055)+0.6*(0.4+0.195+0.11)]=0.5*(0.074+0.423)=0.2485;
[0182] A2=0.4*[0.4*(0.09+0.15+0.116)+0.6*(0.15+0.26+0.15)]=0.4*(0.1424+0.336)=0.19136;
[0183] A3=0.1*[0.4*(0.066+0.18+0.125)+0.6*(0.05+0.63+0.11)]=0.1*(0.1484+0.474)=0.06224。
[0184] 用户2:
[0185] A1=0.5*[0.4*(0.15+0.08+0.045)+0.6*(0.01+0.105+0.09)]=0.5*(0.098+0.123)=0.1105;
[0186] A2=0.4*[0.4*(0.12+0.15+0.084)+0.6*(0.15+0.14+0.15)]=0.4*(0.1416+0.264)=0.16224;
[0187] A3=0.1*[0.4*(0.066+0.18+0.375)+0.6*(0.05+0.07+0.09)]=0.1*(0.2484+0.126)=0.03744。
[0188] 用户3:
[0189] A1=0.5*[0.4*(0.15+0.32+0.055)+0.6*(0.4+0.195+0.09)]=0.5*(0.21+0.411)=0.3105;
[0190] A2=0.4*[0.4*(0.12+0.35+0.116)+0.6*(0.15+0.26+0.15)]=0.4*(0.2344+0.336)=0.22816;
[0191] A3=0.1*[0.4*(0.066+0.12+0.125)+0.6*(0.05+0.63+0.09)]=0.1*(0.1244+0.462)=0.05864。
[0192] 通过上面的计算值,系统可以做如下分析:
[0193] 用户1和用户3相对用户2来说,事故A1类型的概率较高。
[0194] 当然由于A3事故的比重本来就小,我们也可以通过单独对A3的情况进行比较,可以发现用户2相对用户1和用户3来说,事故3的发生概率较低。
[0195] 这种分析可以按照目前系统中已存在的用户进行总体对比,也可以按照车辆或者用户的某个信息进行对比,有较大的灵活性。
[0196] 系统可以针对上面的结果,应用到保险行业、交通教育、交通工具附加产品等领域。比如,保险公司可以根据车辆拥有者的大数据分析结果,来预估他们交通事故的概率,从而推出更适合的车辆保险产品;交通安全局,可以通过这些数据,对这些人群进行更多的交通安全出行的教育;而车辆周边产品供应商,也可以像这些易发生交通事故人群,推荐一些更加适合他们的产品。通过上面这些信息的利用,可以降低交通事故的发生率。
[0197] 实施例二
[0198] 如图2所示,本实施例提出了一种通过大数据预估行车伤亡事故率的方法的通过大数据预估行车伤亡事故率的系统,本系统包括大数据库模块1,所述的大数据库模块1分别连接第一算法模块2和第二算法模块(3),且所述的第一算法模块2和第二算法模块(3)均和事故发生概率算法模块5相连,其中:
[0199] 大数据库模块1:用于保存各类交通事故信息以及各类交通事故中包括发生各类交通事故的车辆类型和用户类型的数据;
[0200] 第一算法模块2:用于通过交通事故基于车辆类型权重的数据挖掘的计算方法,得出各种车辆类型在交通事故中的比值数据;
[0201] 第二算法模块(3):用于通过交通事故基于用户类型权重的数据挖掘计算方法,得出各种用户类型在交通事故中的比值数据;
[0202] 事故发生概率算法模块5:用于结合第一算法模块2和第二算法模块(3)得出的比值数据并通过事故发生概率算法,计算得出不同车辆类型和不同用户类型在交通事故中发生交通事故的概率。
[0203] 实施例三
[0204] 如图3所示,本实施例结构模块与实施例二类似,不同之处在于,本实施例的事故发生概率算法模块5连接有手动监控管理模块4,其中:
[0205] 手动监控管理模块4:用于根据事故发生概率算法模块5得出的不同车辆类型和不同用户类型在交通事故中发生交通事故的概率获得交通事故易发生人群信息和/或交通事故易发生车辆信息,并对交通事故易发人群和/或交通事故易发生车辆的拥有者进行监控及管理。
[0206] 与现有技术相比,本发明的优点在于:
[0207] 1、利用大数据建模和分析,数据更加精准,覆盖范围广;
[0208] 2、可以将不同用户类型的用户与不同车辆类型的车辆单独或组合计算事故发生概率,具有较大的灵活性;
[0209] 3、获取易发事故的车辆类型和用户类型,以及易发事故的可能原因,进行更加具有针对性的安全教育;
[0210] 4、系统具有构架简单,能够利用大数据进行分析,精准地计算出各类车辆、人群在不同的事故中发生车祸的概率,从而使相关部门的安全教育更加具有针对性等优点。
[0211] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
[0212] 尽管本文较多地使用了大数据库模块1;第一算法模块2;第二算法模块3;手动监控管理模块4;事故发生概率算法模块5等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。