[0027] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0028] 图1为本发明实施例提供的基于权值分布的阈值化方法流程图,该方法具体包括如下步骤:
[0029] S1、基于类标签将训练集样本分为两个样本组,即病人组和正常人组;
[0030] S2、针对两个样本组中所有样本,使用Pearson相关系数构建各样本的脑区间功能性连接,将各脑区时间序列间的Pearson相关系数作为其连接权重,从而构建脑网络邻接矩阵,表示为 其中, 为第t个病人脑网络的邻接矩阵, 为第t个正常人脑网络的邻接矩阵,N为病人样本组中的样本数量,M为正常人样本组中的样本数量;
[0031] 在步骤S2之前还包括:对两个样本组中的所有样本进行预处理,获取样本中各脑区的时间序列;
[0032] S3、基于两样本组的功能连接分布差异,针对每个脑区对构建一个阈值。
[0033] 在本发明实施例中,对于给定的n个脑区,存在n(n-1)/2个脑区对,以于脑区对i和j为例进行说明,脑区对i和j的阈值构建方法具体如下:
[0034] S31、假定脑区对i和j功能性连接权值在每个样本组中的分布服从高斯分布,即和 并利用两个组的样本分别估计出两个高斯分布的参数值,高斯分布的参数采用如下公式进行计算:
[0035]
[0036]
[0037] 其中, 表示第t个病人网络的第i和j个脑区的功能连接权重, 表示第t个正常人网络的第i和j个脑区的功能连接权重。
[0038] S32、利用Kullback-Leibler散度估计两个高斯分布之间的距离其计算公式具体如下:
[0039]
[0040] S33、若距离 大于设定值δ,则计算两个高斯分布的交叉点τ,将交叉点τ作为脑区对i和j的阈值Tij,否则,认定两个高斯分布相同或相似,表明相应的功能连接并未受到疾病的影响,移去脑区对i和j的连接边(即令Tij=1),即:
[0041]
[0042] 本发明提供的基于权值分布的阈值化方法具有以下效果:通过对网络中每个功能连接,利用其权重分布自适应的构建一个最佳阈值,对不同脑区间的功能连接构建不同阈值,对整个脑网络构建了阈值矩阵T,用于阈值化脑网络,从而保留了不同脑区间功能连接的多样性。解决了单一阈值或百分比方法的不足。
[0043] 在两个fMRI数据集上,即ADHD(Attention Deficit Hyperactivity Disorder)数据集与ADNI(the Alzheimer’s Disease Neuroimaging Initiative)数据集,验证了本发明提出WBT方法有效性。
[0044] 列举了在ADHD与ADNI数据集上评价提出方法的有效性。表1给出了这些数据集的特性。
[0045] 表1两个数据集的样本的统计信息
[0046]
[0047]
[0048] MMSE=Mini-Mental State Examination
[0049] 对于ADHD数据集,使用了来自NYU(New York University)站点已经预处理好时间序列数据,详细的预处理步骤可以在http://www.nitrc.org/plugins/mwiki/index.php/neurobureau:Athena找到。预处理后的数据根据AAL(Automated Anatomical Labeling)将大脑划分90脑区,每个脑区包含了172时间点数据,使用Pearson相关系数构建功能性脑网络。
[0050] 对ADNI数据集,来自USC(University of Southern California)阿尔兹海默病研究机构公布,http://adni.loni.usc.edu/),采用了标准预处理管道,包括时间片(矫正和头动矫正)。利用SPM8(Statistical Parametric Mapping software package)(http://www.fil.ion.ucl.ac.uk.spm)来完成图像预处理。对每个样本,丢弃前10幅fMRI图像,以确保磁化平衡。对保留图像首先进行切片间采集时间延迟上的矫正,紧接着进行头部运动矫正,消除头部运动的影响。由于脑室(ventricle)区域和白质(white matter,WM)区域包含相对较高的噪声,利用灰质(gray matter,GM)提取血氧水平依赖(the blood oxygenation level dependent,BOLD)信号来构建功能连接网络,为了消除WM和CSF可能的影响,每个样本GM组织被进一步用于罩化(mask)它们对应的fMRI图像。fMRI时间序列的第一次扫描被配准到同一样本的T1加权图像,所估计的变换被应用到相同样本其它时间序列。矫正后的fMRI图像首先利用HAMMER的变形配准方法将其配准到同一模板空间,并利用AAL模板把其划分为90个感兴趣的区域(region-of-interest,ROI)。最终,对每个ROI,所有体素(voxel)上平均fMRI时间序列被作为该ROI的时间序列。同样地也使用Pearson相关系数构建功能性脑网络。
[0051] 两个数据集进行了四组分类任务,具体为:MCI vs.NC分类、lMCI vs.eMCI分类、eMCI vs.NC分类和ADHD vs.NC分类,其中,MCI为轻度认知障碍-mild cognitive impairmen,NC为正常对照组-normal control,lMCI为晚期轻度认知障碍-late MCI,eMCI为早期轻度认知障碍-early MCI,ADHD为注意力缺陷多动症,分类在实验中从阈值化脑网络中提取每个脑区的聚类系数特征用于分类分类。对比了单一阈值方法(表示为ST)和按照百分比来稀疏化的方式(表示为PT),为了比较,对原始的没有阈值的脑网络也提取了权重聚类系数作为特征用于分类(表示为baseline方法)。在实验中,采用支持向量机(Support Vector Machine,SVM)进行分类,在分类过程中,采用10折交叉验证来评价分类性能。特别注意的阈值的确定是在训练集中获取。这个过程被独立的重复10次,目的是为了减少在交叉验证过程中因随机划分样本而造成对分类结果的影响。最后,四种测度即精度(所有样本被正确分类比例)、敏感度(病人当中被正确分类比例)、特异度(正常人当中被正确分类比例)和受试者工作特征曲线下方面积(AUC)。其中表2~表5为所有方法在四个分类任务上的性能。注意,在ST和PT方法中,采用不同阈值获得不同结果。公平起见,表2~表5报到了它们的最好结果。
[0052] 表2:所有方法在MCI vs.NC分类上性能(%)
[0053]
[0054] 表3:所有方法在lMCI vs.eMCI分类上性能(%)
[0055]
[0056] 表4:所有方法在eMCI vs.NC分类上性能(%)
[0057]
[0058] 表5:所有方法在ADHD vs.NC分类上性能(%)
[0059]
[0060] 附图2至附图5给出了为四种方法在两个数据集上随阈值的变化情况,从图2至图5可以看出,本发明提出的WDT方法能够获得最好的性能,此外,两种比较的方法(即ST和PT)受阈值变化的影响比较大,反映了选择阈值的重要性。而本发明提出的WDT方法在计算量上具有优势,具有很好的鲁棒性。
[0061] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。