利用深度学习和ABIDE数据集识别自闭症谱系障碍


文献:Heinsfelda,A.S.,Franco,A.R.,Craddockf,R.C.,Buchweitz,A.,&Meneguzzia,F.(2018). Identification of autism spectrum disorder using deep learning and the ABIDE dataset. NeuroImage:Clinical,17,16–23.https://doi.org/10.1016/j.nicl.2017.08.017

1. 研究背景 ¶

确定可能有助于脑源性疾病的诊断和治疗的客观的生物标记物是精神神经影像学研究的主要目标,数据密集型机器学习方法(machine learning methods,ML)是在更大、更异构的数据集中研究大脑功能模式的可复制性的一种很有前途的(promising)工具。神经科学研究可以帮助在清晰绘制自闭症行为变化谱(spectrum)的复杂性和它们的神经模式之间架起一座桥 梁。非侵入性脑成像研究促进了对脑源性疾病的神经基础及其相关行为的理解。对ASD激活模式的识别以及该模式与神经和心理成分的联系有助于理解精神障碍的病因。目前脑疾病的脑成像研究存在的困难是可重复性差。

机器学习方法与脑成像数据的结合,可以对与语义类别、名词含义、情感、学习有关的心理状态进行分类。在精神疾病方面,研究已经确定了与精神分裂症、自闭症和抑郁症患者相关的大脑活动。将ML算法应用于ASD大脑成像数据的研究,在单一位点的fMRI数据集中识别ASD和对照者的准确率高达97%。这种机器学习方法又被分为有监督的学习方法和无监督的(supervised and unsupervised)学习方法。在监督方法中,将类标签分配给一组数据作为训练数据集(根据这组数据进行分类),其他数据集(测试数据集)根据在训练数据中发现的模式进行分类。换句话说,该算法对预先建立的标签进行分类(也就是说,它们依赖于特征选择或特征工程,engineering)。这些标签和特征的选择取决于先验假设或探索过程;因此,它们在一定程度上依赖于主观性。本研究中研究者通过使用大数据集和无监督机器学习方法对精神障碍进行分类来解决普遍性(generalizability)和主观性问题。

使用ABIDE(Autism Brain Imaging Data Exchange,自闭症脑成像数据交换系统)的数据根据大脑连通性测量结果(brain connectivity measurements)对ASD患者与对照组进行分类。Nielsen等(2013)基于生成的7266个ROI(感兴趣区域)的数据,通过计算每个ROI之间的两两相关性,得出大小为7266×7266的连通性矩阵(connectivity matrix)。使用留一法( leave-one-out),将连通矩阵(connectivity matrix)与受试者相关的变量联系起来。然后通过使用一个站点的连接平均值和另一个站点的相同连接平均值之间的差异来调整它。这个过程减少了站点之间可能导致结果偏差的差异。计算所有7266个ROI的减去平均值,然后将这些值相加,正值归类为ASD,负值归类为对照组。

Koyamada等人(2015)使用深度神经网络(DNN)从可测量的大脑活动中研究了大脑的状态。他们训练了一个具有两个隐藏层和一个softmax输出层的人工神经网络,以将来自499个被试的基于任务的fMRI数据分类为与任务相关的七个类别:情感,赌博,语言,运动,关系,社交和工作记忆。Plis等人(2014年)运用深度学习和结构性T1加权图像,对四个不同数据集中的精神分裂症患者和对照组进行了分类。深度学习算法对大脑成像数据分类可以用来探索精神疾病的神经模式。在有监督的方法中,假定的标签用于训练分类器并查找与标签相关的大脑激活或连接的模式;而无监督的方法,分类器在人口样本中探索可能与临床人口有关的大脑模式,再一次避免了标签选择所涉及的主观性(Plis,2014)。

2. 材料和方法 ¶

来自ABIDE的rs-fMRI数据,纳入了505名ASD个体和530名典型对照(TC)的数据,来自ABIDE中17个不同的数据集,包括每个患者的rs-fMRI图像、T1脑结构图像和表型(phenotypic)信息。

静息状态的fMRI(Rs-fMRI)提供了大脑区域之间功能关系的神经测量结果。Rs-fMRI数据可以在不增加与任务相关的大脑激活相关变量(Plitt,2015;Smith,2009)的情况下对中断的大脑网络进行研究。为了研究大脑的连通性,计算了感兴趣区域的时间序列平均值的相关性。这个相关性用于建立连通性矩阵。功能连通性根据rs-fMRI脑成像数据的时间序列提供了脑区域同激活(co-activation)水平的指标。连通性矩阵中的每个单元都包含一个Pearson相关系数,其范围从1到−1,接近1表示时间序列高度相关;接近−1,表示时间序列负相关。

预处理的rs-fMRI数据是从“预处理的Connectomes项目”(http://preprocessed-connectomesproject.org/)下载的。数据是从CPAC预处理管道(pipeline)中选择的。fMRI数据经过切片时间校正,运动校正,并且体素强度已标准化( slice time corrected, motion corrected, and the voxel intensity was normalized)。功能数据(Functional data)采用带通滤波(0.01~0.1Hz)和非线性方法对模板空间进行空间匹配。提取每个受试者的感兴趣区域的平均时间序列。使用大脑CC200功能分裂图谱(functional parcellation atlas)(Craddock和James, 2012)来减小征向量的尺寸。

采用去噪自动编码器(Denoising autoencoders)对预测模型进行训练,对初始参与者之外的新受试者进行准确分类。

将模型的性能与使用支持向量机(SVM) (Vapnik, 1998)和随机森林(RF) (Ho, 1995)训练的分类器的结果进行了比较。

3. 结果和讨论 ¶

结果表明,深度学习算法在ABIDE数据中对ASD和典型被试的分类正确率高于现有的最高水平;该算法优于其他方法(该算法的应用性能优于先前关于自闭症谱系障碍患者ABIDE静息状态大脑激活识别研究的结果;与SVM相比,深度学习分类方法的分类准确率平均提高了5%;与以前尝试使用ABIDE多站点数据对ASD进行分类的研究相比,深度学习方法高出了10%的分类准确率(Nielsen等,2013)。)。缺点是耗费时间长;被试数目减少灵敏度和准确率会下降。

在ASDrs-fMRI数据中:(1) 前脑区和后脑区的分布网络,在rs-fMRI激活呈负相关;(2)在rs-fMRI期间,后脑区域网络的激活是高度相关的。相对于控制组的大脑连接,自闭症患者的大脑功能的特点是前后连接的减少和后脑区域之间的局部连接增加。本研究结果表明,前(扣带旁回,Paracingulate Gyrus)和更多后(缘上回)部区域与额颞区(如颞中回和前下回下,梭状回,额眶部皮质(fusiform gyrus, orbital cortex))的功能之间均存在负相关作用。前后连接不足是自闭症患者的大脑功能的特征,并有助于区分两组被试。

4. 结论 ¶

成功利用ABIDE数据应用深度学习对ASD和控制组进行分类;提取了rs-fMRI中脑功能的模式,并说明了自闭症大脑的前后连接性不足;rs-fMRI数据显示ASD大脑连接不足的区域是:扣带旁回,缘上回和颞中回;深度学习对大脑激活的分类的准确率达到了70%,超越了最高水平。