CCC2手册及信效度等



论文信息 ¶

D.V.M Bishop

论文原文 ¶

引言 ¶

CCC2的目的:检查可能有语言障碍的儿童,以及可能需要进一步接受语言治疗的儿童;识别有沟通问题的儿童是否有语用障碍;帮助识别可能需要检查自闭症谱系障碍的儿童。 CCC2与其他量表(词汇量量表、句法复杂度量表等)相比的优点:其他的量表不是很适合用来评估儿童怎样使用语言,或是识别儿童沟通中的异常特征(例如刻板交流、逐字理解)。特别是,传统的量表对于语用领域下存在的沟通问题十分不敏感(这里的语用定义为:根据沟通语境选择合适的信息或解释)。CCC2是由陪伴儿童的监护人填写的(这可能也是和其他量表的不同?例如Peabody就是直接询问儿童)。 CCC2组成:70个多选题,耗时5-15分钟完成。题被分为了10个测验,每个测验7个题,每个测验中,5个题描述困难,2个题描述优势,其中不同测验中的题交叉出现,但“困难”归在一起,而“程度”在表的最后归在一起。CCC2要求监护人为不同的行为评分,这个评分代表了儿童出现这种行为的频率。前四个测验(speech、syntax、semantics、coherence)能够评估语言结构、词汇量和语篇方面,特殊语言障碍(SLI)的儿童在这些方面经常受损;接下来四个测验(inappropriate initiation、stereotyped language、use of context、nonverbal communication)主要包含了传统的语言评估难以测量的沟通的语用方面,一些没有结构性语言障碍的儿童可能在这方面存在缺陷;最后两个测验(social relations、interests)评估由于自闭症而经常存在缺陷的一些行为,加入这两个测验是因为自闭症的一个重要特征就是语用障碍,CCC2并没法诊断自闭症,但如果儿童在语用相关测验及最后两项测验得分低,那么该儿童可能需要进一步接受自闭症诊断。CCC2还可以把里面的不同测验组合起来以侧重不同的目的,如GCC\SIDC等。 目标群体和使用:CCC2是以4岁及以上的以句子的形式说话的儿童为目标群体,它不适合还在单词句/双词句阶段以及non-verbal children,常模是基于英国主流学校的儿童制定的,所以可能也不适合其他文化背景的儿童。CCC2通常是由父母填写,或者频繁(每周至少3-4天,持续至少三个月)接触儿童的任何成年人。父母比专家有更多机会在不同语境下观察他们的孩子,但需要注意的是父母的语言或读写技能可能很差,他们可能不能完全理解CCC2的所有问题,可读性统计显示CCC2能够被阅读水平高于12岁的人完成。而CCC2是由SLP或心理学家或儿科医生来解读。 分数的解释:常模来自英国主流学校4-16岁的标准化样本。根据常模把原始分转换,可以识别那些分数落在了对其年龄而言的正常范围外的儿童。 CCC2里的一些项不适合成人。针对成人(17+),有修订版本的CC-A。

计分及解释CCC2 ¶

手写计分要则:1. 先从51-70题这些积极的题开始。然后把51-70题里来自ABC等不同测验的得分各自加起来填进表里(比较简单,看表格就会了)2. 如果有缺失数据,要在M列里标注哪个测量共几个缺失。3. 对于51-70题这些“优势”题,需要先把分数变了才行(因为这里3就代表了最好成绩,其他的都是以0分为最好成绩),需要把0变3,1-2,2-1,3-0,这就是POS这一列的作用。对于51-70题,比较简单的是我们可以直接用6减去得分就得到了转换分数(每项测验里2个题所以是6),但如果有缺失值我们需要额外减3,也比较好理解。4. 把POS列里的转换分数加起来,填在positive sum里。5. 计算X\Y列的和。6. 记录下X、Y列里的缺失值,也记在M列里。7. 在Neg列里填上X和Y里每个测验类型的和。8. 把Neg列求和,把和填在negative sum里。9. 一致性检验我们需要检查数据内在一致性。如果positve sum小于30,那么negative sum是任何值都是可接受的(为啥?),而如果positive sum大于30,那么需要用附录里的3B来检查数据的一致性。如果根据附录显示结果一致性不强,那么可以认为监护人没理解清楚如何使用CCC2。10. 如果没有缺失值,那么就直接把Pos和Neg的和填进Sum列。11. 如果有一个测验里有一个题是缺失值,那么需要将Pos和Neg的和按比例乘7/6,然后四舍五入得到sum结果。12. 如果对任意量表缺失值M有两个及以上,那么就无法有效的计算总分,直接在Sum和换算后的分数框里划线。13. 使用附录3A来把总分换算一下。14. GCC是前八个测验换算后的总分。15. 附录3C可以用来知道每个测验的换算分数的百分位。16. 附录3D可以用来了解将GCC分数转换为百分位。17. SIDC是用E、H、I、J的和减去ABCD四个测验的和,所以这个值可以是负数,它可以提供关于障碍的模式的定性信息,对于有沟通障碍的儿童,SIDC低于0分代表了他的沟通模式和自闭症儿童相似,而大于0分则表示儿童的沟通障碍是一些更加具体的、影响结构性语言技能的障碍。 电脑上的自动评分就不在这里说了。 CCC2的解释:由于CCC2会受到监护人的主观意识的影响,不同监护人理解问题的能力和填写量表的意愿,所以并不适合仅仅靠CCC2来做出主要的诊断决定。根据附录3C,这里给出了一些关于评估CCC2结果时的建议:1. 当单个测验转换后分数百分位高于15%(也就是差不多6分这个位置)时,认为在正常范围内。2. 转换分数的百分位在10%左右时,如果仅有一两个测验如此,那么也不必要担心,但如果超过三个测验都这么低,那么这个孩子可能就需要进一步地观察。3. 如果两个及以上的测验百分位低于5%,表明儿童存在临床上显著的沟通问题。4. 在GGC里(附录3D),作者的数据表明所有诊断为SLI和自闭症的儿童的GCC得分都在55以下(10%,但这里没有说GCC低于10%一定是SLI和自闭症!)5. 在I和J两个测验均低于6%,并且GCC分数低于55分,表明儿童有自闭症的可能性,如果儿童满足这两个条件,建议去做更细致的自闭症诊断 6. SIDC在第四章讨论,可以用来更具体划分语言障碍儿童,但是一般只有当儿童的GCC小于55分一般才看SIDC 当有缺失值该怎么办?尽管有缺失值,有时候也能从CCC2中获得有用的信息。如果A到H任一测验超过两个缺失值,都不能计算出GCC或SIDC分数。可以先检查每个测验的分数,观察有无异常(如果如上面说的,超过三个测验低,可能需要进一步询问监护人)。不够缺失数据超过两个的十分少,标准化样本里98%都提供了完整/一个以内缺失值的数据。

CCC2的发展 ¶

2000创建的CLIC(checklist for language impaired children)和CCC2有三个方面不同。CLIC是五个选项的格式,监护人有时会发现没有能够描述孩子的选项/或者多于一个可以描述孩子的选项,最后创建了CLIC2,采用“完全是”、“部分是”、“不是“的程度。CLIC2被期望能够从语言障碍人群中识别出有语义语用障碍的典型特征的儿童。但是似乎:1. 许多同时患有语用和结构性语言问题的儿童和那些有更严格的语用障碍的儿童之间没有明显的间断。2. 这些语义的题目似乎没有区分语言障碍儿童的类型,好像所有语言障碍的儿童都表现得差不多,同时一些题目似乎测量得是同一个功能领域。 而CCC1就是基于CLIC2发展的,选择了CLIC2里面评分者间信度最高的一些题目,然后在以内部一致性的统计标准的基础上把这些题目重新分组。CCC1只有9类测验其中五类测验组成了语用部分,两类测验覆盖了SLI儿童的语音语言结构薄弱方面,还有两类测验代表了自闭症的非言语特征行为方面。经过测验发现,CCC的信效度都还不错(信度是评分者间信度,效度是其和儿童的诊断结果的相关性)。CCC1能把孩子能分为有语义语用障碍的和没有语义语用障碍的儿童,同时对于前一组,还可以更细分为有自闭症特征的和没有自闭症特征的。尽管这些组别之间有很多重叠,但是,自闭症特征的孩子得分最低,没有自闭症特征的语义语用障碍组别次之,而没有语义语用障碍问题的儿童得分最高。 在此时CCC1还只是用于再细分那些已经有沟通障碍的群体(这是它的最初设计出来的目的),然而不久后它就被用于正常群体,来筛查那些有语言障碍的儿童,以及检查那些精神障碍儿童是否有语用障碍。那么CCC1到底适不适合扩大使用范围?如果这些结果是家长填写的,而不是专家填写的,到底能不能提供有效信息?(注意CCC1此时还是只能由老师治疗师等填写)Bishop&Baird(2001)让家长和老师(治疗师)分别填写了一份CCC,尽管这两个CCC结果的一致性并不高(r=0.45),但两个CCC结果都是有效的,因为它们都显示出了和儿童的临床诊断的密切联系。并且父母评分似乎比老师评分的一致性更高(所以说可以用家长来评分?)。同时正常儿童和临床样本儿童的分数很少有重叠,表明CCC可能确实是一个检查沟通障碍的有用的工具,同时也能检测语用障碍(这时候就扩大了CCC1使用范围了) CCC2和CCC1之间的区别: CCC1的选项设置存在的两个问题:1. 采用的选项是”完全是“、”部分是“、”不是“,判断过于主观,一个人的”完全是“可能是另一个人的”部分是“。2. 消极陈述的一些题目可能会引发一些心理混乱,例如问题是”从来没有发起过谈话“,而正常孩子一般都是”不是“,但这种双重否定会给家长带来判断困难。所以在CCC2里面,改成了以频繁为准的4分制:0. 一周少于一次,1. 一周至少一次,但不是每天,2. 一天一次或两次,3. 一天超过两次(这样似乎就更加客观了,所以CCC2使用起来比CCC1更加清楚明确)。 题目顺序的区别:CCC1把”困难“题目和”优势“题目交替出现,可能就会引起混淆,怎么”完全是“一会是积极的,一会是消极的?所以CCC2把”困难项目“放在了一起,把”优势“项目放在了一起(51-70题)。 测验的区别:CCC有9类测验,但每类测验题目数量不一致,在4-10个之间,并且一些测验有”优势“题目,而一些测验没有。然而如果我们要看不同测验的概括,那么它们最好都是在组成上相似的才行,所以CCC2每个测验的题目数量及”优势“题目的数量都是相同的。同时CCC1对于传统语言评估里的语言方面覆盖的比较少(例如句法方面只有四个题),然而经验显示,多覆盖一些语言的这些方面会有非常大的益处,所以CCC2的这些方面(也就是前四个测验)增加了,这就使得CCC2能够用于更加普遍的语言障碍检查,而不是仅仅针对语用障碍。 复合测验的分数的区别:在CCC里,复合测验只有一种,那就是把五个测验(DEFGH)加起来组成的语用部分的测验。这五个测验的组成的复合分数能够很好地区别典型SLI儿童和患有语义语用障碍的儿童,然而在CCC2里类似的语用复合分数信效度都很低,它对区别沟通障碍儿童的类型不是那么有用。CCC2里用到了两个复合分数,也就是前面提到的GCC和GISC。GCC基于前八个测验的总分,能够有效地区分正常发育的儿童和临床上诊断出问题的儿童SIDC是用于区别典型SLI儿童和那些有不成比例的语用困难证据的儿童(也就是说GCC的群体是所有儿童,而SIDC的群体是语言障碍儿童)

技术信息 ¶

4-16岁的小孩作为常模,满足下列要求就要被排出样本:1.神经性听力障碍儿童 2. 需要接受特殊教育的儿童 3. 没有英语家庭背景的儿童。共计542的儿童的家长完成了CCC2。 样本的代表性:1.样本的人口学数据:为什么表4.1中,前面的年龄范围是以11个月,而10岁开始就是以23个月?因为前期儿童发育较快,为了捕捉更快速的语言发展变化,所以选取的时间范围较小。2. 样本社会经济地位的代表性:同时还测了样本的社会经济地位,表4.2,显示我们抽取的这些样本的社会经济地位分布和整个广泛群体的社会经济地位的分布有着显著的统计学差异,但是在每个组别里的差距都比较小(任何组别都不会有超过5%的差距),同时样本中的贫穷家庭和富裕家庭都有着充分的代表性(其实这里就是为了看抽出的样本的社会经济地位分布能不能代表总体的社会经济地位的分布,所以说这么看来社会经济地位也算是没问题了?)。3. 父母的受教育程度的代表性:同时还看了父母的受教育程度(这里的受教育程度是通过父母不再接受教育时的年龄来反映,而不是他们的学位来反映,这样有个好处就是年龄是连续变量,更方便比较),比较了完成CCC2的521个父母和没做CCC2的297个父母,作者认为可能做CCC2的父母会比没完成CCC2的父母有较高的受教育程度,结果虽然显示了这么个倾向,但是在统计学上并不显著,所以我们也认为比较受教育水平有代表性。4. 样本的地理分布:预期和实际获得的样本的地域分布有显著差异,但是所有的地域都被包括进来了而且这个差距也不是特别的惊人,虽然有俩地区的代表性过大,还有一个地区的代表性不足,见表4.4其实就容易理解了(所以我们认为样本的地域分布也有代表性)。

开始建立常模:1. 首先要排除样本一些数据,因为有的家长读不懂要求,用0和1来回答所有题(0代表否,1代表是),那么作者就建立了一个标准来排除这些样本,那就是对于转换分数后的”优势“题目,如果平均值在1.5以上,并且”优势“题目和”困难“题目的差大于1.3,那么就排除了(因为内在一致性程度不高,不太可能优势题得分高,而困难题得分又太低),这个在施测时的一致性检验的计分那里其实是体现出来了的,基于这个标准排除了9个样本。2. 有8个样本因为缺失值太多被排除了。 对于每个测验来说,都先要把”优势/积极“题目的原始分数转换一下,然后得到每个测验的总分,分数越高就代表了障碍越严重。作者在这里把男女的数据一起分析的,因为使用了多元方差分析发现性别没有显著的主效应。随后就检查了各测验原始得分的平均值、标准差和分布,发现原始得分平均值随着年龄下降(这是应该的,因为年龄大的语言普遍发育比年龄小的好),同时在一些情况下,标准差也在随年龄下降(说明大龄儿童之间的差异比小龄儿童之间的差异更小),见表4.5。(作者说表4.5里面每个测验都体现了地板效应,我咋看不出来捏,是用标准差看的么)。早期在语用障碍人群里,没有发现年龄对CCC分数的影响,然而,当使用4-16岁大型标准样本时,我们在所有测验中都发现了原始分数和年龄的显著相关,如图4.6所示,为什么要对原始分数进行对数转换?为了减少年龄的差异,同时提高与年龄的相关性。 接下来说的是原始分数是怎么转换为age scaled score的?对于每个测验都进行了线性回归,通过月龄来预测初始分数,用预测的分数减去实际获得的分数,再除测验的标准误,就得到了标准化残差分数,差不多可用均值为10,标准差为3,最小值趋近于0的分布来衡量(请注意,这里是根据整个分布的年龄和原始分数来建模的,而不是根据每个年龄段的转换分数的平均值和标准差)。原始成绩是非正态的(可以根据3C来看,很明显是一个负偏态的数据),有两个主要影响:1. 按年龄转换后的分数有天花板效应,看表3C其实很容易发现,在15分左右就已经达到了天花板效应,所以这个量表可能不太适合测量语用技能高于太多平均水平的儿童。2. 小于平均值两个标准差的儿童的比例远高于正态分布的数据中预期的那样(我觉得这样的话,标准其实就变得更加严格了)。

CCC2的信效度: 信度:1. 内部一致性,见表4.8,每个测验的内部一致性可以说是相当高了。2. 评分者间的一致性,找了55个孩子,分别让专家和父母填这个量表,最后来求这俩之间的皮尔逊相关性。根据表4.9我们可知,E到G测验的相关性系数不高,同时F测验和G测验没有达到显著水平。其实这和CCC的情况差不多,尽管这样,作者还是认为CCC2的得分和诊断结果密切相关,所以应当被认为没啥大事。同时,10个孩子经过父母的评分认为是语言障碍而专家评分不是,而只有2个孩子父母认为正常而专家认为是语言障碍,似乎父母对沟通困难的敏感度比专家更高,因为他们有更多地机会在不同语境下观察他们的孩子。所以尽管有的测验评分者间的信度不高,我们也认为可接受(那为啥不选爸爸和妈妈,非要选父母和专家进行比较?) 效度:CCC2的效度数据从三个临床样本收集而来,样本A包含了74个有一系列沟通问题的儿童,样本B包含了26个接受过语言治疗的儿童,样本C是三级儿科诊所提供的34个。 样本A: 对于样本A来说,有的确诊自闭症或阿斯伯格,而有的患有语言障碍没有确诊为自闭症,IQ均为80以上,7-16岁。对于样本A里那些没有确诊高功能自闭症(HFA)或阿斯伯格的儿童(Asp),分为了三个子群体:1. 典型的SLI。2. 没有自闭症特征的语用障碍儿童(PLI)3. 有自闭症特征的语用障碍儿童(PLI+)。同时从主流学校选同年龄和同非言语能力的20个儿童作为对照组。根据表4-10,在所有测验中,不同的组别与对照组相比有着惊人的区别,方差分析显示出了很大的组别效应(不同组别间有差别),事后检验显示对照组和其他五组都有显著的差别。(这里就说明了我们确实能够通过CCC2对不同类型的儿童进行区分,但这里的事后分析怎么只做了对照组和其他组的,其他组之间怎么没做?4.10这个图挺重要的,我们还能目测出SLI和其他组的差别) 那么我们只能通过图4.1来看不同组别之间的GCC得分差别了。根据图4.1我们可以发现,对照组和其他五组基本没有重合部分。根据表4.11可以显示,GCC对于SLI以及高功能自闭症十分敏感,超过85%的这两类儿童都获得了37或更低的分。PLI和阿斯伯格的儿童最不太可能获得GCC低分,他们得高分的比例都是比较高的。但是由于样本量较小,这些结果都需要谨慎对待。 根据表4.10的数据,CCC2似乎对于区分沟通障碍的不同子类的效果不太好。同时,有个意外的发现SLI组儿童的语用得分都不太高。为什么呢?有几个解释:1. 结构性语言障碍也可能导致较低的语用得分,例如如果一个儿童构造句子有问题,那么可能无法对过去的时间提供一致的解释,但其实这种解释并不合适,因为为啥刻板语言和非言语交流方面的分数也低呢。2. 另一种可能是父母和专家对于语用问题的感知不太一样,图4.2显示了这种可能,表明了专家和监护人的测验D到H加起来的总分有显著的差别。所以仅靠语用部分可能不太能区分语言障碍的子类,那么到底怎么该区分这些子类?根据数据,作者发现真正把SLI和其他群体区分开的是他们在A到D的得分相对于EHIJ的得分更低(所以EGIJ-ABCD>0)。这里就提供了一种新的复合得分SIDC。SIDC得分为负,表明相对于ABCD等测验包含的内容来说,儿童在EHIJ测验包含的领域有着不成比例的困难,需要注意的是FG没有包含到SIDC里面,因为典型的SLI儿童的FG的得分也比较低。SIDC的评分间信度很高,同时根据图4.3,表明了SIDC确实能够以连贯的方式在区分SLI儿童和其他剩余的临床儿童(剩余的儿童我们其实都可以归为类似自闭症沟通方式的儿童)。(SIDC的效度主要就是通过图4.3表现的) 样本B: 样本A里全都是特殊学校的儿童,而样本B里有的来自普通学校。14个儿童,有SLI但没有自闭症特征,其中8个在正常学校上学。还招募了10个有更复杂语言问题的儿童,这些儿童要么诊断为自闭症,要么有自闭症特征,全部都来自特殊学校。根据图4.4,尽管这两组儿童比样本A里的那些儿童重叠更大,但是SIDC得分却存在着显著的差别(t检验)。 样本C: 样本C来自儿科发育诊所的34个样本,根据ICD-10分为了五个子群体::SLI,PDDNOS(儿童有自闭症特征,但是却没有达到自闭症的标准),自闭症,阿斯伯格,ADHD,许多儿童都有多种障碍,所以当儿童诊断为自闭症或PDDNOS时,将被认为是主要的症状。SIDC和GCC的结果可以看图4.5。根据图可以看出,尽管样本量很小,但总体规律和样本A类似:1. 一般的SLI的SIDC得分都比剩余的组别的得分更高。2. 大部分个例的GCC得分都是在3%水平之下的。但有个例外,阿斯伯格组的GCC得分相对较高。尽管如此,SIDC得分表明了,如果儿童的结构性语言技能相对于语用和社会功能表现更好,那么SIDC得分较低。 把样本ABC结合起来来看: 把所有样本里的所有儿童归为SLI、PLI、PDDNOS(包括样本A里的PLI+)、自闭症、阿斯伯格。这些图确认了,总体上来说,CCC2为语言障碍的子类提供了与临床预期一致的概述,但是也有一些例外。针对于不同的组别,这里详细地说了说: SLI组:和预期一样,SLI组在A–D测验尤其有问题,而在语用部分的测验相对得分较高、尽管如此,他们E到J的平均分数也显著低于正常对照组平均值(G测验得分尤其低)。 PLI组:这些儿童有语用障碍却没有自闭症特征。作者预期这些儿童在E到J的得分不会比SLI组显著地差,但结果显示不是这样地。在语用测验上,他们表现得和SLI组差不多,但是他们在A到D测验表现得比SLI更好。这个发现比较有趣,语用缺陷的临床诊断可能会被儿童的结构性语言技能所影响。而如果结构性语言出了问题,那么语用问题就会被忽略,而如果结构性语言技能比较好,那么语用困难就比较地会被注意到。 PLI+/PDDNOS组:PLI+认为是非自闭症儿童,但却有显著的语用困难以及自闭症特征。这些儿童和PLI组儿童的A-D,E-J很相似,但是他们得分的总体水平却比PLI组更低,表明他们的沟通问题更严重。 自闭症儿童组:这里的自闭症样本都是指的相对高功能的自闭症(因为CCC2只针对能说句子的儿童)。自闭症儿童似乎有和SLI儿童冲突的表现。他们的A到D的得分低于正常水平,但是A到D的得分也比F到I的得分更高。 阿斯伯格组:自闭症组的得分表现在阿斯伯格组中被极大地放大了,就像是完全是SLI组的镜像。在语用部分EFGH惊人的缺陷,而在ABCD等结构性语言测验里的得分情况相对较好。

SIDC截断的来源: 最近研究支持一种尺度观点,认为语言障碍是一个谱系,一端是典型的SLI,一端是自闭症,许多有障碍的儿童就位于这两个极端之间。但有时还是需要把这些子类区分取来,SIDC有时候就能完成这样的事。表4.12显示了样本ABC总和的SIDC得分分布。(这个挺有用的,就是差不多以0为界限区分SIDC)低于0分的只有一个是SLI,而高于8分的只有一个是自闭症。如果有人想用CCC2来从一组语言障碍的儿童里选择出最有对比的子类,那么他就可以排除0-8分的所有儿童,然后比较两个极端的儿童:0分以下的儿童和8分以上的儿童。CCC2的临床数据和其他经常使用的诊断方式一致,对于儿童语言障碍的分类,最合适的框架是尺度化而不是类别化。 效度研究的回顾:

  1. 效度研究表明CCC2能够作为检查工具使用。有临床上显著的沟通问题的儿童不太可能得到超过10%的GCC得分,并且大部分得分都低于3%。
  2. 语用composite被证明在区分沟通障碍儿童的子类时并不实用,因为沟通障碍的所有儿童都可能在语用上表现较差,即使他是一个没有语用问题的典型SLI。
  3. 一个新composite,SIDC能够检测儿童的沟通的语用方面相对于语言的其他方面是不是受损更严重。评分者间效度较高,并且对自闭症很敏感。