理解面孔熟悉度



文献:Kramer, R. S. S., Young, A. W., & Burton, A. M. (2018). Understanding face familiarity. Cognition, 172, 46–58. https://doi.org/10.1016/j.cognition.2017.12.005

原文

1.文章概述 ¶

我们知道,识别熟悉的面孔比不熟悉的面孔更容易。针对熟悉面孔的优势,研究都是二分法,简单的分为“熟悉”和“不熟悉”,但实际上,人所经历的熟悉的过程涉及大量“面孔刺激”。

本文使用模型来模仿人类熟悉的过程,试图说明熟悉的过程中实质的个体内部的变量。

使用Google Image搜索收集了4154幅彩色图像,包括335个不同身份。通过改变一组中不同面孔的数量来表示“熟悉程度”。

使用PCA(主成分分析)得到代表图像set可变性的“特征面孔”,再使用LDA(线性判断分析)将同一面孔的图像分类,实现类别内差异最小化,类别间差异最大化。

2.1熟悉度提高识别率

  • 过程:

随机选择一个测试图像,进行PCA+LDA程序,再计算测试图像和已知面孔之间的距离,重复100次,得到平均距离。

  • 结果:

图1

熟悉度和识别率之间高度显著相关。即使不熟悉,有些面孔也比其他面孔容易识别,和面孔特征现象吻合。

  • 额外测试:

过程:PCA过程不变,LDA过程中图像随机打乱,即提供相同顺序的数据,但是没有top-down的结构。

结果:识别路下降为0.01,说明数据中的随机模式在分类高度可变的面孔时几乎没有用。

过程2:仅使用2D信息测试。

结果2:识别率为0.03,表明标准化程序删除的每个图像的基点信息没有超出标准化信息本身的价值。

2.2 熟悉度可以抵抗图像质量的下降

  • 过程:把图像像素降低。

图2

  • 结果:

图3

25%、50%时仍显著相关,75%时大量像素不携带身份信息,呈最低水平。

2.3 从内部、外部特征识别

  • 过程:

内部特征指:鼻子、眼睛、嘴巴;外部特征指:头发、面部形状;图像处理如图,基于16个基准点创建一个仅含内部特征的区域,其他部分用平均RGB像素替代。

图4

  • 结果:

图5

两种情况都显著,但内部特征的影响显著更高。且内部特征所占像素小于外部特征,说明是由于内部特征本身更具有信息性。

已知基础模型能够正确识别未经训练的面孔,特别是基于内部特征。在匹配实验中,试图确定它是否也适合知觉匹配任务中已知的发现,在这些已知的熟悉中会产生很大的影响。

3.1 不熟悉的面孔匹配:首先确认是否能购模拟陌生人脸匹配

  • 过程:

使用GFMT(Glasgow人脸对比测试)创建图像如图,将GFMT的成对面孔投影到PCA+LDA空间中,其中GFMT的面孔都未经训练。

图6

  • 结果:

相同身份的平均图像间距离比不同面孔的图像间距离显著更低,说明该模型能区别身份的”相同”和”不同“。

图7

3.2面孔匹配作为熟悉度的函数

如何处理不同熟悉度的图像

  • 过程:

使用Jennifer Lawrence的不同面孔图像,最大数量159。改变训练模型中的图像数量(0-151),测量在JL的2个新面孔图像的匹配表现。

计算了三个主要量度:(1)从每个图像到JL质心的距离,(2)从每个图像到最近的非JL质心的距离,以及(3)新图像之间的距离度量。

  • 结果:

图8

随着对JL质心的距离与最近的非JL质心的距离之间的距离越来越大,证明了随着熟悉程度的提高,概念匹配的可能性也随之增加。还表明,随着熟悉程度的提高,JL以外的人脸的质心与JL质心的距离越来越远,反映了LDA所产生的整体空间的重塑。熟悉程度(训练图像的数量)与到最近的非JL质心的距离(在20次迭代中平均)之间的Spearman相关性为rs(14)= 0.95,p <.001。

3.3 潜在机制

a.当使用面部识别和面部匹配进行测试时,模型显示出了越来越熟悉的面部的明显优势。这与数十年来面部研究的主要发现相吻合,并提供了有关面部熟悉性质的见解。在先前的研究中,已确定了将LDA与PCA结合使用比单独使用基于PCA的系统具有更好的识别熟悉身份的新颖图像的性能( Kramer,Young et al。,2017)。建议将LDA与PCA结合使用特别有用,因为每张脸都有其自身特有的变异性形式,在熟悉时需要学习(参见Burton等人,2016年)。这种特质变异性限制了PCA等通用方法的用处,该方法仅代表整个训练图像集的变异性,而没有考虑特定面部的特质性。在这里,将该建议进行了正式测试。

  • 过程

使用Ryan Reynolds的面孔,删除了4张随机选择的图像,然后将其余图像随机分为80张训练图像和20张测试图像。

在PCA阶段,将Ryan Reynolds的80张训练图像与所有其他身份的所有其余4050张图像一起包括在内。在LDA阶段,Ryan Reynolds的80张图像要么留在(训练的身份条件),要么留在外面(无训练的身份条件)。然后,将他的20幅新图像投影到PCA + LDA空间中之后,计算了所有成对图像之间的所有成对距离,并比较了经过训练的身份和未经训练的身份条件下这些距离的平均值。在涉及Ryan Reynolds集合的80和20张图像的不同随机样本的20次迭代中重复此过程。

  • 结果:

图9

与包括Ryan Reynolds图像时相比,通过使用PCA + LDA程序(经训练)与他的其他图像进行训练,可以减少其新图像之间的距离,仅在PCA阶段(未经训练)。很明显,使用LDA进行身份训练具有重塑底层基于PCA的空间的作用,其方式是使受训练的面部的任何实例彼此之间更加接近。

b.应用LDA导致的PCA空间重塑是否完全针对特定个人?如果重塑对于每个已知面孔完全是异质的,那么通过LDA学习几个不同的面孔身份来表示PCA + LDA空间中陌生面孔的身份的能力将不会产生应计的收益,而如果重塑只是部分异质的,那么我们可以预期,随着人们熟悉的面孔的增多,表示陌生面孔的能力也会有所提高。

  • 过程:

使用Google图像搜索为40个新身份分别收集了两张图像,并遵循了前面所述的相同准则。这些身份都没有出现在训练集中。为确定身份衍生空间是否会为陌生的面部匹配带来益处,将80张新图像投影到了模型的PCA + LDA训练空间中。为了进行比较,将这些图像投影到仅执行模型PCA阶段而得出的空间中。在这两种情况下,训练集都是相同的,但是对于仅PCA的模型,不使用身份信息来得出可以在人脸图像之间最好地区分的维度。

  • 结果:

图10

对于单独使用PCA的模型,两种类型的试验之间没有统计学上的显着差异,相反,PCA + LDA模型成功地区分了“相同”和“不同”的身份图像对。

本文目的是提出一个模型,以将面孔的熟悉度概念化。模拟结果表明模型在面部识别和匹配任务上表现出了逼真的效果,越来越熟悉的面部被更好地匹配和识别,显示出对退化的抵抗力以及对内部特征的依赖性增加。

2.不足的地方及未来的研究方向 ¶

1.本身已有的熟悉度对实验结果的影响?如何确保熟悉只是实验中训练的结果。

2.图像学习和自然面孔学习的区别