结合脑电特征选择和核分类器改进基于脑电信号的情感识别



文献:Atkinson, J., & Campos, D. (2016). Improving BCI-based emotion recognition by combining EEG feature selection and kernel classifiers. Expert Systems with Applications, 47, 35–41. https://doi.org/10.1016/j.eswa.2015.10.049

论文原文

1.背景介绍 ¶

当前的情绪识别计算技术已经成功地将情绪变化与EEG信号相关联,因此,如果应用适当的刺激,则可以从EEG信号中识别和分类它们。但是,由于信号的特征和噪声、EEG约束以及与被试有关的问题,自动识别通常仅限于少数几类情绪。为了解决这些问题,本文提出了一种基于脑电图的BCI(Brain–Computer Interfaces,脑计算机接口)界面的基于特征的情绪识别模型。与其他方法不同,研究探索了更广泛的情感类型,称为结合基于相互(mutual)信息的特征选择方法(即最小冗余最大相关性,minimum-Redundancy-Maximum-Relevance)和核心分类器(kernel classifiers),可以提高情绪分类任务的准确性。

2.情绪识别 ¶

通过生理信号对人类情绪状态的研究涉及对来自中央和顶叶皮层的信号进行记录和统计分析。EEG是一种具有良好的时间和可接受的空间分辨率的非侵入性技术。识别情绪的一个主要问题是,人们对相同的刺激具有不同的主观体验。人类能够以大约60%的准确度从语音(语音和话语)中识别情绪,或者能够以78-90%的准确度从面部表情和身体动作中识别情绪,这些方法中的大多数要求人类以一种深思熟虑和夸大的方式来表达他们的情绪(心灵)状态,这样情绪就不能自发地表达。 基于脑电图的情绪识别有几种方法,通常是基于四个主要任务: (1)信号预处理:脑电图设备可以直接从大脑获得信号。然而,有一些噪音源并不是在神经上产生的,它们被称为伪影因此必须应用数字信号处理技术来使用频率和调和(harmonic)函数来表示信号。 (2)特征提取:提取不同的特征以简化进一步的分类任务,从而创建输入特征向量(FV)。典型的方法包括对信号的第一次差异的统计指标(即中位数,标准差,峰度对称等),光谱密度(即具有特定频段的EEG信号),对数频段功率(Log BP)(即,根据信号的振荡过程确定信号内某个频段的功率),Hjorth参数(即按活动性,移动性和复杂性描述的EEG信号),小波变换(即EEG信号的分解),分形维数(即,隐藏在信号中的基本模式的复杂性)。 (3)特征选择:用于情感识别的很少使用的特征选择技术结合了一种称为遗传算法(GA,Genetic Algorithms)和支持向量机(SVM)的元启发式方法。这种方法的主要缺点是花费时间收到良好的结果,并且在GA的每次迭代中都评估了所选特征的冗余性(redundancy)。最小冗余最大相关性(mRMR)的其他EEG特征选择技术会选择与分类变量中最强关联的特征,从而减少信息冗余,该方法通过使用交互信息(MI,Mutual Information)方法减少不良特征与良好特征之间的冗余,从而选择彼此互有差异但仍具有高度相关性的特征。 (4)情绪分类:一旦从先前的任务中提取出FV,就必须根据先前确定的情绪类别对情绪进行分类。

3.一种基于BCI的自适应情绪识别模型 ¶

整个模型包括信号预处理、特征提取和选择、情绪分类三个任务(见图1)。

图1

降低分辨率;眼电图摘除(去除伪影);过滤脑电图信号。

为了降低维数(dimensionality),提取相关特征以为每个刺激创建易于处理的FV。其中包括统计特征(S),不同频率的频带功率(BP),每个通道的Hjorth参数(HP)和分形维数(fractal dimension,FD)。统计特征包括中位数,标准差,峰度系数等。每个EEG通道的频带对应于theta(4–8 Hz),低alpha(8–10 Hz),alpha(8–12 Hz),β(12–30 Hz)和gamma(30–45 Hz)。 最小冗余条件定义为:

图2

其中I(fi,fj)是特征fi和fj之间的MI,并且| S | = n是集合中要素的数量。然后,将每个特征关于情感类别的判别力测量为特征和类别之间的MI。由于I(C,fi)表示特征fi与类别C的相关性,因此最大相关性条件可以看成是:

图3

使用变换函数将每个特征转换为离散值:

图4

为了识别不同的情绪类别,针对集合E = {xi,yi} Ni = 1,对多类支持向量机(SVM)进行了训练,其中N是根据先前选择的特征构建的样本数,xi被组成FV和yi的xi维度类别(即Arousal和Valence)。分类器构建并训练k(k − 1)/ 2个SVM,其中k是yi的类数。每个维度都考虑了三个类别,[1,3.66],[3.66、6.33]和[6.33,9]。

图5

其中r(i)表示在其中创建值范围的第i个除法的点,max v-min v是每个维的最大值和最小值之间的差,而k是数字要创建的集合。

4.实验 ¶

为了评估情绪分类方法在不同维度中的准确性,建立了一个计算原型,并在DEAP数据集上运行。为了调整最终实现的模型的不同参数,进行了不同的实验: 不同分类器配置的精度被测量为正确分类信号与信号总数的比;所有实验均使用标准的DEAP(使用EEG,生理和视频信号进行情绪分析的数据集)1数据集,该数据集包含一组EEG生理信号和对32个人类被试进行40次刺激测试的视频记录。过使用m-f个旧的交叉验证对模型进行训练和测试(对于m = 8,可获得最佳结果)。

5.数据采集 ¶

刺激测试是通过使用来自DEAP的音乐视频记录进行的,因为它们比其他刺激更适合于唤起情绪反应。刺激测试程序进行如下: 每个被试观看一段音乐视频,记录脑电图生理信号和面部表情; 每个被试根据唤醒和效价的维度显示自己的情绪状态。

6.参数调整 ¶

为了调整模型,我们将mRMR与其他最新的特征选择方法(如GA-SVM)进行了比较。同时,使用不同的内核函数和阶数(degrees)(RBF和γ= 0.2,RBF和γ= 0.05以及多项式和阶数= 5)对SVM的三种核心配置(kernel configurations)进行了测试。 随着选择了更多的特征,平均精度会略有下降。对于分别包含35个和29个特征的Arousal和Valence的集合,获得了最佳的分类精度,而对于两个维度都大于173的集合,则获得了配置的最差精度。 初步运行表明,遗传算法通常会收敛到80到100代之间的良好解。GA中候选解决方案的适应性评估使用SVM的分类精度(acc),因此如等式(5)所示进行计算,其中fnessity =精度其中wa = 1(acc的权重),wf = 0( 权重的数量和特征的成本),n是特征的数量,ci是提取第i个特征的成本,xi表示是否存在所选特征(0或1)。

图6

随着GA人口规模的增加,平均准确性也随之提高。mRMR生成的特征集要比GA-SVM小,这使其更适合于实时应用,因为提取特征和实现良好的分类精度所需的工作更少。

7.总结 ¶

本文提出了一种基于脑电特征的情绪识别方法。与其他方法不同,该方法将mRMR特征选择方法用作信号预处理步骤,从而提高了基于二维情感模型(即Valence和Arousal)的SVM情感分类器的预测准确性。此外,与最先进的情绪识别方法相比,本方法在标准DEAP数据集上处理的情绪类别数量更多(即8种)。这项研究的贡献之一是将基于统计的特征选择任务整合到了分类任务中。