论文信息 ¶

Hasan, M., Rokhshana Nishat, A., Yasmin, S., & Pias, T. S. (2021). Fine-Grained Emotion Recognition from EEG Signal Using Fast Fourier Transformation and CNN. Paper presented at the 2021 Joint 10th International Conference on Informatics, Electronics & Vision (ICIEV) and 2021 5th International Conference on Imaging, Vision & Pattern Recognition (icIVPR).

论文原文 ¶

关键词 ¶

深度学习；CNN卷积网络

摘要 ¶

目前为止，有许多研究报道了不同情绪的大脑激活模式，但是大多数的研究只能使用二分类的技术把EEG记录的情绪分为4类，这显然是不够的。因此，作者设计了一种能够分64类情绪的复杂分类技术。使用卷积神经网络（CNN）对DEAP数据集进行处理，valence（警觉度）和arousal（唤醒度）这两种连续维度上，已经达到了96%的准确率。所有的模型都是通过1维的CNN来完成的。

引言 ¶

关于情绪的介绍这里就不多说了，反正就是情绪的外在表现是人为可以控制的，但是一些内部的信号却能够正确的反映情绪，例如EEG，体温、心电图等等。脑电图信号由以下子波段组成:Theta (3 - 7hz)、Alpha (8 - 13hz)、Beta (14 - 29hz)和Gamma (30 - 47hz)。单个子波与单个相关的身体活动相联系，例如，theta波与快速眼动睡眠、深度和原始情绪以及认知过程相关。现在有许多研究都在利用机器学习来识别EEG的情绪状态。但机器学习需要研究人员手动提取特征，这很消耗时间。特征提取的方法也多种多样，包括了快速傅里叶变换FFT，短时傅里叶变换STFT，离散小波变换等方法最为有效。用FFT分解EEG后，用深度学习模型应用于这些提取的特征，以便训练它们识别情绪，ML领域里，主要用支持向量机、线性和非线性回归、决策树等，而DL深度学习领域里，一般用的是CNN、LSTM长短期记忆模型等。该研究用的数据库是公开的脑电情绪数据库DEAP。大多数研究都是采用的二分类，把情绪分为效价和唤醒两个维度，从而构建了四种分类，但是为了更精确地识别情感，作者研究了64个情绪空间，其中存在许多现实生活中地情感。文章的贡献主要是：1. 为情绪识别的二分类带来了最好的准确性，使用的FFT和1D的CNN模型。2. 提出了情绪的8类分类方法，总共就有8×8=64类情绪的分类（这个有点太没必要了吧。。。）前人的研究这里也不再赘述了，反正就是使用了机器学习和深度学习的不同方法，哪些准确率如何。。。 DEAP数据集就包括了32个被试，采样率128Hz，每个被试佩戴40个点击的电极帽，看40个视频，给每个视频在四个维度上进行评分，因此每个人的数据就是40×40×8064个（8064=128×63秒），而标签就有40视频×4个评分维度个。比较重要的问题：为什么不直接把每个采样点的信号扔进去？回答：如果使用从数据集中提取特征而不是原始数据集中提取特征，则可以获得更好的分类精度。Feature extraction可以最小化重要信号的丢失，降低过拟合的风险，提高数据的可视化，降低实现的复杂性。因此先进行快速傅里叶变换，之后再把变换出来的值扔进去整个CNN模型包括4个卷积层和3个线性层。如图，参数在GitHub上也有：

2024-01-14-YXY-Fig1