深度学习驱动的多模态情感识别框架与应用

PDF文件

1.17MB | 更新于2025-01-16 | 74 浏览量 | 举报收藏

立即下载

"本文主要探讨了多模态人类情感识别的深度学习框架，研究来自埃及吉萨开罗大学和尼罗河大学的研究团队提出的新方法。该框架利用3D卷积神经网络(3D-CNN)从脑电图(EEG)和人脸视频数据中提取时空特征，并结合数据增强和集成学习技术进行融合预测。" 本文的研究集中在多模态情感识别，这是一个在人机交互领域至关重要的课题。研究人员提出了一种创新框架，它综合运用3D-CNN深度学习架构，通过处理EEG信号和人脸视频数据来捕捉情感变化的时空特性。3D-CNN被用来分析EEG信号，而人脸情感识别则通过Mask-RCNN进行对象检测，随后利用支持向量机(SVM)对人脸区域的3D-CNN特征进行分类。在提出的框架中，数据增强和集成学习技术如装袋(Bagging)和堆叠(Stacking)被用于融合预测，提高识别准确性。特别是堆叠融合技术显示出了最高的识别准确率。实验结果显示，使用网格搜索的集成学习技术，融合方法在识别效价和唤醒类情感时分别达到了96.13%和96.79%的准确率，超过了现有多模态情感识别领域的最佳成果。情感识别的准确性对于理解和响应用户的需求至关重要，尤其是在人机交互和客户服务等场景中。例如，通过对顾客面部表情的识别，可以评估他们对餐厅环境的满意度，从而提升服务质量。在本文中提到的系统中，预先训练的深度卷积神经网络(CNN)模型被用于此目的，显示了深度学习在情感分析领域的潜力。此外，研究还强调了迁移学习和数据扩充在提高模型泛化能力上的作用，这些技术能够帮助模型更好地适应不同来源和多样性的数据，从而提升多模态情感识别的性能。最后，该研究遵循了CCBY-NC-ND许可证，确保了研究成果的开放获取和合理使用。这篇论文展示了深度学习如何在多模态情感识别中发挥核心作用，为该领域的未来研究提供了有价值的理论和技术基础。通过结合多种输入源并优化融合策略，研究人员提高了情感识别的精确度，这对于开发更加智能和人性化的交互系统具有重要意义。

埃及信息学杂志

（

2021

）

167

用于多模态情感识别

Elham S.Salama

，Renda A.作者：El-Khoribi

，Mahmoud E.穆罕默德·舒曼Wahby Shalaby

，

埃及吉萨开罗大学计算机和人工智能学院

埃及吉萨尼罗河大学智能工程系统研究中心（

SESC

）

阿提奇莱因福奥

文章历史记录：

2019年12月29日收到

2020

年

月

日修订

2020年7月24日接受

在线预订2020年

关键词：

脑电图

面部表情

多模态情感识别深度学习

迁移学习数据扩充

包围学习法

A B S T R A C T

人类情感识别是当前许多人机交互领域的一项重要任务。提出了一种新的多模态人类情感识别框架。该方案首

先利用3D卷积神经网络（3D-CNN）深度学习架构从脑电图（EEG）信号和人脸视频数据中提取时空特征。

然后，结合数据增强，集成学习技术，提出了最终的融合预测。在所提出的方案中的多模态的融合进行使用数

据，和得分融合方法。因此，三种人类识别方法被建立来实现所提出的目标。它们分别是基于脑电信号的情感

识别方法、基于人脸的情感识别方法和基于融合的情感识别方法。对于EEG方法，3D-CNN用于获得EEG信号

的最终预测对于面部方法，首先利用Mask-RCNN对象检测然后，利用支持向量机（SVM）分类器对人脸块的

3D-CNN输出特征进行分类。对于基于融合的情感识别方法，实验了两种融合技术：装袋和堆叠。结果表明，

叠加技术的识别准确率最高，采用网格搜索集成学习技术，由于将权重从EEG和人脸方法转移到基于融合的情

感识别方法，分别实现了效价和唤醒类的96.13%和96.79%的识别准确率该方法优于多模态情感识别领域的最

新研究成果。

开罗大学法律系这是一篇CC BY-NC-ND许可证下的开放获取文章（http：//creative-

commons.org/licenses/by-nc-nd/4.0/

）上提供。

介绍

情绪在人类生活中扮演着重要的角色。它们影响他们的生理和心理

状态。情绪可以用来评价顾客对餐馆环境的印象正如作者在[1]中所

说。他们提出了一个基于面部表情识别的评级系统，该系统使用预训练

的深度卷积神经网络（CNN）模型。食物和环境应该在他们的系统中被

评级。他们的系统由Android移动应用程序、Web服务器和预训练的AI

服务器组成。Shanok等人。[2]利用自闭症儿童的情绪识别。他们的研

究结果表明，TD儿童在情绪识别系统上更熟练，

通讯作者。

电子邮件地址：

elham. fci-cu.edu.eg（E.S. Salama）。

开罗大学计算机和人工智能系负责同行审查

而ASD儿童识别熟悉的表达比不熟悉的表达更准确。情绪识别是一个人

识别其他人每时每刻的感受并理解他的感受和表达之间的联系的能力。

Ekman

等人

[3]

定义了六种基本情绪，即快乐、悲伤、惊讶、恐惧

和愤怒。他证明了人类感知这些情绪，而不管他们的文化。情感可以

用两个正交维度来表达：效价和唤醒，如费尔德曼等人所述

[4]

的文

件。他说，每个人都可以用不同的方式表达自己的情感。当有人被要

求表达周期性情绪时，这种差异就被清楚地注意到了效价范围从愉快

到不愉快，唤醒范围从平静到兴奋。在所提出的工作中，作者打算将

输入实例分类为效价和唤醒的二元组合

;

低

高效价或低

高唤醒。

Mehrabian

等人

[5]

认为面部表情能表达整体印象的占

55%

，发声

部分能表达整体印象的占

38%

，

https://doi.org/10.1016/j.eij.2020.07.005

由

Elsevier BV

代表开罗大学计算机和人工智能学院出版。这是一篇基于

CC BY-NC-ND

许可证的开放获取文章

（

http://creativecommons.org/licenses/by-nc-nd/4.0/

）。

可在ScienceDirect上获得目录列表

埃及信息学杂志

杂志主页：

www.sciencedirect.com

下载后可阅读完整内容，剩余9页未读，继续阅读

开通会员，免费下载（低至0.43元/天)

成为会员后, 你将解锁

下载资源随意下

优质VIP博文免费学

优质文库回答免费看

付费资源9折优惠

cpongm

粉丝: 6

深度学习驱动的多模态情感识别框架与应用

面向深度学习的多模态情感识别研究进展.docx

deep-learning-for-sentiment-analysis:多模态情感分析的深度学习

论文研究-基于深度模态融合网络的多模态情感识别 .pdf

多模态视频情感识别技术及Pytorch实现

多模态情感识别中的深度学习框架选择：TensorFlow vs PyTorch的深度对比

多模态语音情感识别python

情感分析在多模态数据驱动下的深度学习模型研究.docx

深度模态融合网络在多模态情感识别中的应用

深度解读多模态情感识别：数据集构建与预处理的终极秘籍

多模态情感识别模型对比分析：2021年度最佳实践的深度剖析

多模态情感识别模型构建：专家手把手教程

多模态情感识别模型的强化学习应用：自动化调整与优化的实战技巧

多模态情感识别项目实战：数据集选择与模型调优的实战经验

多模态情感识别模型优化技巧：减少过拟合与提升速度的专业指导

多模态情感识别模型的边缘计算优化：实时性与低延时的实现方法

打造你的多模态情感识别系统：从选择数据集到模型部署的完整流程

多模态命名实体识别，多模态关系抽取，方面级情感分析，多模态反讽识别

多模态情感识别数据集

多模态情感识别分类系统

多模态脑电情绪识别

WORD的查找和替换符（通配符和特殊格式控制符）

最新资源