基于肢体动作的抑郁症识别研究

抑郁症是世界范围内普遍存在的严重精神障碍疾病,其特征通常表现为连续且长期的心情低落、情绪消沉,思维迟缓和认知功能损害,身体selleck激酶抑制剂活动能力受损等。现有的抑郁症识别诊断过程相对主观且复杂,客观有效的辅助诊断方法有待探索研究。由于长期遭受抑郁症的影响,患者肢体动作的临床表现有反应迟钝gastroenterology and hepatology、动作迟缓、躯体活动协调能力下降等特点。本文主要基于人体骨架数据及RGB视频数据中的肢体动作信息对抑郁症识别方法展开研究,主要工作为:(1)基于动作骨架数据及反应时特征的抑郁症识别。本实验使用Kinect V2设备记录了抑郁症患者与非抑郁症患者25个肢体关节点的简单运动学骨架数据。直接从记录的原始Kinect-3D坐标中提取呈现的时空特征和低级特征。针对抑郁症患者反应迟钝、动作迟缓以及身体活动协调能力减弱的症状,基于动作骨架时序信息并配合采集提取的现场音频信息进行数据预处理得到动作样本的反应时特征。同时为Transformer模型结构加入这一特征来辅助模型的识别分类,从而使深度学习模型取得了更好的抑郁症识别效果。新的Transformer-Reac T模型达到了72.97%的准确率。(2)基于动作视频数据的抑郁症识别。本实验在Kinect V2设备记录的原始数据中提取保存RGB视频数据并捕捉其肢体动作信息。通过计算样本动作时间的平均值与标准差确定动作视频片段并确定取帧范围。通过对动作视频特征的分析,最终确定以三维卷积神经网络(3DCNN)模型结构提取视频数据中的时空维度特征,并接着将序列特征输入Transformer模型的Encoder结构,通过多头注意力机制综合提取序列信息。本selleckchem GW4869文的3DCNN-Transformer模型较对比的其他深度学习模型取得了分类效果的提高,达到了82.93%的识别准确率。本文通过对提取的抑郁症患者与非抑郁症患者的动作骨架和视频两类数据的预处理及构建识别模型,期望探索科学的抑郁症识别方法,用于辅助精神医生客观而准确地进行抑郁症检测。