多模态个性分析论文阅读笔记Investigating Audio,Video,and Text Fusion Methods for End-to-End Automatic Personality

文章目录 1. 总揽 2. 介绍 3. 方法论 3.1 Audio 特征提取 3.2 Text 特征提取 3.3 Video 特征提取 3.4 特征融合方法 3.4.1 决策级融合方法 3.4.2 截断全连接层 4. 实验以及结论 5.个人总结 1. 总揽 提出了一个三模态的模型结构用于从视频片段中预测大五性格 不同模态使用CNN, 三个模态提取出的特征使用 FC(全连接层)进行融合,特征提取,
相关文章
相关标签/搜索