2020华为杯C题:面向康复工程的脑电信号分析和判别模型

面向康复工程的脑电信号分析和判别模型

背景和意义

大脑是人体中高级神经活动的中枢,拥有着数以亿计的神经元,并经过相互链接来传递和处理人体信息。脑电信号按其产生的方式可分为诱发脑电信号和自发脑电信号。诱发脑电信号是经过某种外界刺激使大脑产生电位变化从而造成的脑电活动;自发脑电信号是指在没有外界特殊刺激下,大脑自发产生的脑电活动。算法

(1)诱发脑电信号(P300脑-机接口)

在平常生活中,人的大脑控制着感知、思惟、运动及语言等功能,且之外围神经为媒介向身体各部分发出指令。所以,当外围神经受损或肌肉受损时,大脑发出指令的传输通路便会受阻,人体将没法正常完成大脑指令的输出,也就失去了与外界交流和控制的能力。研究发现,在外围神经失去做用的状况下,人的大脑依旧能够正常运行,并且其发出指令的部分信息能够经过一些路径表征出来。脑-机接口技术旨在不依赖正常的由外围神经或肌肉组织组成的输出通路的通信系统,实现大脑与外部辅助设备之间的交流沟通。
P300事件相关电位是诱发脑电信号的一种,在小几率刺激发生后300毫秒范围左右出现的一个正向波峰(相对基线来讲呈现向上趋势的波)。因为个体间的差别性,P300的发生时间也有所不一样,图1表示的是在刺激发生后450毫秒左右的P300波形。P300电位做为一种内源性成分,它不受刺激物理特性影响,与知觉或认知心理活动有关,与注意、记忆、智能等加工过程密切相关。基于P300的脑-机接口优势是使用者无需经过复杂训练就能够得到较高的识别准确率,具备稳定的锁时性和高时间精度特性。
工具

图1 P300波形示意图性能

(2)自发脑电信号(睡眠脑电)

睡眠是身体休整积蓄能量的重要环节,睡眠质量对人的身心状态也有着重大影响。如何提升睡眠质量,减小睡眠相关疾病对健康的影响,日益受到普遍关注。睡眠过程当中采集的脑电信号,属于自发型的脑电信号。自发型的睡眠脑电信号可以反映身体状态的自身变化,也是用来诊断和治疗相关疾病的重要依据。
睡眠过程是一个动态变化的复杂过程。在国际睡眠分期的判读标准R&K中,对睡眠过程当中的不一样状态给出了划分:除去清醒期之外,睡眠周期是由两种睡眠状态交替循环,分别是非快速眼动期和快速眼动期;在非快速眼动期中,根据睡眠状态由浅入深的逐步变化,又进一步分为睡眠I期,睡眠II期,睡眠III期和睡眠IV期;睡眠III期和睡眠IV期又可合并为深睡眠期。图2给出了不一样睡眠分期对应的脑电信号时序列,自上而下依次为清醒期、睡眠I期、睡眠II期、深睡眠和快速眼动期。从图2中能够观察到,脑电信号在不一样睡眠分期所呈现的特色有所不一样。基于脑电信号进行自动分期,可以减轻专家医师的人工负担,也是评估睡眠质量、诊断和治疗睡眠相关疾病的重要辅助工具。
学习

(a) 清醒期测试

(b) 睡眠I期spa

© 睡眠II期设计

(d) 深睡眠期接口

(e) 快速眼动期
图2 各睡眠分期的睡眠脑电信号时序列
事件

课题任务

本赛题包含2个附件(数据文件),四个课题任务。具体说明以下,
附件1:P300脑机接口实验数据
提供了5个健康成年被试(S1-S5)的P300脑机接口实验数据,平均年龄为20岁。在实验的过程当中,要求每一位被试(被测试者)集中注意力。P300脑机接口实验的设计以下:每位被试可以观察到一个由36个字符组成的字符矩阵,如图3所示,字符矩阵以行或列为单位(共6行6列)。每轮实验的设计流程:首先,提示被试注视“目标字符”,例如在图3的字符矩阵上方,出现的灰色字符“A”;其次,进入字符矩阵的闪烁模式,每次以随机的顺序闪烁字符矩阵的一行或一列,闪烁时长为80毫秒,间隔为80毫秒;最后,当全部行和列均闪烁一次后,则结束一轮实验。在被试注视“目标字符”的过程当中,当目标字符所在行或列闪烁时,脑电信号中会出现P300电位;而当其余行和列闪烁时,则不会出现P300电位。上述实验流程为1轮,共重复5轮。

图片

图3 字符矩阵界面

每位被试的P300脑电数据包含有4个文件,具体说明以下,
train_data:训练用数据;
train_event:训练数据的事件标签;
test_data:测试用数据;
test_event:测试数据的事件标签。
训练用数据包括12个已知目标字符的数据(char01char12),测试用数据包括10个待识别目标字符的数据(char13char22)。每一个字符矩阵闪烁实验中,脑电数据表格包含有20列(每列表示1个记录通道,记录通道依次进行编号,表1为记录通道的标识符,图5对应了记录通道的位置),脑电数据表格的行表示样本点数据,采样频率为250Hz。信号采集设备设置了参考电极和接地电极,即记录通道的信号为做用电极与参考电极之间的差值。




表1采集通道的标识符
标识符 通道
名称 标识符 通道
名称
1 Fz 11 CP5
2 F3 12 CP6
3 F4 13 Pz
4 Cz 14 P3
5 C3 15 P4
6 C4 16 P7
7 T7 17 P8
8 T8 18 Oz
9 CP3 19 O1
10 CP4 20 O2












图5 脑电信号采集通道图
训练数据中的标签文件一样是以子表形式与实验数据相对应,子表的名称为“charXX(Y)”,XX对应相应字符的序列号,Y表示实际的目标字符。子表的内容包含了两列,第一列表示标签,第二列为采样点序号。每轮实验的起始标签为目标字符对应的标识符(字符矩阵中36个字符的标识符详见表2,如“101”表示“A”),接下来为闪烁的行或列的标识符(详见图6,如“2”表示第2行,“9”表示第3列),一轮实验的结束标签为“100”。在训练数据的事件标签文件中,第一行给出了目标字符的标识符和对应的采样点序号,接下来是随机闪烁的行和列的标识符和对应的采样点序号,每轮实验以“100”标识符结束,共重复5次;
测试数据中的标签文件一样是以子表形式与实验数据相对应,子表的名称为“charXX”,XX对应相应字符的序列号。在测试数据的事件标签文件中,第一行给出了待识别目标字符的标识符,统一表示为“666”,须要经过对脑电信号进行分析后,获得出现P300电位的行和列,并判断获得目标字符的识别结果。
表2 字符矩阵的标识符
A 101 B 102 C 103 D 104 E 105 F 106
G 107 H 108 I 109 J 110 K 111 L 112
M 113 N 114 O 115 P 116 Q 117 R 118
S 119 T 120 U 121 V 122 W 123 X 124
Y 125 Z 126 1 127 2 128 3 129 4 130
5 131 6 132 7 133 8 134 9 135 0 136








图6行/列的标识符
附件2:睡眠脑电数据
提供3000个睡眠脑电特征样本及其标签,取自不一样的健康成年人整夜睡眠过程。第一列为“已知标签”,用数字形式来表示不一样的睡眠分期:清醒期(6),快速眼动期(5),睡眠I期(4),睡眠II期(3),深睡眠期(2);第二至五列为从原始时序列中计算获得的特征参数,依次包括“Alpha”,“Beta”,“Theta”,“Delta”,分别对应了脑电信号在“8-13Hz”,“14-25Hz”,“4-7Hz”和“0.5-4Hz”频率范围内的能量占比,特征参数单位为百分比。
根据以上附件所给出的数据来源和实验数据,请研究如下问题:
问题一:在脑-机接口系统中既要考虑目标的分类准确率,同时又要保证必定的信息传输速率。请根据附件1所给数据,设计或采用一个方法,在尽量使用较少轮次(要求轮次数小于等于5)的测试数据的状况下,找出附件1中5个被试测试集中的10个待识别目标,并给出具体的分类识别过程,可与几种方法进行对比,来讲明设计方法的合理性。
问题二:因为采集的原始脑电数据量较大,这样的信号势必包含较多的冗余信息。根据图5和表1,在20个脑电信号采集通道中,无关或冗余的通道数据不只会增长系统的复杂度,且影响分类识别的准确率和性能。请分析附件1所给数据,并设计一个通道选择算法,给出针对每一个被试的、更有利于分类的通道名称组合(要求通道组合的数量小于20大于等于10,每一个被试所选的通道能够不相同,具体的通道名称见图5和表1)。基于通道选择的结果,进一步分析对于全部被试都较适用的一组最优通道名称组合,并给出具体分析过程。为了方便参赛者对最优通道组合进行选择,赛题给出了测试数据(char13-char17)的结果,它们的字符分别是:M、F、五、二、I。
问题三:在P300脑-机接口系统中,每每须要花费很长时间获取有标签样原本训练模型。为了减小训练时间,请根据附件1所给数据,选择适量的样本做为有标签样本,其他训练样本做为无标签样本,在问题二所得一组最优通道组合的基础上,设计一种学习的方法,并利用问题二的测试数据(char13-char17)检验方法的有效性,同时利用所设计的学习方法找出测试集中的其他待识别目标(char18-char22)。
问题四:根据附件2中所给出的特征样本,请设计一个睡眠分期预测模型,在尽量少的训练样本的基础上,获得相对较高的预测准确率,给出训练数据和测试数据的选取方式和分配比例,说明具体的分类识别过程,并结合分类性能指标对预测的效果进行分析。






思路分析

今年题目简单
这题无非是, 分类, 关联分析, 回归问题
逐个解决便可, 有些问题其实这几年的paper已经给出解决方法了
须要的留言
在这里插入图片描述

相关文章
相关标签/搜索