脑电数据预处理
一、预处理与批处理
预处理:对原始数据进行改变的操作;目的是去噪声,去掉不需要的信号。
1.导入数据
原始数据导入 cnt, vhdr, edf, bdf, set, eeg, mat等格式,导入后数据结构为EEG结构体,包含数据矩阵、采样率、通道信息、事件信息等。
2.定位电极
给每个电极点添加坐标
labels only: 只有每个电极的名字,不知道每个电极在头上的位置
labels + coordinates: 每个电极的名字和坐标,知道每个电极在头上的位置
重参考: 把每个电极的电位值减去一个参考电极的电位值,得到相对于参考电极的电位值;常用的参考电极有:平均参考、双耳参考、鼻梁参考等。
3.剔除无用电极
厂商的游离电极,眼电、肌电、egi一些不在头皮上的电极点
4.滤波
滤除掉高频的噪声和低频的漂移,只留下我们需要研究的信息所在的频段
采样定理:采样频率必须至少是信号中最高频率的两倍,才能保证信号的完整性和准确性;如果采样频率过低,就会出现混叠现象,导致信号失真;如果采样频率过高,就会增加数据量和计算负担。
一般250Hz采样率足够。
滤波的几种操作:
- 高通滤波:设置一个下限,高于它的通过,比方说设置一个0.1Hz
- 低通滤波:设置一个上限,低于它的通过,比方说设置一个70Hz
- 带通滤波:同时设置一个上下限(范围),在这个范围内的,通过,比如0.1~70Hz
- 凹陷滤波:设置一个范围,在这个范围内的,不通过,50Hz的工频干扰,设置一个范围48~52Hz
滤波是对数据改善最明显的一个步骤,拿到数据以后,建议直接从滤波后看起;
也有一些分析会只做滤波,就直接进行后面的分析(极少)。
关于滤波范围的选取:
下限(高通滤波)的选取,ERP研究,下限建议是0.1Hz,再高的下限可能会导致失真严重(luck),越低的下限,滤波时间越长;
上限(低通滤波),做的研究,70Hz,数据质量,在你不确定自己研究的所需要的滤波范围的时候,如果只做ERP研究,那就40Hz或者30Hz
凹陷滤波:不要忘了
滤波一般只建议在连续数据上做,主要是高通在分段数据上做会产生大量的伪影,分段以后最多只能补一个低通滤波
常见的滤波范围(看文献决定):
- 只做ERP分析,尝试0.1
40Hz(30Hz),0.530(40)Hz 1~30Hz - 想做时频,脑网络,0.5
70Hz,0.170Hz(优选的滤波范围) - 脑网络,微状态:2~20Hz(极少数)
- itc: 3~100Hz
工频干扰的操作:48-52Hz凹陷滤波,或者直接设置一个上限为40Hz的低通滤波
5.分段(可在此步骤保存数据)
分段需要在滤波之后,建议取长一点,如果只做ERP的话,可以取[-0.20.8],[-0.2,1],[-0.5,1.5]
剪基线:把每个分段的前200ms或者100ms的平均值减去每个分段的所有时间点,得到基线校正后的数据;是一个无害的操作,无论多少次都可以
如果需要做时频的话,基线需要取足够长,至少0.5s
后面会讲刺激后的选取,如果需要用到反应marker,那么考虑一下长度
6.伪迹拒绝vs伪迹校正 (插值坏导和剔除坏段)
伪迹拒绝:把有伪迹的分段直接剔除掉,适合数据质量较好的情况,或者对数据量要求不高的情况;缺点是可能会丢失大量的数据,导致统计分析的效能降低
➡️剪坏段(看数据的时候注意比例尺,60左右)伪迹校正:把有伪迹的分段进行校正,适合数据质量较差的情况,或者对数据量要求较高的情况;常用的方法有独立成分分析(ICA)、信号空间投影(SSP)等;缺点是可能会引入一些误差,导致结果不准确
插值坏导,是在空间上,用周围的点代替它
7. ICA
“盲源分离”
默认有多少个通道,就会有多少个独立成分,独立成分的数量和通道数量相同; 每个独立成分都是一个时间序列,代表了一个独立的信号源;每个独立成分都有一个空间分布,代表了它在头皮上的投影;通过观察独立成分的时间序列和空间分布,可以判断它是否是一个伪迹成分,如果是,就可以把它从数据中去掉.
8. 剔除眼动成分等,如眨眼,眼漂,明显噪声
常见伪迹:
- 眼动
- 眼漂
- 头动
- 工频干扰(滤波时候已经滤掉)
- 心电
尽量只去百分百确定的(眼电)
没去掉的噪声,是可以后期叠加以后抵消掉
去掉的信号,是回不来的
9. 重参考
重新选择参考电极,建议最后进行
在线参考: 用于采集,获取数据,一定要使用一个比较稳定的点做在线参考,推荐大脑中线位置 Cz
不推荐:使用单侧乳突,不推荐其它某些离谱的参考点
- 双极联参考,以两个电极的电位差作为参考,数据质量非常的好,噪声全没了,信号大部分也没了;
- 双侧参考,两侧;
- 对侧参考;
重参考的目的:
1.跟前人文献做比较(最重要)
2.凸显实验效应
常见的几种参考方式
- 双侧乳突参考:大部分REP实验,TP9/TP10,M1&M2,A1&A2
- 鼻尖参考:部分听觉实验会用到
- 全脑平均参考:涉及全脑的分析,如功能连接,溯源
- 零参考:与全脑平均参考的效果看起来差不多,也会出现在全脑分析上,也有溯源的案例,北师大的人喜欢用,需要独立的插件
双侧乳突参考:
重参考放在后面的理由:
- 如果参考点质量不好,有多种处理办法,全都基于我们看得见重参考点的前提下的
- 多种参考方式,可以在最后面全部做出来
关于参考点
- 双侧乳突是不能插值的,因为采集的数据类型不一样
- 参考点的质量特别重要,实验中及时发现问题
- 不同参考点的选择,依赖前人的领域惯例
- 不同的参考方式,不能够对比数据分析的结果
- 这是一个线性的操作,可以转参考,但是用哪个点参考,哪个点就不在数据里面了
NeuroScan有reference channel,插入一个参考点,数据就会有一个新的通道,重参考的时候,这个通道就会被去掉;如果没有reference channel,就会直接把参考点的电位值从数据中去掉,重参考的时候,这个点就不在数据里面了