07脑电数据预处理与批处理的实现


脑电数据预处理

一、预处理与批处理

预处理:对原始数据进行改变的操作;目的是去噪声,去掉不需要的信号。

1.导入数据

原始数据导入 cnt, vhdr, edf, bdf, set, eeg, mat等格式,导入后数据结构为EEG结构体,包含数据矩阵、采样率、通道信息、事件信息等。

img

2.定位电极

给每个电极点添加坐标
labels only: 只有每个电极的名字,不知道每个电极在头上的位置

labels + coordinates: 每个电极的名字和坐标,知道每个电极在头上的位置

重参考: 把每个电极的电位值减去一个参考电极的电位值,得到相对于参考电极的电位值;常用的参考电极有:平均参考、双耳参考、鼻梁参考等。

3.剔除无用电极

厂商的游离电极,眼电、肌电、egi一些不在头皮上的电极点

4.滤波

滤除掉高频的噪声低频的漂移,只留下我们需要研究的信息所在的频段

采样定理:采样频率必须至少是信号中最高频率的两倍,才能保证信号的完整性和准确性;如果采样频率过低,就会出现混叠现象,导致信号失真;如果采样频率过高,就会增加数据量和计算负担。

一般250Hz采样率足够。

滤波的几种操作:

  • 高通滤波:设置一个下限,高于它的通过,比方说设置一个0.1Hz
  • 低通滤波:设置一个上限,低于它的通过,比方说设置一个70Hz
  • 带通滤波:同时设置一个上下限(范围),在这个范围内的,通过,比如0.1~70Hz
  • 凹陷滤波:设置一个范围,在这个范围内的,不通过50Hz的工频干扰,设置一个范围48~52Hz

滤波是对数据改善最明显的一个步骤,拿到数据以后,建议直接从滤波后看起;
也有一些分析会只做滤波,就直接进行后面的分析(极少)。

关于滤波范围的选取:
下限(高通滤波)的选取,ERP研究,下限建议是0.1Hz,再高的下限可能会导致失真严重(luck),越低的下限,滤波时间越长;
上限(低通滤波),做的研究,70Hz,数据质量,在你不确定自己研究的所需要的滤波范围的时候,如果只做ERP研究,那就40Hz或者30Hz
凹陷滤波:不要忘了
滤波一般只建议在连续数据上做,主要是高通在分段数据上做会产生大量的伪影,分段以后最多只能补一个低通滤波

常见的滤波范围(看文献决定):

  • 只做ERP分析,尝试0.140Hz(30Hz),0.530(40)Hz 1~30Hz
  • 想做时频,脑网络,0.570Hz,0.170Hz(优选的滤波范围)
  • 脑网络,微状态:2~20Hz(极少数)
  • itc: 3~100Hz

工频干扰的操作:48-52Hz凹陷滤波,或者直接设置一个上限为40Hz的低通滤波

5.分段(可在此步骤保存数据)

  • 分段需要在滤波之后,建议取长一点,如果只做ERP的话,可以取[-0.20.8],[-0.2,1],[-0.5,1.5]

  • 剪基线:把每个分段的前200ms或者100ms的平均值减去每个分段的所有时间点,得到基线校正后的数据;是一个无害的操作,无论多少次都可以

  • 如果需要做时频的话,基线需要取足够长,至少0.5s

  • 后面会讲刺激后的选取,如果需要用到反应marker,那么考虑一下长度

6.伪迹拒绝vs伪迹校正 (插值坏导和剔除坏段)

  • 伪迹拒绝:把有伪迹的分段直接剔除掉,适合数据质量较好的情况,或者对数据量要求不高的情况;缺点是可能会丢失大量的数据,导致统计分析的效能降低
    ➡️剪坏段(看数据的时候注意比例尺,60左右)

  • 伪迹校正:把有伪迹的分段进行校正,适合数据质量较差的情况,或者对数据量要求较高的情况;常用的方法有独立成分分析(ICA)、信号空间投影(SSP)等;缺点是可能会引入一些误差,导致结果不准确

img
这部分信号波动是眼动
img
这部分是坏段,剪掉

插值坏导,是在空间上,用周围的点代替它

7. ICA

“盲源分离”

默认有多少个通道,就会有多少个独立成分,独立成分的数量和通道数量相同; 每个独立成分都是一个时间序列,代表了一个独立的信号源;每个独立成分都有一个空间分布,代表了它在头皮上的投影;通过观察独立成分的时间序列和空间分布,可以判断它是否是一个伪迹成分,如果是,就可以把它从数据中去掉.

8. 剔除眼动成分等,如眨眼,眼漂,明显噪声

常见伪迹:

  • 眼动
img
  • 眼漂
img
  • 头动
img
  • 工频干扰(滤波时候已经滤掉)
img
  • 心电
img

尽量只去百分百确定的(眼电)
没去掉的噪声,是可以后期叠加以后抵消掉
去掉的信号,是回不来的

img
眼漂成分,可以选择去掉,不去掉可能会有一些残留的伪迹

9. 重参考

重新选择参考电极,建议最后进行

在线参考: 用于采集,获取数据,一定要使用一个比较稳定的点做在线参考,推荐大脑中线位置 Cz
不推荐:使用单侧乳突,不推荐其它某些离谱的参考点

  • 双极联参考,以两个电极的电位差作为参考,数据质量非常的好,噪声全没了,信号大部分也没了;
  • 双侧参考,两侧;
  • 对侧参考;

重参考的目的:
1.跟前人文献做比较(最重要)
2.凸显实验效应

常见的几种参考方式

  • 双侧乳突参考:大部分REP实验,TP9/TP10,M1&M2,A1&A2
  • 鼻尖参考:部分听觉实验会用到
  • 全脑平均参考:涉及全脑的分析,如功能连接,溯源
  • 零参考:与全脑平均参考的效果看起来差不多,也会出现在全脑分析上,也有溯源的案例,北师大的人喜欢用,需要独立的插件

双侧乳突参考:

img

重参考放在后面的理由:

  1. 如果参考点质量不好,有多种处理办法,全都基于我们看得见重参考点的前提下的
  2. 多种参考方式,可以在最后面全部做出来

关于参考点

  1. 双侧乳突是不能插值的,因为采集的数据类型不一样
  2. 参考点的质量特别重要,实验中及时发现问题
  3. 不同参考点的选择,依赖前人的领域惯例
  4. 不同的参考方式,不能够对比数据分析的结果
  5. 这是一个线性的操作,可以转参考,但是用哪个点参考,哪个点就不在数据里面了

NeuroScan有reference channel,插入一个参考点,数据就会有一个新的通道,重参考的时候,这个通道就会被去掉;如果没有reference channel,就会直接把参考点的电位值从数据中去掉,重参考的时候,这个点就不在数据里面了


脑电数据批处理实现


文章作者: zhen666wua
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 zhen666wua !
  目录