Exploring EEG and eye movement fusion for multi-class target RSVP-BCI

deep learning papers

发布日期: 2026-04-08

No.8

标签：多类别目标RSVP-BCI、EEG与眼动融合、信息融合、脑机接口

前言

《Exploring EEG and eye movement fusion for multi-class target RSVP-BCI》
期刊：Information Fusion
年份：2025
分区：Q1，一区Top；IF：15.5
作者：Xujin Li, Wei Wei, Kun Zhao, Jiayu Mao, Yizhuo Lu, Shuang Qiu, Huiguang He
主要单位：Institute of Automation, Chinese Academy of Sciences

❗从单类 → 多类 RSVP（关键转变）
传统 RSVP：target vs non-target（2类）
现在：target-1 vs target-2 vs non-target（3类）
👉 难点：
🔥 难点1：EEG P300高度相似
论文明确说：不同 target 类别的 ERP latency 类似，但 amplitude 有差异
👉 本质：❌ EEG 很难区分类别；✅ 只能判断“是不是 target”
🔥 难点2：现有方法只用 EEG
👉 问题：EEG：认知信号（慢）；EM（眼动）：行为信号（快）
👉 但以前：❌ 没有 multi-class + EEG+EM dataset；❌ 没有针对 multi-class 的融合方法
✅ 作者核心思想：用 EM 补 EEG 的类别区分能力

一、研究背景与问题定位

1. 背景

传统RSVP-BCI系统只能检测单类别目标（二分类：目标 vs. 非目标），难以应对需要识别多种目标的复杂任务。
多类别目标RSVP任务要求系统同时检测目标是否存在，并区分其具体类别（如：民用飞机 vs. 军用飞机）。

2. 挑战

不同目标类别诱发的事件相关电位（ERP）相似度高，难以区分；
现有研究多依赖单一EEG模态，忽略了眼动信号中蕴含的丰富认知信息；
缺乏多模态多类别RSVP数据集。

二、模型架构

设计思路

MTREE-Net = 两模态特征提取 + 跨模态增强 + 理论引导融合 + 层级蒸馏

🔵 1. Feature Extractor（不是重点，但有设计）

EEG：Multi-scale CNN（多尺度时间建模）
👉 抓：P300（200–600ms）；不同频段
EM：单层卷积
👉 原因：EM 比 EEG 简单（论文明确说）

🔴 2. DCM（Dual-Complementary Module）⭐关键1

❗问题：模态不平衡
论文说：EEG 更强 → EM 学不好

✅ 解决：Cross-Attention
👉 双向信息流：
EEG → EM 教 EM
EM → EEG 补 EEG
⭐ 本质一句话：让两个模态互相“教对方”

🔴 3. CG-RM（Contribution-Guided Reweighting）⭐最核心

❗问题：传统 fusion 不合理
传统：feature concat → classifier
👉 问题：❌ 默认 EEG = EM 权重相同

✅ 作者关键 insight
👉 从 logits 出发：
𝑓(𝑥)=𝑓(𝑥𝑒𝑒𝑔)+𝑓(𝑥𝑒𝑚)
🔥 关键解释
👉 每个模态对分类都有“贡献”
👉 如果：EEG logits 高 → EEG 更重要；EM logits 高 → EM 更重要
⭐ 定义贡献𝑐𝑒𝑒𝑔,𝑐𝑒𝑚 → 再变成比例：𝑟𝑒𝑒𝑔,𝑟𝑒𝑚
⭐ 然后训练一个网络：𝜙(𝑥𝑒𝑒𝑔,𝑥𝑒𝑚)→权重；目标：让预测权重 ≈ 理论贡献

🔥 核心创新 👉 用理论贡献监督 fusion 权重
不是：loss 自动学；而是：理论指导学习