文件大小:1.18M
摘要:草莓状黄铁矿作为古海洋氧化还原环境重建的重要指标,针对草莓状黄铁矿扫描电镜图像背景同质化和目标边界模糊问题,该研究构建了一个草莓状黄铁矿语义分割数据集(PSS),并提出了融合ViT与Vision Mamba(ViM) 的改进型Mask2Former模型——ViTM-Mask2Former。通过ViT的全局注意力机制来捕获长距离依赖关系,结合Vision Mamba提取位置敏感的边缘特征,创新性地引入区域特征注意力模块(RFA)进行特征细化;通过引入特征融合模块,将区域特征和边缘特征有效结合。实验结果表明,改进模型在PSS测试集上mIoU达到78.07%,性能优于主流模型,有效满足实际应用需求。
文章目录
1 数据集制作
2 模型设计
2.1 Mask2Former 架构
2.2 ViT Block 编码器模块
2.3 ViM Block模块
2.4 区域特征注意力模块
2.5 Gate Fusion模块
3 实 验
3.1 实验设置
3.2 评估指标
3.3 实验结果与分析
4 结 论