基于融合编码策略与通道增强的声音事件定位与检测

2025-06-11 1570 1.09M 0

　　摘要：在三维声音事件定位与检测任务中，多声音事件的重叠导致无法从复杂信号当中有效地提取出每个声源的特征，此外为满足实际需求，在声音事件定位与检测任务当中引入距离估计任务，这增加了任务处理难度。针对上述问题，该文提出基于融合编码策略与通道增强的声音事件定位与检测算法，利用融合编码策略让模型能够将不同编码策略的特征进行自适应融合，增强对复杂信号中关键特征的提取能力；且根据声学信号在频域上表现出不同的频率分布和能量集中度的特性，结合离散余弦变换从通道维度出发，对信号的重要频率进行加权，学习每个通道不同频率的重要性，加强模型在频域上的建模，提升模型对关键信号的捕捉能力。实验结果表明，该文提出的模型性能要优于基线模型，当引入距离估计任务时，提出算法综合性能优于部分现有模型，为三维声音事件定位与检测任务提供了新的思路。

　　文章目录

　　0 引言

　　1 基于FCS与CE的模型

　　1.1 FCS模块

　　1.2 基于DCT的CE模块

　　2 实验分析

　　2.1 数据集

　　2.2 数据增强

　　2.3 评价指标

　　2.4 实验分析与讨论

　　3 结论

您还没有登录，请登录后查看详情

声音事件定位与检测距离估计融合编码策略通道增强离散余弦变换

下一篇：面向IP承载网的数模双驱动孪生网络系统架构研究
上一篇：过程评价严控高校思政教育内涵质量对策研究

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注4
~~没有留下签名~~~~

本类推荐

	基于DRL的多服务器接入边缘计算卸载与资源调度
	基于混合深度学习架构的WiFi指纹室内定位方法
	基于专利分析的6G天地一体化网络调制技术发展研究
	基于改进Real-ESRGAN的毫米波雷达图像增强算法
	基于可见光通信的光互连关键技术研究
	车载和船载测控设备馈源校相研究
	基于TS-OMP的IRS辅助毫米波大规模MIMO信道估计方案
	标签稀缺及低信噪比条件下的辐射源驱动频谱状态感知
	基于MLFFNN的相控阵馈源波束合成方法
	基于近场聚焦原理的双层全金属惠更斯超表面透镜天线

下载排行