近日,通信工程学院智能信息计算团队研究成果《Feature Boosting and Scale-Aware Network with Multi-modal Information for Underwater Salient Object Detection》被人工智能领域期刊《Engineering Applications of Artificial Intelligence》(中科院一区TOP期刊)接收并在线发表。该论文的学生第一作者为我院23级硕士研究生陆俊哲,指导老师为王廷宇助理研究员和颜成钢教授。
水下显著性目标检测(Underwater Salient Object Detection, USOD)是海洋工程领域的核心底层视觉技术,在海洋资源开发、水下环境监测、水下智能作业等场景中发挥着至关重要的作用。随着我国海洋经济战略提出,海洋工程技术对水下视觉感知的精度、鲁棒性与环境适应性提出了愈发严苛的要求。受水下复杂成像环境制约,光线吸收与散射、悬浮颗粒干扰和非均匀照明等因素,导致水下图像普遍存在对比度低、色彩偏移与细节模糊等严重退化问题。同时,水下多源成像数据普遍存在固有噪声与模态间信息冲突,给多模态数据的有效融合带来了巨大挑战。此外,现有主流方法对水下目标广泛存在的尺度剧烈变化问题缺乏针对性设计,难以兼顾全局语义定位与局部细节恢复,无法实现对复杂尺度变化的稳定分割。

为解决这些问题,该文提出了一种特征增强与尺度感知网络,围绕水下退化鲁棒性提升与多尺度特征有效融合两大核心方向,构建了 “水下特征增强” 与 “尺度感知迭代融合解码” 双阶段完整技术框架,系统性地解决了复杂水下场景下显著目标检测的多项核心难题。该方法在 USOD10K、COD10K和USOD 三大主流数据集上的系统性对比实验结果表明,所提出的 FBS-Net 算法综合性能处于当前水下显著目标检测领域的领先水平。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。
图文:陆俊哲
一审:王廷宇
二审:邱一波
三审:孙闽红
