我院智能信息感知团队黄星儒课题组4篇论文被人工智能领域顶尖国际会议录用

发布者：洪晖发布时间：2026-03-03浏览次数：219

近日，通信工程学院智能信息感知团队传来喜讯，在短短4个月时间里，黄星儒课题组的4篇高水平学术论文被人工智能领域三大顶级会议CVPR（2篇）、AAAI、ICLR成功录用。课题组由黄星儒特聘研究员、刘瑾特聘副研究员、郑志文博士后等师生组成，4篇论文均以杭州电子科技大学为第一单位。此次多篇高水平论文的集中刊发，是我院智能信息感知团队深耕领域、厚积薄发的有力见证，体现了团队在智能信息感知领域深厚的技术积累与科研实力，为学院信息与通信工程学科的高质量稳步发展持续注入强劲创新活力。

论文一：Physically-Guided Optical Inversion Enables Non-Contact Side-Channel Attack on Isolated Screens (ICLR 2026)

该论文由通信工程学院研二学生乔宇恒及博士后郑志文担任共同第一作者，通讯作者为教师黄星儒、刘瑾、江劭玮。该论文是我院首次以第一单位在ICLR上录用的文章，目标是研究如何仅通过拍摄显示器发出的光线重建显示器显示内容。该研究开创性地提出了一种利用环境介质进行非接触式光学投影侧信道攻击的全新范式。在物理隔离等传统高安全环境中，攻击者无需与目标设备建立任何物理或网络连接，仅需远程捕获屏幕光线在邻近墙面形成的漫反射散斑图案，即可利用所提出的辐射度量反演神经网络架构IR4Net，高保真地重建出屏幕原始显示内容。这种方法非视距、无射频、无需通信链路，具有极高的隐蔽性和非侵入性，揭示了物理隔离环境中一个全新且被长期忽视的信息泄露渠道，对现有安全防御边界和策略提出了根本性反思。为克服从高度压缩、退化的漫反射投影中稳定重建屏幕图像的核心技术挑战，该研究提出了IR4Net模型。该模型将物理建模与深度学习先验深度融合，其核心由两个模块构成：物理正则化辐照度近似模块（PRIrr-Approximation）和不可逆性约束语义重投影模块（ICSR）。PRIrr-Approximation将非线性光场反演重构为一种物理引导、可学习的迭代轨迹，通过嵌入正向/反向传播物理模型来抑制微小扰动在反演过程中的放大，从而获得稳定的初始估计。ICSR模块则在深层语义空间中构建全局结构感知的映射，通过上下文驱动的语义补全规则，有效恢复因遮挡、衍射和不可逆压缩而丢失的全局语义结构和上下文信息，显著提升了重建图像的边缘连续性和语义保真度。研究在模拟网页、密码输入、图表和桌面场景的四类数据集上进行了系统评估。实验结果表明，IR4Net在峰值信噪比（PSNR）、结构相似性（SSIM）等关键指标上均显著优于现有的先进神经重建与生成方法。此外，模型在低光照衰减、相机运动与距离变化等复杂扰动条件下均展现出优异的鲁棒性。这项工作不仅证实了利用墙面漫反射作为有效光学侧信道进行屏幕内容重建的可行性，也为开发针对此类新型威胁的防护措施提供了重要理论基础和技术参照。

论文二：SLD-Net: Similarity-Consistent Likelihood Diffusion Enables Hidden Person Detection from Wall Reflections (CVPR 2026)

该论文由通信工程学院研二学生周浩及博士后郑志文担任共同第一作者，通讯作者为教师黄星儒、刘瑾、江劭玮。研究面向“拐角外不可直视区域”的人物感知：仅依赖普通相机在可见墙面上捕获的微弱间接反射扰动，即可实现对拐角后隐藏人员的检测、定位与重建。其核心困难在于：墙面观测容易受饱和、噪声与传感器非线性影响而不稳定；同时从墙面反射到隐藏视角RGB图像的映射严重欠定，纯判别式回归往往脆弱，而不受约束的扩散先验又具有随机性，难以保证同一观测对应唯一、可复现的结果。为此，该研究提出两阶段的SLD-Net框架，以“似然—先验”耦合的方式求解确定性后验：第一阶段DeLi-Inversion构建曝光感知的差分表示，并联合预测初始重建与像素级精度（置信度）图，形成异方差伪似然；第二阶段SiCo-Diffusion将该伪似然以精度加权能量项注入确定性的DDIM轨迹，并用退火的贝叶斯精度融合规则与扩散先验协同，使高置信区域更强地服从测量、低置信区域由先验补全细节，从而同时保证测量一致性与结构/纹理可信度，并输出对固定观测“唯一确定”的重建结果。该研究提出的方法在两套真实数据集Reflect-Corridor与Reflect-Room上进行系统评估，方法整体性能显著优于通用重建网络、物理启发模型与NLOS专用基线，在失真与感知类指标上均达到SOTA水平。该研究提出将“像素级不确定性建模的伪似然”与“扩散先验”以可解释的贝叶斯精度规则融合的确定性推断框架，提升了被动拐角感知在真实采集条件下的稳定性、可复现性与重建质量，最终可以精确地将拐角后的人物进行重建。

论文三：Wavefront-Constrained Passive Obscured Object Detection (AAAI 2026)

该论文由通信工程学院研二学生欧阳依薇及博士后郑志文担任共同第一作者，通讯作者为教师黄星儒、刘瑾、江劭玮，主要关注对拐角后遮挡目标的精确目标识别。该方法能够从中继墙上的微弱光学图样中，实现对视野之外被遮蔽目标的精确定位和分割。基于实值建模或局部卷积运算的多数现有方法难以刻画相干光传播的底层物理；并且在低信噪条件下，这些方法常会收敛到非物理解，严重削弱观测的稳定性与可靠性。为解决这些问题，研究提出一种物理驱动的波前传播补偿网络WavePCNet，用于模拟波前传播并增强对被遮蔽目标的感知。WavePCNet集成了三相位波前复传播重投影，通过引入复振幅传递算子精确约束相干传播行为，同时结合动量记忆机制，有效抑制扰动累积。此外，研究提出高频跨层补偿增强模块，以构建具备多尺度感受野的频率选择性通路，并动态建模跨层结构一致性，进一步提升模型在复杂环境下的鲁棒性与可解释性。基于四个实采数据集（OOD-DUTS、OOD-HKU、OOD-ECSSD、OOD-DUT-OMRON）的大量实验验证，WavePCNet在精度与鲁棒性上均取得领先表现。消融实验进一步证明波前复传播重投影与跨层补偿的互补作用，验证了“物理驱动的相干传播+频率感知结构增强”的协同优势，最后可以实现对拐角后遮挡目标的精确识别。

论文四：CROWn: A Unified Framework for Anti-Aliased Downsampling and Phase-Calibrated Fusion in 3D Medical Segmentation (CVPR 2026)

该论文由通信工程学院研二学生叶双华及教师黄星儒任共同第一作者，通讯作者为教师刘瑾、博士后郑志文，研究针对3D医学图像分割中因各向异性及异构重建导致的下采样混叠与特征错位难题，提出了Coset-fibRated micrO-local co-attention Network。该方法引入Microlocal Polyphase Co-Attentive Decimator模块，通过轴向感知的多相分析与显式抗混叠低通滤波，在降采样中精准路由边界高频信息并抑制伪影；同时配合Octaphase Coset Fibration模块利用空间深度转换与边缘门控相位注意力重构跳跃连接特征，实现了特征的精准对齐与结构增强。在涵盖CT、MRI及OCT的15个公开数据集上的广泛验证表明，所提出的CROWn模型在保持计算效率的同时，显著提升了分割的重叠率、拓扑一致性与边界精度，性能优于当前主流的SOTA方法。

CVPR，全称为IEEE/CVF计算机视觉与模式识别会议（IEEE/CVF Conference on Computer Vision and Pattern Recognition），是计算机视觉领域顶尖、最具影响力的年度学术会议。ICLR，全称为国际学习表征会议（International Conference on Learning Representations），是人工智能和机器学习领域的顶级国际会议，与NeurIPS、ICML并称为机器学习三大顶会，具有极高的学术影响力。AAAI（全称为AAAI Conference on Artificial Intelligence），由美国人工智能促进协会主办，是人工智能领域历史悠久的国际学术会议，始创于1980年。

【课题组成员简介】

黄星儒，杭州电子科技大学通信工程学院特聘研究员。本科毕业于北京邮电大学，博士毕业于英国伦敦玛丽女王大学。研究方向为深度学习、计算机视觉、医疗图像处理、大语言模型。现为国防大数据专业委员会委员，中国人工智能协会会员，中国指挥与控制学会高级会员。在NeurIPS、ICLR、CVPR（2篇）、Medical Image Analysis（4篇）、IEEE Transactions on Medical Imaging、IJCAI、AAAI等国际高水平学术期刊上发表SCI检索期刊论文68篇，包含中科院一区及CCF-A类会议期刊30篇，中科院二区期刊23篇，中科院TOP期刊25篇，ESI高被引论文2篇。以第一作者或通信作者（含共同）发表SCI索引文章及CCF-A类会议40篇，其中影响因子10分以上的期刊5篇。累计引用超过1200次。成果获中国指挥与控制协会科学技术进步二等奖。

刘瑾，杭州电子科技大学通信工程学院特聘副研究员，博士毕业于武汉大学遥感信息工程学院。主要研究方向包括计算机视觉、三维重建与理解、三维空间推理，以及生成式世界模型等。主持国家自然科学基金青年项目、浙江省自然科学基金青年项目等多项科研课题。曾获测绘科学技术特等奖、测绘科学技术二等奖、地理信息科技进步二等奖等。已在ISPRS、CVPR、ICCV、NeurIPS、ICLR、IJCAI、AAAI，以及《测绘学报》《遥感学报》等高水平期刊与会议发表论文20余篇，授权国内发明专利6项。现任Remote Sensing、Mathematics期刊客座编辑，并担任ISPRS、TGRS、CVPR、ICML、AAAI等十余个期刊/会议的审稿人。

郑志文，杭州电子科技大学通信工程学院博士后。长期围绕人工智能、模式识别与多模态感知开展系统研究，聚焦复杂观测条件下的稳健表征学习、跨设备与跨场景泛化、可解释融合与可信评测等关键问题。近五年发表/录用期刊与国际会议论文23篇，其中以第一作者或通讯作者（含共同通讯）发表21篇，涵盖IEEE TMC、IEEE THMS、ICLR、AAAI、IJCAI、CVPR、Medical Image Analysis、IEEE IoTJ、Information Fusion等重要期刊与会议。相关成果入选ESI高被引并获最佳论文奖，申请及授权发明专利6项，连续获得中国博士后科学基金面上与特别资助及国家自然科学基金青年项目支持。

【团队简介】

我院智能信息感知团队由江劭玮研究员担任团队负责人，团队依托杭州电子科技大学智能信息处理实验室（HDU IIPLab），实验室主任为颜成钢教授。实验室现有在职教师50余名，含5位国家级人才及多位省级人才；现有硕博生200余名，毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队，拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所（清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等）的联合培养机制，长期致力于智能信息处理方面的研究，主要研究方向包括：机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。