2024.09.16-2024.09.22
每周文章分享
标题: Deep Color Compensation for Generalized Underwater Image Enhancement
期刊: IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 34, NO. 4, APRIL 2024.
作者: Yuan Rao , Wenjie Liu, Kunqian Li , Hao Fan , Sen Wang , and Junyu Dong.
分享人: 河海大学——俞顺
01
研究背景
水下图像增强(UIE)的目的是改善由于水下波长依赖的光吸收和散射而导致的水下图像退化的视觉质量。它在许多基于视觉的水下任务和机器人应用中发挥着重要作用。传统基于物理模型的方法由于简化光学成像模型的局限性,在复杂环境下难以准确估计传输图,造成效果不理想。基于深度学习的模型在多种环境下的处理效果显著优于传统模型,但在泛化性上仍旧是一个待解决的难题。以上问题主要由于水下场景的两个局限性:(1)域漂移:直接监督的UIE模型在推理过程中存在域漂移;(2)不平衡学习:目前流行的数据集分布不均匀。
02
关键技术
在本文中,作者研究了流行数据集中的色谱分布。利用直方图二次中心矩(CHSCM)表示图像中R、G、B颜色通道分布的偏差和色谱分布。从中发现目前流行的数据集表现出数据分布高度不均匀,而大多数自然图像具有良好的色谱分布,这解释了直接训练的深度UIE模型的不平衡学习限制,它倾向于处理颜色分布平衡良好的水下图像。
该方法的创新和贡献如下:
1)本文对水下图像进行了统计分析,发现流行的水下数据集分布不均匀,这是第一次尝试克服现有的基于学习的UIE模型的泛化瓶颈,而不需要重新训练。
2)引入了一种新的概率色彩补偿网络(P2CNet),该网络通过纹理和颜色的多尺度体积融合来估计水下图像中颜色的概率分布,为基于学习的方法提供了一个两阶段框架,使水下图像增强模型的输入分布变得“均匀”,提高模型泛化程度,实现“通用”的水下图像增强。
03
算法介绍T
(1)数据集数据分析
作者研究了UIEB和SUIM - E数据集的图像光谱分布。使用颜色直方图二次中心矩衡量数据集中的数据分布情况,直方图二次中心矩定义如下:
式中i为颜色通道,j为N个像素中的像素指数,µi为每个颜色通道的平均像素值,为平均像素值。CHSCM可以表示图像中R、G、B颜色通道分布的偏差,作者的研究结果表明UIEB和SUIM-E数据集的水下图像显示出水下条件的不平衡,超过44%和81%的图像CHSCM值分别小于25和50,表明数据分布高度不均匀。与之对比的是水上图像数据集COCO-test2017中,在总共40670幅图像中,高达90.4%的图像CHSCM小于25。这一研究在一定程度上解释了现有基于深度学习的UIE模型存在不平衡学习限制的原因,因为模型往往倾向于处理颜色分布平衡良好的水下图像。
(2)概率色彩补偿网络 P2CNet
P2CNet总体结构如图1所示。它包括四个步骤:色彩空间转换、特征提取、多尺度概率色彩补偿和色彩空间还原,通过对水下图像颜色的概率分布进行建模,来估计水下图像的颜色补偿。
图1 P2CNet总体结构
色彩空间转换模块将RGB图像转换为Lab色彩空间;特征提取模块利用CNN分别提取颜色和纹理特征;多尺度概率色彩补偿模块采用一种概率回归的方法估计颜色补偿;色彩空间还原模块利用原始亮度通道和补偿颜色通道重建RGB图像。
A. 色彩空间转换
RGB色彩空间具有较强的物理意义,R、G和B分量与颜色和纹理信息高度相关,这使得颜色补偿具有挑战性。而Lab颜色空间提供了一个有价值的解决方案,它依赖于与人类视觉感知一致的颜色模型,这个色彩空间使用三个不同的通道来表示图像:L代表亮度,其中包含了纹理信息,a、b分量代表色彩。本文以水下色彩补偿为研究重点,因此将水下图像从RGB色彩空间转换为Lab色彩空间,将色彩通道与亮度通道的水下纹理分离。
B. 特征提取
特征提取模块分为纹理编码器和颜色编码器两大部分,它们的网络结构完全相同。编码器由四个标准卷积层组成,这些层依次堆叠以提取分层特征。本模块的每个卷积层都遵循如图2所示的结构。
图2 编码器卷积层结构
C. 多尺度概率色彩补偿
作者提出了一种新的概率体积聚集(PVA)层,主要结构如图3所示用于聚合多源特征,并利用水下颜色和纹理线索建立颜色概率分布模型。
图3 PVA层结构
在PVA层中,首先将a和b通道的颜色强度分别采样为K等分,得到离散的ab颜色强度V,然后将多源特征输入经过多层感知器和softmax函数对图中的颜色概率分布进行建模,经过颜色期望函数和上采样,得到处理完毕的ab颜色图。
在多尺度概率色彩补偿模块中,作者在每个尺度上使用一个PVA层进行多尺度体积融合,以充分模拟跨特征相互作用,并以粗到细的方式预测颜色分布。对于第一个尺度层,用颜色特征和纹理特征对粗级ab颜色图进行回归。对于第2到第4个尺度层,将前一个PVA层回归的ab色图与当前尺度层的多源特征进行连接,逐步细化颜色分布和ab色图。
D. 色彩空间还原
在色彩空间还原模块中,使用输入图像的原始亮度L和补偿得到的ab颜色图恢复RGB图像,完成图像重建。
(3)两阶段水下图像增强框架
与大多数现有的端到端UIE模型不同,本文提出的方法为基于学习的方法提供了一个两阶段框架。在这个框架中,首先利用P2CNet来补偿水下图像的颜色分布,然后应用增强技术。这种两阶段方法提供了几个好处。首先,它允许将P2CNet与现有的UIE方法集成在一起时具有显著的灵活性,在不需要再培训的情况下提高它们的性能和泛化。其次,它能够用更平衡的颜色分布来补偿水下图像,这有利于传统基于物理模型的方法,能够在复杂场景下提供高质量的传输图估计。
04
实验结果分析T
1. 实验设置
作者在三个数据集下对本文提出的模型进行了仿真实验,分别为SUIM数据集、UIEB挑战数据集和U45数据集。评价指标方面,本文使用了三种非参考评价指标,分别为UCIQE、UIQM和FDUM。其中UCIQE是基于Lab空间的色度、对比度和饱和度来模拟人类对退化的水下图像的色度变化的感知;UIQM考虑了HSV色彩空间中水下的色彩、对比度和清晰度;FDUM评估水下图像的色彩、对比度,使用基于空间频率的颜色和DCP加权对比度测量的清晰度。对比对象中,本文选用了无模型方法RGHS,基于传统物理模型的方法DCP、UDCP,以及五种基于深度学习的模型UNet、WaterNet、Ucolor、CLUIE和SGUIE。
2. 两阶段框架提升测试
作者测试了所有方法在提出的两阶段框架中的表现,并于原模型进行了对比。定量实验结果如表1所示。
表1 模型对比定量分析
从表中可以看出,本文提出的方法对UNet、WaterNet、Ucolor、CLUIE和SGUIE预训练模型的平均UIQM增益分别为40.4%、14.2%、25.4%、43.0%和27.1%,UCIQE和FDUM总分的提高进一步表明,本文的方法成功地增强了基于深度学习的模型在不同真实水下场景下的泛化能力。对于传统模型,本文提出的方法提升了DCP和UDCP的整体UCIQE、UIQM和FDUM分数,特别是UIQM分数分别提升了84.5%和126.9%的,这些结果证明了两阶段UIE框架获得的增强水下图像的卓越质量。
图4 深度学习模型视觉分析
除了定量分析,UIE中的视觉表现是衡量一个模型好坏的绝对性指标。基于深度学习模型的视觉分析结果如图4所示。图中四行图片分别表示了雾霾、低对比度、重偏绿调和重偏黄调四种情况。图中可以看出基于深度学习的模型往往在颜色分布平衡的情况下表现良好,但在颜色分布不佳的图像上表现不佳。这突出了当前端到端UIE模型在增强的参考图像上训练的不平衡学习和领域转移的局限性。通过深度色彩补偿和两阶段UIE框架,这些深度模型对具有不同退化类型和颜色分布的真实水下图像实现了良好的增强。
图5 传统模型视觉分析
基于传统方法的模型视觉分析结果如图5所示。在具有挑战性的水下场景中,严重的退化会导致颜色通道的强衰减和不均匀的光谱分布,这些条件会导致传输图估计质量低,从而阻碍了大多数基于DCP的方法在实际水下任务中的应用和推广。从图中可以看出,本文的方法补偿了水下图像的彩色光谱,从而更合理地提取暗通道和高质量的传输图估计。使用两阶段UIE框架,DCP和UDCP都成功地提取了丰富的暗通道,并估算了具有更多细节的高质量传输图,从而显著增强了可见性。
3. 消融实验
为了充分了解P2CNet的网络结构各模块的作用,作者进行了消融实验,分别研究了五种:1)去除纹理编码器,2)去除颜色编码器,3)用卷积代替PVA层,实验结果如表2所示。
去除颜色或纹理编码器会导致UCIQE和FDUM分数下降,并且去除颜色编码器会导致性能特别显著的下降。变体3)的性能甚至比变体1)更差,这突出了PVA层的有效性。最后,全模型在消融实验中获得了最好的结果。这充分表明了本文提出的模型中,每一个模块都起到了有效的作用。
05
总结T
本文提出了一种新的颜色补偿方法和两阶段水下增强框架,以解决当前基于学习的UIE方法的域转移和不平衡学习的挑战。本文的方法简单而高效,它可以很容易地与现有的UIE方法和预训练模型相结合,而不需要额外的调整。通过对真实世界和合成水下图像增强的大量实验,以及在水下显著目标检测和视觉重建中的应用,证明了方法的有效性和泛化能力。但与此同时,本文的模型依旧存在一定缺陷,例如它主要侧重于丰富水下图像与更平衡的色彩分布,而不是完全恢复真实的颜色。对于需要精确水下色彩恢复的任务,该模型的表现存疑。同时,两阶段的增强框架相比改进前的框架增大了计算量,模型效率下降。
- END -
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...