一种基于色彩感知的文档图像阴影去除方法
本发明涉及计算机视觉和图像处理,具体涉及一种基于色彩感知的文档图像阴影去除方法。
背景技术:
1、在数字化文档处理和分析中,图像质量对于文档内容的准确识别和后续处理至关重要。实际采集的文档图像往往会因为光照不均、遮挡或拍摄角度等问题引入阴影,这些阴影会降低图像质量,影响文档的可读性,并对自动化处理流程,如文字识别和内容分析,构成挑战。现有的阴影去除方法在处理文档图像时存在诸多限制。传统的方法可能依赖于固定参数,难以适应不同文档图像中阴影的多样性和复杂性。此外,这些方法可能会在去除阴影的同时损害图像中的重要细节,如文本和图形。还有一些方法虽然能够处理复杂的阴影,但计算成本高昂,不适合实时或资源受限的环境使用。
技术实现思路
1、本发明的目的在于提供一种基于色彩感知的文档图像阴影去除方法,该方法可以有效去除文档图像中的阴影并保留文本细节,从而提高文档图像的可读性。
2、为了实现上述目的,本发明采用的技术方案是:一种基于色彩感知的文档图像阴影去除方法,包括以下步骤:
3、步骤s1、获取用于训练的文档图像,构成训练集;
4、步骤s2、构建端到端阴影去除模型,所述端到端阴影去除模型包括颜色感知背景提取网络和背景引导的阴影去除网络,所述颜色感知背景提取网络从输入的阴影图像中提取背景特征,预测背景图像并对其进行特征提取,所述阴影去除网络在第一阶段对输入的阴影图像利用背景特征生成粗略的阴影去除结果,在第二阶段通过背景注意力模块和细节增强模块对粗略的阴影去除结果进行细化,得到最终的去阴影图像;构建结合结构一致性损失、背景重建损失和外观一致性损失的损失函数,利用训练集对端到端阴影去除模型进行训练,通过训练优化模型参数,以在去除阴影的同时保留图像细节;
5、步骤s3、将训练完成的端到端阴影去除模型应用于新的文档图像,对文档图像自动进行阴影去除处理,输出清晰无阴影的文档图像。
6、进一步地,在步骤s1中,所述训练集包含多对真实阴影图像和对应的真实无阴影图像,且不同真实阴影图像具有多种不同的阴影类型,以在用其训练端到端阴影去除模型时提高模型的鲁棒性。
7、进一步地,在步骤s2中,所述颜色感知背景提取网络包括背景编码器和背景解码器;所述背景编码器应用五个卷积层、第一批归一化层和第一激活函数从输入的真实阴影图像中提取背景特征;所述背景解码器应用五个反卷积层、第二批归一化层和第二激活函数来预测背景图像,所述卷积层和反卷积层采用跳跃连接,以增加网络通道数并保留前层的上下文信息;
8、在训练颜色感知背景提取网络时,通过真实背景图像b对预测的背景图像进行损失约束进而优化的生成;首先将真实无阴影图像i gt分成k×k个补丁,对于每个补丁,根据补丁中各像素的强度将其聚类为两个簇,分别对应文本内容和背景;将颜色较亮的簇视为背景簇,并应用背景簇的平均颜色作为补丁的背景;处理后的补丁共同构成初步背景;然后采用颜色保留平滑算子对进行细化,得到真实背景图像b,其表示为:
9、 (1)
10、其中,bi为真实背景图像b中第i个像素,为初步背景中第i个像素,n(i)为第i个像素的局部邻域;w ij为滤波核,用于度量第i个像素与其局部邻域内的第j个像素之间的颜色相似度。
11、进一步地,在步骤s2中,所述阴影去除网络的第一阶段包括图像编码器和背景约束解码器;所述图像编码器对输入的真实阴影图像进行编码处理,将其转换为低维特征表示,同时保留图像的结构和内容信息;为了利用背景特征,将颜色感知背景提取网络的背景编码器的各层提取的背景特征集成到背景约束解码器的对应层中;所述背景约束解码器利用背景编码器提取的背景特征对图像编码器编码后的图像特征进行解码,生成粗略的阴影去除结果i coarse;然后,将生成的粗略的阴影去除结果与输入的真实阴影图像相结合,形成新的特征图,再输入阴影去除网络的第二阶段,以进一步生成清晰的去阴影图像。
12、进一步地,在步骤s2中,所述阴影去除网络的第二阶段包括第二图像编码器、第二图像解码器、背景注意力模块和细节增强模块;所述第二图像编码器对输入的特征图进行编码处理,将其转换为低维特征表示,然后通过背景注意力模块和细节增强模块进行细化;
13、所述背景注意力模块首先融合第二图像编码器各层提取的特征和从预测的背景图像提取的特征,通过信道连接得到综合特征,然后将综合特征输入注意力计算单元,生成颜色感知注意力图;最后,通过元素乘法将颜色感知注意力图与综合特征融合,得到背景注意力模块的输出特征,然后将输出特征嵌入第二图像解码器的相应层中;
14、同时,将来自第二图像编码器的前两个低级层的特征进行融合,得到串联的低级特征,并将其输入细节增强模块进行处理;所述细节增强模块首先使用两个2×2卷积层生成一个特征图m,再对特征图m进行全局平均池化,得到全局平均特征;然后,利用余弦相似度计算m与之间的相关性,得到相关矩阵s;构建一组量化级别l,将s的最小值和最大值之间范围划分为n等份;而后,利用l将相关矩阵s量化为量化编码矩阵e;量化编码矩阵e中元素表示为:
15、 (2)
16、其中,i∈[1, hw],n∈[1, n],h和w是图像的长度和宽度; l n表示第n个量化级别, s i表示相关矩阵s中第i个元素;
17、基于得到的量化编码矩阵e进行特征统计,得到细节增强模块的输出特征;
18、最后,第二图像解码器利用背景注意力模块和细节增强模块提取的特征对第二图像编码器编码后的特征进行解码,生成最终的去阴影图像i free。
19、进一步地,在步骤s2中,采用背景重建损失来约束颜色感知背景提取网络获得理想的背景图像,其采用颜色感知背景提取网络预测的背景图像与真实背景图像b之间的差距来衡量;背景重建损失lbackground表示为:
20、 (3)。
21、进一步地,在步骤s2中,采用外观一致性损失来评估预测结果与真实无阴影图像i gt之间的数据损失,其中预测结果包括第一阶段生成的粗略的阴影去除结果i coarse和第二阶段生成的最终的去阴影图像i free;外观一致性损失lappearance表示为:
22、 (4)
23、其中,λ1、λ2均为设定的权重参数。
24、进一步地,在步骤s2中,采用结构一致性损失来保留图像结构,结构一致性损失lstucture表示为:
25、 (5)
26、其中,vgg( )是预训练vgg19模型的特征提取器。
27、进一步地,最终的损失函数l final表示为:
28、
29、其中,、和为设定的权重参数,lbackground为背景重建损失,lappearance为外观一致性损失,lstucture为结构一致性损失。
30、本发明提出了一种基于色彩感知的文档图像阴影去除方法,该方法专注于精确地识别并去除文档图像中的阴影,同时最大限度地保留图像中的关键细节。本方法通过颜色感知背景提取网络和背景引导的阴影去除网络,实现了对文档图像中阴影的精确定位和有效去除。本发明利用空间变化的背景信息和两阶段网络处理,优化了阴影去除过程,同时保持了图像的自然特征和可读性。与现有技术相比,本发明具有以下有益效果:
31、(1)通过颜色感知背景提取网络提取的背景图像,能够准确反映文档图像中的多种背景颜色,为阴影的识别和去除提供了精确的背景信息。
32、(2)背景引导的阴影去除网络采用两阶段处理机制,首先通过背景约束解码器生成粗略的阴影去除结果,然后通过背景注意力模块和细节增强模块进一步优化结果,有效提升了阴影去除的质量和细节的保留。
33、(3)本方法中的背景注意力模块和细节增强模块的设计,使得网络能够自适应地聚焦于阴影区域,同时增强图像的细节特征,从而提高了阴影去除的精度和图像的清晰度。
34、(4)轻量级的设计和优化的损失函数,使得本方法在保持阴影去除效果的同时,减少了计算资源的消耗,适合于实时和高分辨率的文档图像处理需求。
35、(5)本发明的方法通过端到端的训练自动学习阴影去除的最佳策略,无需复杂的参数调整或人工干预,显著提高了操作的便捷性和实用性,适用于各种文档图像的自动阴影去除任务。
相关知识
基于色彩空间的油菜花图像分割
【图像分割】基于阈值法实现大脑图像分割附Matlab代码
基于图像处理的棉花成熟度判定技术的研究
一种基于图像的农作物病虫害检测方法、系统及设备与流程
基于光谱图像的森林病虫害自动检测方法
中国科学院机构知识库网格系统: 基于深度学习的苹果花果信息感知与病虫害诊断技术研究
一种基于改进YOLOv5s的牡丹花品种的检测方法
一种基于Android平台的植物叶片识别方法
一种基于显著图的药用植物分类方法与流程
【读点论文】基于二维伽马函数的光照不均匀图像自适应校正算法
网址: 一种基于色彩感知的文档图像阴影去除方法 https://www.huajiangbk.com/newsview2513798.html
| 上一篇: 解锁视觉密码:揭秘24种颜色识别 |
下一篇: 色彩训练方法及色彩训练方法有哪几 |
推荐分享
- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039
