全息数据存储技术作为一种存储密度高、传输速度快和存储寿命长的存储方式,近年来备受关注。该技术利用光的干涉和衍射原理,在三维空间中记录和读取数据,从而实现了极高的存储密度和传输速率。然而,在全息数据存储过程中,由于材料的不均匀性、光学系统存在像差和环境干扰等多种因素的影响,振幅数据页经过记录和读取后的图像中常含有大量随机噪声。这些噪声的特性较为复杂,主要表现为多源噪声叠加的特征,不仅降低了图像信噪比,还严重影响了数据的可靠性和存储系统的整体性能。因此,有效去除这些随机噪声成为了全息数据存储领域的一个重要研究课题。 本文提出了一种改进 U-Net 神经网络来提高图像信噪比,命名为 DRAMCU-Net。该模型通过引入多尺度卷积(MS-Conv)和扩张残差注意力机制(DRABs)来增强特征提取和噪声抑制。实验表明,DRAMCU-Net 在去噪效果方面优于 U-Net,信噪比提高了约 30%。 由于光学系统像差、全息介质的不均匀性和探测器噪声等问题,最终图像中的噪声水平存在很大差异。实验结果表明,数据集中较大的总体差异或不均匀性会对深度学习的降噪性能产生负面影响。这使得准确评估深度学习模型的降噪性能变得困难。为确保数据集的一致性,我们通过调整记录振幅数据页时的曝光时间和读取时半波片的旋转角度,仔细收集了四个数据集。这四个数据集中的信噪比呈梯度,具体范围为 1.3-1.6、1.8-2.1、2.3-2.6 和 2.8-3.1,如图1 所示。根据图1,极低信噪比数据集(Dataset-1)主要由中等不均匀性和光学串扰主导,表现为强散射噪声和光学串扰噪声的混合,严重干扰了数据页上的像素信息,导致平均BER高达 31.13%。相比之下,低信噪比数据集(Dataset-2)主要受到环境干扰噪声和光栅衍射噪声的影响,其中噪声和信号接近临界平衡。同时,高信噪比数据集(数据集 3 和 4)主要由系统噪声控制,其特征是低强度、高频离散噪声点,而信号结构仍然可以区分。 |
|
| 图1. 四种数据集设置和数据页噪声情况 |
为了提高图像信噪比,我们分别在四组数据集上训练 U-Net。学习结果如图2 所示。图中显示了四个数据集在不同轮次的验证集的平均信噪比变化曲线,以及最高平均信噪比对应的误差分布。可以看出,由于数据集 3 和 4 中的随机噪声较低,其中大部分是低强度系统噪声,U-Net 可以有效降低噪声并显著提高信噪比。对于 Dataset-2,它主要受到环境干扰噪声和光栅衍射噪声的影响。噪声和信号几乎平衡,导致 U-Net 错误将一些有效信号作为噪声去除。这导致图像重建效果不佳,到第 7 个训练轮次时信噪比仅为 7.73。由于 Dataset-2 中的低信噪比和大量随机噪声,U-Net 在训练过程学习了过多的噪声导致模型过拟合。对于 dataset-1,它受到强散射噪声和光学串扰噪声的混合影响,导致重建结果中出现大范围的误码。在第九轮次,信噪比仅为 3.48。基于上述分析,由于 U-Net 在 Dataset-2 的性能较差,我们提出了一种改进 U-Net 来解决这些局限性。由于 Dataset-1 中的图像数据在全息存储中相对较少,我们主要分析 Dataset-2。 |
|
| 图2. 基于 U-Net 的四个数据集在不同轮次的验证集平均信噪比变化曲线,以及最高平均 信噪比对应的误差分布。(a)、(b)、(c)和(d)分别表示四个数据集的学习结果 |
由于传统 U-net 在提高信噪比方面的局限性,我们进一步分析了其存在的问题。在传统的 U-Net 架构中,单尺度卷积核(通常为 3×3)无法同时适应全息图中不同尺度的特征。虽然 3×3 卷积核可以捕获局部噪声模式,但它们无法捕获大规模结构特征和空间相关性。为了增强模型捕获多尺度特征的能力,我们使用了一种名为多尺度卷积(MS-Conv)的卷积块,如图3 所示。MS-Conv 模块使用串行级联策略来融合功能。这种策略创建了一条具有逐渐扩大感受野的处理路径。在此路径中,每一层的输出直接成为下一层的输入。这种渐进式设计实现了深度的非线性特征融合,与简单的拼接不同,它构建了更有效的层次表示。因此,模型的多尺度特征捕获能力得到了增强。 |
|
| 图3. 多尺度卷积 |
在训练过程中,U-Net 中的卷积运算为噪声和信号分配固定的特征权重。当 U-Net 处理低信噪比数据集(dataset-2)时,dataset-2 的噪声特性会导致噪声残留或噪声与有效信号之间的混淆。为了克服这个问题,我们基于传统的 U-Net 神经网络设计了一个扩张残差注意力机制(DRABs)的创新模块。符号 ⊕ 表示元素求和, |
|
| 图4. 扩张残差注意力机制 |
我们集成了 MS-Conv 和 DRABs 模块,构建了 DRAMCU-Net 网络,如图5 所示。该设计通过两个模块的互补功能在信噪比增强和噪声抑制方面实现了更好的整体性能:MS-Conv 加强了多尺度特征提取并防止过拟合,DRABs 优化了特征信道权重分配。 |
|
| 图5. DRAMCU-Net卷积神经网络 |
我们使用 DRAMCU-Net 来训练 Dataset-2。结果如图6 所示。图中显示了在不同训练轮次下使用 U-Net 和 DRAMCU-Net 训练 Dataset-2 得到的信噪比变化曲线的比较。结果表明,随着训练轮次的增加,DRAMCU-Net 网络的信噪比不断上升并最终收敛,在第 93 个周期达到 9.98 的峰值。信噪比进一步提高。同时,DRAMCU-Net 重建图像的错误点较少。DRAMCU-Net 网络的BER在第 93 轮次达到 2.92%。 |
|
| 图6. 基于 U-Net 和 DRAMCU-Net 的 Dataset-2 验证集在不同时间点的平均信噪比变化曲线, 以及与最高平均信噪比较应的误差分布 |
为了比较 U-Net 和 DRAMCU-Net 对不同噪声水平数据集的信噪比增强效果,我们分别使用 U-Net 和 DRAMCU-Net 网络对四个数据集进行了处理和分析。实验结果如表1 所示。该表比较了验证集上两个网络的平均信噪比和误码率。它还计算了 DRAMCU-Net 相对于 U-Net 的性能改进。在网络训练之前,通过对验证集中的所有图像的信噪比和误码率值进行平均来获得原始信噪比(SNR)和误码率(BER)。信噪比升幅是通过将 DRAMCU-Net 和 U-Net 之间的信噪比差的绝对值除以 U-Net 的信噪比得到的。同样的方法用于BER降幅。实验结果表明,DRAMCU-Net 在数据集 2-4 中表现良好,信噪比提高,误码率降低约 30%。这表明该网络对中等噪声水平的数据集(Dataset-2)具有很强的噪声抑制能力。它还显著提高了低噪声数据集(数据集 3 和 4)的信噪比。在高噪声数据集(dataset-1)上,DRAMCU-Net 的信噪比提高了约 15%,表明它在强随机噪声环境中仍能部分区分噪声和有效信号。总体而言,DRAMCU-Net 在各种噪声环境中表现出卓越的泛化能力和鲁棒性,特别是在中低噪声场景中。这一结果验证了其在图像信噪比增强任务中的优越性。 |
表1. 四个数据集使用 U-Net 和 DRAMCU-Net 前后平均信噪比和误码率的比较结果 |
|
|
上述研究成果以“SNR enhancement for low-SNR amplitude-modulated holographic data storage based on deep learning”为题,整理发表在美国光学学会 (The Optical Society of American, OPTICA) 期刊杂志 Optics Express, Vol.33, No.23, 49488-49503 (2025)上。 论文的相关链接:https://doi.org/10.1364/OE.573648 |
|