AI中国网 https: //www.cnaiplus.com
日前,英伟达公司由 Guilin Liu 领导的研究团队发布了一种最先进的深度学习算法,英伟达新算法可以编辑图像或复原那些像素有缺失的图像。英伟达新算法还可以通过删除图像的部分内容再进行填充的方式,来重新编辑图像。
这种“图像修复”功能使用在照片编辑软件中,先抠掉图像中不需要的内容,同时用算法生成的真实数据来填充。
论文中写道:“以前相似的深度学习方式重点放在位于图像中心的矩形区域,并且经常依赖于复杂的后处理操作,而我们的新模型有更好的效果。它可以鲁棒地处理任何形状、位置的马赛克遮挡。 并且未来可以更平滑地处理更大的区域。”
在着手训练神经网络之前,首先生成了 55,116 个具有随机纹理和任意形状、大小的马赛克形状作为训练集。他们还生成了近 25,000 个马赛克图形作为测验数据集。 为了提升图像重建的准确度,根据马赛克形状的相对大小把这些图像进一步分成了六类。
团队通过将生成的马赛克图案覆盖在 ImageNet,Places2 和 CelebA-HQ 数据集的图像上,运用 NVIDIA Tesla V100 GPU 和经过 cuDNN 加速的 PyTorch 深度学习框架来训练神经网络。
在训练阶段,将空白或缺失部分引入上述数据集完整的训练集中,使神经网络能够学习复原缺失的像素。在测验阶段,将与训练阶段不一样形状的马赛克图案使用于测验集的图像中,从而提升复原精度的范化能力。
现有的基于深度学习的图像修复方式效果受限,是因为受损像素的输出一定依赖于这些像素提供给神经网络的输入。这导致图像中产生了颜色偏差和不清楚的伪信息。
为了搞定这个问题,研究团队开发了一种方式,确保受损像素的输出不依赖于因这些像素产生的输入值。这个方式是运用“部分卷积”层,根据其感受野的有效性对每个输出进行重新归一化 。这种重新归一化的方式可确保输出值与每个感受野中受损像素的值相互独立无关。该模型由UNet架构实现的部分卷积功能。运用一组损失函数来训练模型,匹配VGG模型的特征损失和风格损失以产生逼真的输出。
研究人员也在英伟达新算法论文中引用到,相同的网络框架可以来完成高辨别率图像的处理任务。
AI中国网 https: //www.cnaiplus.com
本文网址: