ICLR2025满分论文!利用一致光传输提升图像照明编辑效果Scaling方法

在当今数字图像处理的背景下,图像照明编辑成为了一个重要且充满挑战的领域。传统的计算机图形学方法通常依赖于物理照明模型来模拟图像的外观,这种方法强调了光源与物体之间的相互作用与反射。

然而,随着深度学习和生成模型的发展,基于扩散的图像生成方法逐渐成为处理照明编辑问题的新兴手段。这些方法不仅可以应对更为复杂的“野外”照明效果,还能在图像中灵活地生成各种光照变化,如反向照明、边缘光源、光晕效果等。通过这些技术,艺术家和设计师能够在保持一致的照明条件下修改前景或背景,进而提升视觉内容的创作和操控能力。

尽管基于扩散的照明编辑方法展示了巨大潜力,进行大规模训练并利用强大的模型架构仍然面临诸多挑战。尤其是在处理多样和复杂的数据集时,如何保持模型的期望行为,确保其能够实现准确的照明操作而不是偏离到无序的随机行为,就显得尤为重要。

数据集的增大及多样性是一个双刃剑,它往往会导致学习目标的模糊和不确定性,使教导模型学习到照明的映射变得困难。为了应对这些挑战,本文提出了一种新的方法——一致光传输(IC-Light),通过物理原理确保在修改图像照明的同时保持其内在属性不变。

论文标题:

ScalingIn-the-WildTrainingforDiffusion-basedIlluminationHarmonizationandEditingbyImposingConsistentLightTransport

论文地址:

一致光传输的核心思想是,通过确保物体在不同照明条件下的外观的线性叠加与其在混合照明条件下的外观保持一致,从而为模型提供一个强有力的物理约束。

▲用户为对象图像和照明描述提供输入,我们的方法生成相应的对象外观和背景。

通过大量的实验证明,IC-Light方法在降低不确定性、减轻材料不匹配和反射色改变等伪影方面表现出色。这些进展为照明编辑的工业应用提供了坚实基础,预示着基于扩散的图像生成技术在创意领域的无限可能。

在过去十年中,基于深度学习的图像照明编辑方法逐渐成熟,这些方法不仅改进了传统计算机图形学技术,还利用神经网络学习复杂的照明模型。

研究者们首先利用深度神经网络从光阶段数据中提取先验知识(Sunetal.,2019),随后有研究针对神经网络的能力进行了增强,使用物理先验进行训练(Nestmeyeretal.,2020)。此外,Pandeyetal.(2021)利用高动态范围(HDR)照明图来训练重照明模型,显式优化Phong模型的先验。

近年来,扩散模型在图像生成和操控方面展现出了巨大的潜力(Dhariwal&Nichol,2021;Hoetal.,2020)。这些模型能够有效地处理图像编辑任务(Ho&Salimans,2021),并基于文本生成高质量的图像(Rombachetal.,2022)。例如,RelightfulHarmonization(Renetal.,2024)方法将前景照明的操控与背景条件相结合,成功实现了照明的调整。

类似的,DilightNet(Zengetal.,2024)、FlashTex(Dengetal.,2024)和NeuralGaffer(Jinetal.,2024)等方法主要基于三维渲染数据进行物体外观操控。

除了基于深度学习的模型,传统的计算机图形学技术仍然在照明编辑界占据重要地位。许多研究(Dorseyetal.,1995;Debevecetal.,2000)展示了如何在图像渲染中准确模拟照明效果,包括光源类型和背景影响等因素。这些研究为本研究提供了理论基础,使得结合扩散模型和物理背景的照明编辑变得可行。

尽管已有大量研究在图像照明编辑领域取得了显著进展,但这些方法仍存在一定的局限性,如在复杂场景中保持内在属性(如反射率和细致的图像细节)的能力较弱。

本研究将通过一致光传输(IC-Light)的方法进行扩展和完善,以确保照明操控精准且不影响图像的其他内在属性。这一方法的提出不仅填补了现有研究的空白,也为未来的图像编辑技术发展提供了新的视角和思路。

方法论

在本节中,研究团队提出了一种称为一致光传输(IC-Light)的方法,旨在处理图像的照明编辑问题。该方法基于光传输的物理原理,确保在修改图像照明时能够保留图像的内在属性,例如反照率(albedo)和细节。

3.1一致光传输的原理一致光传输的核心理念是,物体在不同照明条件下的外观线性混合,总体上能够与在混合照明条件下的外观保持一致。即对于给定的任意外观和关联的环境照明,存在一个矩阵使得:

这里,可以视为数据格式中的。

这种线性关系阐明了根据不同光源条件下物体外观的混合表现与在合成照明下的外观是等效的。这一现象得到现实世界测量的验证(例如,Haeberli,1992)。通过这种观点,研究者能够确保模型在训练过程中只修改图像的照明,而不改变其内在属性,进而引入了一致性损失函数来保持这种线性关系:

其中,是一组掩膜,表示在该区域有效,仅在有光照的部分计算一致性损失,是一个可学习的多层感知机(MLP),旨在替代总和项。

3.2方法流程

研究团队的训练目标结合了两个主要的损失函数:一个是基础图像重采样损失和一致性损失的加权组合。最终的学习目标可以写成:

在这一目标中,使用的默认为权重设置为和。

通过实施上述一致光传输约束,模型不仅能驰骋于光照编辑的各类任务,还能在进行图像内容生成时较好地保持细节和内在属性。关键的一点是,模型在随机选择不同的环境光源时,依然能够保持对变换前后的色彩、亮度以及细节的控制。

在图3中,以图[3-(a)]作为基础,仅使用标准的图像条件扩散模型进行照明学习,并与图[3-(b)]中的光传输一致性实施方案进行对比,可以看出在保持图像细节的同时更为有利于生成一致性的光照效果。

▲学习目标

通过这种方法,IC-Light实现了更稳定的训练表现,能够处理大规模、复杂的和噪声数据,确保模型可以广泛应用于真实场景的照明编辑。

实验设计

野外图像数据:通过在大约5000万张图像中进行筛选,最终选择了6百万张图像来进行训练。这一过程涉及到与“美丽照明”、“光线”和“照明”等关键词的CLIP视觉相似性比较,确保所选图像具有较高的照明质量。

3D渲染数据:使用Objaverse数据集进行渲染,采取了一种基于图像的渲染管线以提高速度,最终形成约400万张图像。

光阶段数据:从多个光阶段数据集中提取,汇总了20,000个光阶段样本。这些数据被预处理成统一格式,以便训练模型时使用。

4.2优化算法和模型训练

模型训练过程中,研究团队使用AdamW优化器,并设置学习率为1e-5。预训练好的StableDiffusion模型包括SD1.5、SDXL和Flux.1.0-dev。训练过程在8台H10080GBNVLinkGPU上进行,最大化批处理大小以提高训练效率。

此外,针对每个模型的训练时长也被精确记录:

SD1.5模型训练耗时约100小时。

SDXL模型首先在512分辨率下训练80小时,然后在1024分辨率下微调60小时。

对于Flux模型,采用了多阶段的训练策略,为了应对模型的复杂性,研究团队分别训练了双流和单流部分,并对部分梯度图进行了冻结。

4.3数据集平衡

为确保训练效果,研究团队在训练早期采用调度概率来平衡各数据集的贡献。具体来说,通过调整初期阶段野外图像数据和3D渲染数据的出现概率为0.5,而光阶段数据的出现概率为0.0。在经过10万次迭代后,随着训练的深入,光阶段数据的出现概率逐步增加到0.3,确保在最终模型中包含一定比例的高质量光阶段数据。

在模型训练过程中,核心损失函数的形式如下:

其中,表示综合损失,和分别对应于基础图像条件扩散模型的损失和一致光传输的损失函数。

4.5实验流程图

▲Datasetcollection

通过以上详细的实验设计,研究团队旨在验证一致光传输方法在大规模、多样化图像照明编辑中的有效性,期望该方法能够为后续的实际应用奠定坚实基础。

实验结果与讨论

本节将呈现对比实验的结果,展示提出的方法在光照编辑任务中的优势与局限性。通过定量指标与定性结果的综合分析,旨在探讨影响模型表现的关键因素。

5.1实验结果

采用多种评价指标对模型表现进行量化评估,包括峰值信噪比(PSNR)、结构相似性指数(SSIM)以及学习感知图像块相似性(LPIPS)等。这些指标用于量化模型在生成图像上的保真度和视觉质量。表1展示了不同实验组的定量评估结果。

▲表1:定量测试的评估结果

如表中所示,完整的方法在所有指标上均表现出色,尤其在LPIPS指标上,表明其生成的图像具有优越的感知质量。相比之下,仅依赖3D渲染数据训练的模型在PSNR上表现最佳,但显然存在评估偏差。

5.2定性结果

除了定量结果外,定性分析也显示了所提出方法的优势。通过与其他现有方法的视觉比较,如图6所示,本研究的方法在处理复杂阴影和光照变化上表现出更强的鲁棒性。具体来说,生成的图像更好地保留了原始图像中的细节与色彩,尤其是在光源及材质变化的场景中。

▲图6:视觉比较。这一图展示了本研究方法与其他方法在处理光照情况下的表现。

5.3影响因素分析

在实验过程中,模型表现受多个因素的影响,特别是在数据源丰富性和训练目标一致性上。通过消除在野外的图像增广数据,模型的泛化能力显著下降。例如,在处理复杂图像(如肖像照片)时,模型往往不能正确渲染附加的物体(如帽子),非常明显的色彩失真。

同样,当去除光传输一致性约束时,模型在生成一致的光照和保持内在属性(如反射率)方面的能力显著下降。在此情况下,图像中不同颜色的差异可能消失,并因色彩饱和度的问题出现明显的视效缺陷。

结合以上定量与定性分析,投射式光传输一致性与多样的训练数据源结合使用,是确保模型在各种光照情况下表现优越的关键因素。

结论

在本研究中,作者提出了一种名为一致光传输(IC-Light)的方法,以扩展基于扩散的照明编辑模型的训练。通过利用物理原理,IC-Light确保了在进行图像照明操控的同时,图像的内在属性如反射率和细节得以保持。

多项实验证明,这一方法不仅提高了模型在多样化照明环境中的鲁棒性和表现,还有效降低了由于在训练过程中数据的复杂性和噪声带来的不确定性。

综上所述,一致光传输方法在照明编辑领域展示了显著的潜力和应用价值。它使得在处理超过一千万张的多样化样本时,模型仍然能保持较高的精确度与一致性,大幅提升了生成结果的视觉质量。

特别是在处理复杂背景或艺术性照明效果时,这一方法显示出了独特的优势。未来的研究方向可能包括进一步提升模型的泛化能力,并探索将其应用于实时图像处理和更加复杂的视觉生成任务。

此外,研究者计划通过引入更多种类的输入和优化算法,进一步改善模型在不同光照条件下的表现,以实现更加自适应、高效的照明编辑。在此过程中,期待IC-Light方法能够更进一步地推动图像生成与编辑技术的发展,并为视觉内容的创造提供创新工具和手段。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

THE END
1.Zemax光学艺术:2024年设计新潮流.pptxZemax光学艺术:2024年设计新潮流汇报人:2024-11-13引言光线操控与视觉感知材质创新在光学艺术中应用结构美学与空间布局策略色彩运用及心理影响剖析交互式体验设计探讨目录CONTENTS01引言应用领域广泛应用于建筑、室内装饰、舞台表演、艺术品展示等领域,为观众带来沉浸式的艺术体验。定义与起源Zemax光学艺术是一种结合光学原理...https://www.renrendoc.com/paper/360565785.html
2.雕塑设计ppt课件经管文库(原现金交易版)经管...雕塑设计ppt课件 https://bbs.pinggu.org/thread-12561289-1-1.html
3.雕刻光线小型闪光灯的超极限应用.pdf(75.8MB)雕刻光线 小型闪光灯的超极限应用.pdf75.8MB 网站声明 请认真阅读以下说明,您只有在了解并同意该说明后,才可继续访问本站。 1. 全站链接通过程序自动收集互联网公开分享链接,本站不储存、复制、传播任何网盘文件,也不提供下载服务。 2. 毕方铺遵守相关法律法规,坚决杜绝一切违规不良信息,如您发现任何涉嫌违规的网盘信...https://www.iizhi.cn/resource/detail/168670bc1fd2f5a41498324999b6a330
4.A270大小:134.47 MB 字数:约小于1千字 发布时间:2019-02-20发布于北京 浏览人气:231 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币(10金币=人民币1元) A270_世界顶级摄影大师——雕刻光线++小型闪光灯的超极限应用.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 ...https://max.book118.com/html/2019/0217/8051036136002006.shtm
1.基于STM32自制激光雕刻机设计含文档教程+源码+原理图参考学习...自动:在特色服务中标有自动发货的商品,拍下后,源码类 软件类 商品会在订单详情页显示来自卖家的商品下载链接,点卡类 商品会在订单详情直接显示卡号密码。 手动:未标有自动发货的的商品,付款后,商品卖家会收到平台的手机短信、邮件提醒,卖家会尽快为您发货,如卖家长时间未发货,买家也可通过订单上的QQ或电话主动联系...https://www.songma.com/product/view1067920.html
2.艺术与技术之完美融合,最新精雕图欣赏信息系统集成服务精雕图技术源于传统的雕刻工艺,随着数字技术和计算机科技的进步,逐渐演变为一种现代化的艺术形式,从最初的手工雕刻,到数控雕刻,再到现代的三维打印技术,精雕图技术的发展经历了一个漫长的历程,精雕图技术已经广泛应用于艺术、设计、制造和科技等领域,成为了一种重要的技术手段和艺术表现形式。 https://www.yuwangkj.cn/post/18343.html
3....灯光曝光效果美容光雕光与影素材下载nipic.com作品编号: 20241110163122716131 上传时间: 2024/11/10 大小: 10.17 M 分辨率: 72 作品尺寸: 4096*4096像素 作品格式: JPG 颜色模式: RGB 作品价格: 20元(CNY) 立即下载 本作品使用AI技术生成,仅供网友学习交流,未经书面授权,请勿作他用。若您的权利被侵害,请联系copyright@nipic.com。 相关...https://www.nipic.com/show/48739477.html
4.ICLR2025满分论文!利用一致光传输提升图像照明编辑效果野外图像数据:通过在大约 5000 万张图像中进行筛选,最终选择了 6 百万张图像来进行训练。这一过程涉及到与“美丽照明”、“光线”和“照明”等关键词的 CLIP 视觉相似性比较,确保所选图像具有较高的照明质量。 3D 渲染数据:使用 Objaverse 数据集进行渲染,采取了一种基于图像的渲染管线以提高速度,最终形成约 400...https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/143788740
5.Photoshop课时:头发制作(无解说)翼狐网视频教程第2 课时:课时2:头部雕刻(倍速) 试看 34:29 第3 课时:课时3:头部雕刻1(原速无解说) 40:45 第4 课时:课时4:头部雕刻2(原速无解说) 29:58 第5 课时:课时5:头部雕刻3(原速无解说) 28:53 第6 课时:课时6:身体雕刻(倍速) 19:07 第7 课时:课时7:身体雕刻1(原速无解说) 29:59 第8 ...https://m.yiihuu.com/cv_233750.html
6.2024年摄影工作总结范文(精选11篇)3、光线:无直径无体积有一定方向的几何线条 4、光线的反射定律:反射光线与入射光线分属法线的的两侧,且与法线在同一平面内,入射角=反射角 5、透镜的种类:凸透镜、凹透镜 凸透镜:汇聚光线,有双凸、平凸、凹凸(新月形) 凹透镜:发散光线,有双凹、平凹、凸凹 ...https://www.diyifanwen.com/fanwen/gongzuozongjie2/17117183.html
7.雕刻光线pdfepubmobitxt电子书下载2024《雕刻光线——小型闪光灯的超极限应用》是世界有名摄影大师乔·麦纳利继2008年大红大紫的作品《瞬间的背后》与2010年的作品《热靴日记》之后推出的又一部力作。作者除了在《雕刻光线——小型闪光灯的超极限应用》中带领读者探索热靴闪光灯在摄影中的应用外,还通过对大量经典案例的详尽解析,让读者更好地理解闪光灯...https://windowsfront.com/books/1027672955
8.摄影构图艺术mobiepubpdftxt电子书下载2024直到长出青苔 mobi epub pdf txt 电子书 格式 下载 美国摄影用光教程(第5版) mobi epub pdf txt 电子书 格式 下载 惊现自然:国家地理摄影师发现之旅 mobi epub pdf txt 电子书 格式 下载 雕刻光线:小型闪光灯的超极限应用 [Sketching Light] mobi epub pdf txt 电子书 格式 下载 手机摄影大全 轻松拍...https://book.qciss.net/books/11589095
9....附光盘)epubpdfmobitxt电子书下载2024美国摄影用光教程(第5版) epub pdf mobi txt 电子书 下载 惊现自然:国家地理摄影师发现之旅 epub pdf mobi txt 电子书 下载 雕刻光线:小型闪光灯的超极限应用 [Sketching Light] epub pdf mobi txt 电子书 下载 手机摄影大全 轻松拍出大片味儿 epub pdf mobi txt 电子书 下载 Nikon D810完全摄影指南 ep...https://book.tinynews.org/books/11591979
10.[PDF]下载3D显示技术标准与应用PDF电子书by范科峰《雕刻光线:小型闪光灯的超极限应用》是世界著名摄影大师乔?麦克纳利继2008年大红大紫的作品《瞬间的背后》与2010年的作品《热靴日记》之后推出的又一部力作。作者除了在书中带领读者探索热靴闪光灯在摄影中的应用外,还通过对大量经典案例的详尽解析,让读者更好地理解闪光灯的创意发挥。作者在书中大量展示了最新的...http://www.51ebooks.com/book/3d%E6%98%BE%E7%A4%BA%E6%8A%80%E6%9C%AF%E6%A0%87%E5%87%86%E4%B8%8E%E5%BA%94%E7%94%A8-21448-pdf.html
11.摄影基础公开课摄影基础公开课---高等院校摄影摄像基础教程 epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2024 摄影基础公开课---高等院校摄影摄像基础教程 pdf epub mobi txt 电子书 下载 具体描述 戴菲编著的《摄影基础公开课(高等院校摄影摄像基础教程)》从照相机的历史开始,以相机的快速使用为契机,围绕照相机作为光学工具...https://book.onlinetoolsland.com/item/23620483
12.设计书籍推荐PDF B062 瞬间的背后:乔·麦克纳利经典传奇照片解密 人像摄影 豆瓣(8.8) PDF B063 热靴日记:小型闪光灯的创造性应用 摄影其实是布光的艺术,除了自然光还要懂人造光 豆瓣(8.9) PDF B064 雕刻光线:小型闪光灯的超极限应用 上一本的延续 豆瓣(9.2) PDF B065 摄影师的视界:迈克尔?弗里曼摄影构图与设计 ...http://hao.shejidaren.com/book.html#nogo
13.《雕刻光线:小型闪光灯的超极限应用》EPUB,《雕刻光线:小型闪光灯...文件格式: PDF 1.点击下方获取下载 2.扫码右侧二维码 获取 作者简介: 乔·麦克纳利,世界知名摄影大师,2008年北京奥运会十位特邀摄影师之一。他还是柯达公司...在《雕刻光线——小型闪光灯的超极限应用》中,乔·麦克纳利透过一张张照片,带领你探讨他在这几十张作品中所用的布光招式。除此之外,他还带你了解他...https://www.f513.com/duanpian/21346.html