- 博客(106)
- 资源 (4)
- 收藏
- 关注
原创 【MV-Adapter】多视角图像生成——维持多视角一致性的奥义
MV-Adapter是一种创新的即插即用适配器,可将现有文生图扩散模型转化为多视角生成器。该方法通过共享特征空间和单一权重Adapter模块实现多视角一致性,避免了全参数微调的高成本。其核心设计包含复制的自注意力层和并行注意力架构,能够保留预训练模型的先验知识。MV-Adapter还整合了相机参数和几何信息的统一条件编码器,支持文本或图像输入的3D生成。实验证明该方法能适配个性化模型、few-step模型和ControlNet,在768×768分辨率下保持生成质量,为3D重建提供了高质量的多视角图像。
2025-07-12 11:45:05
960
原创 【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔(四)
本文提出了一种结合生成模型和SVBRDF预测的3D场景纹理生成方法。通过扩散模型生成多视角图像,并通过改进的U-Net架构预测SVBRDF参数,最终生成场景纹理地图集。方法解决了多视角一致性预测问题,采用首视角完整生成+重投影修复的策略。虽然对光泽材质恢复仍存在光照耦合问题,但通过神经网络架构优化和条件输入设计提升了效果。实验表明该方法能生成物理合理的纹理,支持任意视角和光照条件下的重新渲染。
2025-07-11 10:12:09
417
原创 【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔(三)
本文提出VideoMat方法,利用视频扩散模型从文本/图像输入生成高质量PBR材质。系统通过两个视频扩散模型协同工作:第一个模型结合几何与光照信息生成多视角材质视频;第二个模型分解出材质属性视频(basecolor、roughness、metallic)。最后通过可微分路径追踪器整合多视角数据,输出兼容标准工具链的PBR材质。该方法创新性地将视频生成技术应用于材质提取,为基于AI的3D内容创作提供了新思路。
2025-07-10 10:26:30
350
原创 【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔(二)
本文提出了一种基于扩散模型的多尺度3D纹理迁移方法,能够实现高保真的纹理提取与映射。该方法采用两阶段框架:首先利用多视角图像和深度图生成粗糙的UV纹理图,再通过深度感知的自注意力机制进行精细优化。创新性地引入交叉注意力模块实现纹理迁移,同时利用深度信息保持几何一致性。实验表明该方法能有效处理复杂形状,保持正确语义对应,生成高质量的纹理迁移结果。核心在于将几何深度作为强先验约束,通过注意力机制实现纹理特征传递。
2025-07-09 11:25:09
626
原创 【2025强化学习最新文章阅读】Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning
本文提出了一种强化学习微调框架,用于优化few-step文本到多视角图像生成(T2MV)扩散模型。针对现有方法在跨视角一致性和推理效率上的不足,研究通过三个关键技术实现突破:1)将多视角生成建模为马尔可夫决策过程,设计联合视角奖励函数优化几何一致性;2)提出ZMV-Sampling采样技术,通过"之字形"降噪过程增强视点一致性;3)引入MV-ZigAL方法将采样优势内化到基础策略,减少推理耗时。此外,研究将优化问题重构为带约束的形式,通过拉格朗日对偶方法平衡单视角质量和多视角一致性。
2025-07-08 21:34:12
607
原创 使用conda创建python虚拟环境,并自定义路径
本文介绍了如何使用conda创建并配置虚拟环境。首先,通过指定路径创建了一个没有命名的虚拟环境,使用了Python 3.8版本。接着,通过将虚拟环境的路径添加到conda的配置中,实现了虚拟环境的命名和识别。这种方法适用于需要将虚拟环境存储于特定路径的场景,便于后续管理和使用。
2025-05-18 13:57:43
452
原创 Windows下配置diffusers环境,并安装xformers和triton时的一些注意事项
请务必注意,为了能用使用xformers加速训练,python版本务必使用3.10。
2024-11-01 15:48:08
959
原创 Linux服务器给用户增加额外磁盘空间时可能面临的问题及解决方法
实验室Ubuntu服务器上,我的用户账号的磁盘空间不够了,尝试使用gparted UI工具分配额外空间时,发现必须有连续的可用空间才能给我账号的磁盘空间扩容,或者是用系统U盘启动来移动账户所挂载的磁盘空间位置,这样也能凑出连续的可用空间来。博主在查阅资料并反复思索后,突然意识到新分配的磁盘空间可以直接挂载到我的用户home目录下的某个文件夹上,这样也能变相的给我的账户扩容。经过尝试,果然可以,特此记录,以利后人。
2024-07-30 15:50:46
210
原创 ValueError: The repository for contains custom code which must be executed to ...的一种解决方案
博主在使用diffusers导入自定义的数据集训练stable diffusion时,发现自定义数据集中的加载脚本不起作用(加载自定义数据集的方法见。经过多种尝试后,最终得到一种解决方法,即:在load_dataset()方法的形参中额外增加一条参数trust_remote_code=True,
2024-07-10 20:28:06
2767
原创 ModuleNotFoundError: No module named ‘****‘的一种解决方案
【代码】ModuleNotFoundError: No module named '****'的一种解决方案。
2024-07-05 22:50:20
363
原创 pycharm无法添加python解释器的解决方法
出现该错误的原因是先前创建过重名的解释器,在pycharm配置中没有完全删除干净。接着将无法添加的虚拟环境删除,再添加即可。首先在文件->设置界面,找到解释器设置。
2024-07-03 16:15:17
8712
1
原创 Hugging face上下载Stablediffusion3底模的注意事项
但是需要注意的是,使用浏览器下载下来的文件名会和官网提供的文件名不一致,因此需要我们手动参考官网的文件名字修改。有多种方法支持获取Hugging face上的底模,最简单粗暴的方法是登录官方页面直接下载。以stable diffusion 3底模为例,挂载梯子登录对应。,将所有模型下载到同一个文件夹下即可。
2024-07-03 08:59:28
321
原创 diffusers 再次继续训练LoRA时,如何导入已有的LoRA权重
有时候我们需要复用先前训练好的LoRA参数来继续进行训练。此时并不需要我们重新使用API向U-Net网络加载LoRA对应的adapter参数权重,我们可以直接通过diffusers的LoRA训练脚本的输入参数来实现断点处继续训练的需求。
2024-06-10 15:37:34
951
原创 diffusers 使用脚本导入自定义数据集
在训练扩散模型时,如果附加额外的条件图片数据,则需要我们准备相应的数据集。此时我们可以使用官网提供的脚本模板来控制导入我们需要的数据。
2024-06-07 16:45:23
881
原创 Windows下的conda,一种进入虚拟环境的方法
如果conda env list中的虚拟环境不存在,但是在本地文件存在,你还想进入虚拟环境安装依赖并使用该虚拟环境的话,可以使用如下命令启动该虚拟环境。
2024-06-04 15:59:33
576
原创 论文作图之高压缩比导出PDF
笔者使用Adobe Illustrator 2023创建可编辑pdf图,按照默认的导出设置保存pdf文件时,得到的图存储很大。为了解决存储过大且还保留一定编辑功能的问题,作者实践出了一种导出pdf的设置方法。实测可以极大减小pdf存储大小,同时保留编辑功能。
2024-06-01 22:05:03
858
原创 解决ModuleNotFoundError: No module named ‘dnnlib‘问题
尝试采用:pip install dnnlib解决,但下载源中并不包含该依赖
2024-05-25 10:33:57
1473
原创 解决Diffuers训练LoRA,推理时LoRA权重不起作用的问题
今天碰见个离谱的事情,用diffusers官方代码训LoRA,然后推理,结果推理的时候加不加LoRA权重结果都一样,后来搞了半天才发现,新版本diffusers的推理部分模型加载的API更新了
2024-05-23 16:43:45
934
原创 accelerate训练SD-LoRA,解决ValueError: Attempting to unscale FP16 gradients.问题
训练指令需从原来的:变换一下顺序:
2024-05-22 14:10:00
1080
7
原创 accelerate在pycham中执行的方法
通常情况下我们在pycharm中默认执行python.exe xxx.py,在命令行中执行accelerate xxx.py。下面介绍如何在pycharm中执行accelerate的方法,主要目的是便于后续的代码调试。
2024-05-21 21:20:05
1056
原创 raise RuntimeError(“Ninja is required to load C++ extensions“)问题的一种解决方案
但是在虚拟环境中这么做了之后仍然报相同错误。思考良久之后突然灵光乍现,主要原因应该是我把一个项目嵌入到了diffusers(用于训练扩散模型的网络框架)中,报错位置的代码极有可能是找不到当前虚拟环境中的ninjia依赖,但是也不影响我的训练;因此只需要在base环境中安装ninjia就好了。经过尝试果然是这样。
2024-05-17 21:22:36
1028
3
原创 Diffusers multi-batch下生成随机种子以创建生成器时的注意事项
在generator中采用multi-batch形式生成结果时,两种定义随机种子创建生成器的方法会有不同的效果。
2024-05-17 10:28:53
320
原创 python sum(numpy数组, axis=n)的理解
对numpy多维数组在指定维度(axis=n控制)上求和,例如:sum(n, 2)n为:
2023-03-22 15:02:43
227
原创 ModuleNotFoundError: No module named ‘torch‘
后来仔细想想,最初配置环境时,是以管理员身份运行的cmd,因此切换到管理员状态下的cmd,继续运行torch相关的程序,运行成功。在cmd中check python的版本,发现是3.9,我记得我配置的python版本是3.8才对;
2022-12-14 15:33:14
875
原创 Henzler等,Generative Modelling of BRDF Textures from Flash Images [SIGGRAPH Asia, 2021] 论文项目环境配置Win10
这个深度学习项目从Linux平台迁移到Windows平台并没有遇到什么特殊的问题。简要步骤如下 :Cuda、torch、python的版本和硬件平台的GPU必须满足匹配条件,否则没办法运行项目。具体确定方法是:先根据GPU型号确定可用的Cuda版本。例如博主硬件是RTX 3090,这里选用了CUDA 11.7。这一步也可以不用做,仅仅是起到可视化的作用,基本操作一般在在cmd里进行。在这一步为了避免.yml文件中设定的库版本和CUDA版本产生冲突,我直接将版本号删去了:并采用如下命令创建虚拟环境:创
2022-12-03 16:23:39
751
原创 图形写稿基础,含teaser figure的特殊排版方法
Abstract:摘要非常重要,一般定下粗稿后需要接着写摘要。摘要提交会比正文早。摘要内容不会描述算法细节,基本思路是:陈述待解决目标/问题是什么;目前有哪些算法并不能满足质量和性能的要求;因此我们提出了什么方法;结果是什么(有多好);有什么应用;:介绍部分有点像扩充内容的摘要,不过依旧不会介绍我们算法的详细细节。先介绍目标效果是什么然后表示目前的方法很难做到;
2022-10-26 16:55:04
2213
原创 visual studio 2019 .slang文件语法高亮插件SLang-VS-Plugin
使用visual studio 2019打开该项目,并右键解决方案重新生成所有文件。安装前需要关闭所有的vs窗口,安装时如果弹出窗口有end tasks按钮,点击即可。并不直接支持该类型文件的语法高亮,因此笔者推荐了。来提供**.slang文件**的语法高亮支持。所使用的着色器文件。
2022-09-23 20:49:10
1310
2
原创 2022中旬学习计划指南
只做项目不充电,热爱的事业会生厌~一、研一、研二工作不知不觉研一、研二已经快要结束了。研一、研二期间我主要的参与的工作如下:基于Vulkan内核的云渲染项目(作为本科毕业设计完成答辩);基于paraview开源可视化框架的云平台渲染项目(后续工作转交其他同学);基于开源项目Gravity Engine DX12项目的CAD渲染内核,采用DX12的DXR扩展实现了光栅化、光线追踪混合管线渲染(后续工作转交其它同学);预计算相关项目(即将结题,因保密协议不便透漏);复现(实际是配置)了一篇大.
2022-05-30 17:15:02
199
转载 在控制台应用程序下,创建窗口,避开WinMain函数入口(示例代码)
转载自:https://www.136.la/tech/show-149674.html#include "Windows.h"#include <iostream>using namespace std;#define MAX_LOADSTRING 100// 全局变量: HINSTANCE hInst; // 当前实例std::wstring szTitle = L"RenderCore"; // .
2021-07-16 14:48:05
590
原创 DX10/11/12、OpenGL4.0、Vulkan开启Flat shading着色模式
在现代图形引擎中编程管线经历了由固定管线到可编程管线的发展,所以DX、OpenGL早期版本可以在固定管线下直接调用相关API设置着色模式为Flat shading。以DirectX9中开启Flat shading为例:Device->SetRenderState(D3DRS_SHADEMODE, D3DSHADE_FLAT);以OpenGL旧版本中开启Flat shading为例:glShadeModel(GL_FLAT);但是目前这些图形引擎(DX10/11/12、OpenGL
2021-04-14 21:28:27
642
原创 python获取当前文件所在目录、获取上级目录的坑
在项目里为了方便迁移到其它机器不会出现路径错误,经常使用相对路径。在python中获取当前文件所在路径的方式有以下几种:第一种是获取当前文件的全路径:# 获取当前文件的路径,包括文件名print(__file__)第二种是获取当前文件所在目录:# dirname去掉文件名,返回目录print(os.path.dirname(__file__))第三种是获取当前文件的工作目录:# getcwd返回当前工作目录,有可能和当前文件所在目录不同print(os.getcwd
2021-03-24 17:13:26
6613
原创 Github上传大项目失败改用ssh传输解决RPC failed; HTTP 413 curl 22 The requested URL returned error: 413 Request Ent
错误类型:RPC failed; HTTP 413 curl 22 The requested URL returned error: 413 Request Entity Too Large第一次将本地项目上传到github/gitee上时,可以先在GitHub/gitee上新建仓库,在本地新建目录下 将网络仓库clone下来(git clone + 远程仓库链接),然后 复制项目主要文件 到该目录,接着再add、commit、push当前修改到网络仓库;如果上传内容过大会导致上传失败,此时需要将.
2021-03-12 08:39:57
1128
原创 Git见习心得
提醒:测试git管理项目前,先备份一下您的项目。 非常想要分享的其实是对github的理解,还有当您已经把本地库和线上库绑定之后,在日常维护中的最最最基本指令操作。1.对GitHub的理解GitHub是一个代码托管服务,我们可以把自己的项目提交到GitHub服务器上,通常说的GitHub包含了GitHub网页和Git本地管理系统。GitHub网页没什么好说的,它可以实现代码管理的部分功能,提供直观的内容显示,是宣传您的项目的窗口。Git本地管理系统是我(菜鸟)开发时使用比较多的部分。这个
2020-11-19 18:49:36
381
2
原创 图形学方向(渲染)相关实用工具整理
所介绍到的内容来自于师兄在讨论班上做的一堂报告,在这里分享给有志耕耘计算机图形学-渲染方向的后来人们。推荐一下师兄整理的计算机图形学学习资源list:https://github.com/FancyVin/fun-with-graphics此外师兄的GitHub主页:https://github.com/FancyVin
2020-10-14 20:11:07
783
原创 Visual Studio 2017寻找程序入口点
快捷键F10逐行运行,直接进入程序入口点。这是一个偶然,本来想按F12转到函数定义,误触了F10直接自动跳到了程序入口点。由于此前接手git上源码时一直不知清楚如何快速找到程序入口点,所以特此记录一下,留给下一个小白看。...
2020-10-09 21:19:15
2737
附件:LZMA算法应用项目及库文件.rar
2020-06-01
stb_image_write.h
2020-02-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人