Superstarimage-CSDN博客

原创【MV-Adapter】多视角图像生成——维持多视角一致性的奥义

MV-Adapter是一种创新的即插即用适配器，可将现有文生图扩散模型转化为多视角生成器。该方法通过共享特征空间和单一权重Adapter模块实现多视角一致性，避免了全参数微调的高成本。其核心设计包含复制的自注意力层和并行注意力架构，能够保留预训练模型的先验知识。MV-Adapter还整合了相机参数和几何信息的统一条件编码器，支持文本或图像输入的3D生成。实验证明该方法能适配个性化模型、few-step模型和ControlNet，在768×768分辨率下保持生成质量，为3D重建提供了高质量的多视角图像。

2025-07-12 11:45:05 960

原创【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四）

本文提出了一种结合生成模型和SVBRDF预测的3D场景纹理生成方法。通过扩散模型生成多视角图像，并通过改进的U-Net架构预测SVBRDF参数，最终生成场景纹理地图集。方法解决了多视角一致性预测问题，采用首视角完整生成+重投影修复的策略。虽然对光泽材质恢复仍存在光照耦合问题，但通过神经网络架构优化和条件输入设计提升了效果。实验表明该方法能生成物理合理的纹理，支持任意视角和光照条件下的重新渲染。

2025-07-11 10:12:09 417

原创【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（三）

本文提出VideoMat方法，利用视频扩散模型从文本/图像输入生成高质量PBR材质。系统通过两个视频扩散模型协同工作：第一个模型结合几何与光照信息生成多视角材质视频；第二个模型分解出材质属性视频（basecolor、roughness、metallic）。最后通过可微分路径追踪器整合多视角数据，输出兼容标准工具链的PBR材质。该方法创新性地将视频生成技术应用于材质提取，为基于AI的3D内容创作提供了新思路。

2025-07-10 10:26:30 350

原创【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（二）

本文提出了一种基于扩散模型的多尺度3D纹理迁移方法，能够实现高保真的纹理提取与映射。该方法采用两阶段框架：首先利用多视角图像和深度图生成粗糙的UV纹理图，再通过深度感知的自注意力机制进行精细优化。创新性地引入交叉注意力模块实现纹理迁移，同时利用深度信息保持几何一致性。实验表明该方法能有效处理复杂形状，保持正确语义对应，生成高质量的纹理迁移结果。核心在于将几何深度作为强先验约束，通过注意力机制实现纹理特征传递。

2025-07-09 11:25:09 626

原创【2025强化学习最新文章阅读】Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning

本文提出了一种强化学习微调框架，用于优化few-step文本到多视角图像生成(T2MV)扩散模型。针对现有方法在跨视角一致性和推理效率上的不足，研究通过三个关键技术实现突破：1)将多视角生成建模为马尔可夫决策过程，设计联合视角奖励函数优化几何一致性；2)提出ZMV-Sampling采样技术，通过"之字形"降噪过程增强视点一致性；3)引入MV-ZigAL方法将采样优势内化到基础策略，减少推理耗时。此外，研究将优化问题重构为带约束的形式，通过拉格朗日对偶方法平衡单视角质量和多视角一致性。

2025-07-08 21:34:12 607

原创【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（一）

汇总了EGSR2025会议收录的材质、扩散模型、神经材质相关的文章随笔。

2025-07-07 12:54:07 191

原创使用conda创建python虚拟环境，并自定义路径

本文介绍了如何使用conda创建并配置虚拟环境。首先，通过指定路径创建了一个没有命名的虚拟环境，使用了Python 3.8版本。接着，通过将虚拟环境的路径添加到conda的配置中，实现了虚拟环境的命名和识别。这种方法适用于需要将虚拟环境存储于特定路径的场景，便于后续管理和使用。

2025-05-18 13:57:43 452

原创 Windows下配置diffusers环境，并安装xformers和triton时的一些注意事项

请务必注意，为了能用使用xformers加速训练，python版本务必使用3.10。

2024-11-01 15:48:08 959

原创解决更新python版本后，虚拟环境不可用的问题

【代码】解决更新python版本后，虚拟环境不可用的问题。

2024-11-01 10:56:09 374

原创 Linux服务器给用户增加额外磁盘空间时可能面临的问题及解决方法

实验室Ubuntu服务器上，我的用户账号的磁盘空间不够了，尝试使用gparted UI工具分配额外空间时，发现必须有连续的可用空间才能给我账号的磁盘空间扩容，或者是用系统U盘启动来移动账户所挂载的磁盘空间位置，这样也能凑出连续的可用空间来。博主在查阅资料并反复思索后，突然意识到新分配的磁盘空间可以直接挂载到我的用户home目录下的某个文件夹上，这样也能变相的给我的账户扩容。经过尝试，果然可以，特此记录，以利后人。

2024-07-30 15:50:46 210

原创 ValueError: The repository for contains custom code which must be executed to ...的一种解决方案

博主在使用diffusers导入自定义的数据集训练stable diffusion时，发现自定义数据集中的加载脚本不起作用（加载自定义数据集的方法见。经过多种尝试后，最终得到一种解决方法，即：在load_dataset()方法的形参中额外增加一条参数trust_remote_code=True，

2024-07-10 20:28:06 2767

原创 ModuleNotFoundError: No module named ‘****‘的一种解决方案

【代码】ModuleNotFoundError: No module named '****'的一种解决方案。

2024-07-05 22:50:20 363

原创 pycharm无法添加python解释器的解决方法

出现该错误的原因是先前创建过重名的解释器，在pycharm配置中没有完全删除干净。接着将无法添加的虚拟环境删除，再添加即可。首先在文件->设置界面，找到解释器设置。

2024-07-03 16:15:17 8712 1

原创 Hugging face上下载Stablediffusion3底模的注意事项

但是需要注意的是，使用浏览器下载下来的文件名会和官网提供的文件名不一致，因此需要我们手动参考官网的文件名字修改。有多种方法支持获取Hugging face上的底模，最简单粗暴的方法是登录官方页面直接下载。以stable diffusion 3底模为例，挂载梯子登录对应。，将所有模型下载到同一个文件夹下即可。

2024-07-03 08:59:28 321

原创 diffusers 再次继续训练LoRA时，如何导入已有的LoRA权重

有时候我们需要复用先前训练好的LoRA参数来继续进行训练。此时并不需要我们重新使用API向U-Net网络加载LoRA对应的adapter参数权重，我们可以直接通过diffusers的LoRA训练脚本的输入参数来实现断点处继续训练的需求。

2024-06-10 15:37:34 951

原创 diffusers 使用脚本导入自定义数据集

在训练扩散模型时，如果附加额外的条件图片数据，则需要我们准备相应的数据集。此时我们可以使用官网提供的脚本模板来控制导入我们需要的数据。

2024-06-07 16:45:23 881

原创 Windows下的conda，一种进入虚拟环境的方法

如果conda env list中的虚拟环境不存在，但是在本地文件存在，你还想进入虚拟环境安装依赖并使用该虚拟环境的话，可以使用如下命令启动该虚拟环境。

2024-06-04 15:59:33 576

原创论文作图之高压缩比导出PDF

笔者使用Adobe Illustrator 2023创建可编辑pdf图，按照默认的导出设置保存pdf文件时，得到的图存储很大。为了解决存储过大且还保留一定编辑功能的问题，作者实践出了一种导出pdf的设置方法。实测可以极大减小pdf存储大小，同时保留编辑功能。

2024-06-01 22:05:03 858

原创解决ModuleNotFoundError: No module named ‘dnnlib‘问题

尝试采用：pip install dnnlib解决，但下载源中并不包含该依赖

2024-05-25 10:33:57 1473

原创解决Diffuers训练LoRA，推理时LoRA权重不起作用的问题

今天碰见个离谱的事情，用diffusers官方代码训LoRA，然后推理，结果推理的时候加不加LoRA权重结果都一样，后来搞了半天才发现，新版本diffusers的推理部分模型加载的API更新了

2024-05-23 16:43:45 934

原创 accelerate训练SD-LoRA，解决ValueError: Attempting to unscale FP16 gradients.问题

训练指令需从原来的：变换一下顺序：

2024-05-22 14:10:00 1080 7

原创 accelerate在pycham中执行的方法

通常情况下我们在pycharm中默认执行python.exe xxx.py，在命令行中执行accelerate xxx.py。下面介绍如何在pycharm中执行accelerate的方法，主要目的是便于后续的代码调试。

2024-05-21 21:20:05 1056

原创 raise RuntimeError(“Ninja is required to load C++ extensions“)问题的一种解决方案

但是在虚拟环境中这么做了之后仍然报相同错误。思考良久之后突然灵光乍现，主要原因应该是我把一个项目嵌入到了diffusers（用于训练扩散模型的网络框架）中，报错位置的代码极有可能是找不到当前虚拟环境中的ninjia依赖，但是也不影响我的训练；因此只需要在base环境中安装ninjia就好了。经过尝试果然是这样。

2024-05-17 21:22:36 1028 3

原创 Diffusers multi-batch下生成随机种子以创建生成器时的注意事项

在generator中采用multi-batch形式生成结果时，两种定义随机种子创建生成器的方法会有不同的效果。

2024-05-17 10:28:53 320

原创虚拟环境命令，解决没有名字或名字是路径的问题

解决虚拟环境没有名字的问题，路径末尾必须是envs，否则会导致你的命令行中虚拟环境名字是一串路径

2024-04-24 14:02:20 512

原创 python sum(numpy数组, axis=n)的理解

对numpy多维数组在指定维度（axis=n控制）上求和，例如：sum(n, 2)n为：

2023-03-22 15:02:43 227

原创如何为三星active2手表安装自己DIY的表盘

三星手表Tizen系统表盘的DIY流程介绍

2023-02-28 16:04:41 3295

原创搜索缺失DLL文件的网站

可以搜索缺失DLL文件的网站

2023-02-27 20:51:31 283

原创 ModuleNotFoundError: No module named ‘torch‘

后来仔细想想，最初配置环境时，是以管理员身份运行的cmd，因此切换到管理员状态下的cmd，继续运行torch相关的程序，运行成功。在cmd中check python的版本，发现是3.9，我记得我配置的python版本是3.8才对；

2022-12-14 15:33:14 875

原创 Henzler等，Generative Modelling of BRDF Textures from Flash Images [SIGGRAPH Asia, 2021] 论文项目环境配置Win10

这个深度学习项目从Linux平台迁移到Windows平台并没有遇到什么特殊的问题。简要步骤如下：Cuda、torch、python的版本和硬件平台的GPU必须满足匹配条件，否则没办法运行项目。具体确定方法是：先根据GPU型号确定可用的Cuda版本。例如博主硬件是RTX 3090，这里选用了CUDA 11.7。这一步也可以不用做，仅仅是起到可视化的作用，基本操作一般在在cmd里进行。在这一步为了避免.yml文件中设定的库版本和CUDA版本产生冲突，我直接将版本号删去了：并采用如下命令创建虚拟环境：创

2022-12-03 16:23:39 751

原创图形写稿基础，含teaser figure的特殊排版方法

Abstract：摘要非常重要，一般定下粗稿后需要接着写摘要。摘要提交会比正文早。摘要内容不会描述算法细节，基本思路是：陈述待解决目标/问题是什么；目前有哪些算法并不能满足质量和性能的要求；因此我们提出了什么方法；结果是什么（有多好）；有什么应用；：介绍部分有点像扩充内容的摘要，不过依旧不会介绍我们算法的详细细节。先介绍目标效果是什么然后表示目前的方法很难做到；

2022-10-26 16:55:04 2213

原创 visual studio 2019 .slang文件语法高亮插件SLang-VS-Plugin

使用visual studio 2019打开该项目，并右键解决方案重新生成所有文件。安装前需要关闭所有的vs窗口，安装时如果弹出窗口有end tasks按钮，点击即可。并不直接支持该类型文件的语法高亮，因此笔者推荐了。来提供**.slang文件**的语法高亮支持。所使用的着色器文件。

2022-09-23 20:49:10 1310 2

原创 2022中旬学习计划指南

只做项目不充电，热爱的事业会生厌~一、研一、研二工作不知不觉研一、研二已经快要结束了。研一、研二期间我主要的参与的工作如下：基于Vulkan内核的云渲染项目（作为本科毕业设计完成答辩）；基于paraview开源可视化框架的云平台渲染项目（后续工作转交其他同学）；基于开源项目Gravity Engine DX12项目的CAD渲染内核，采用DX12的DXR扩展实现了光栅化、光线追踪混合管线渲染（后续工作转交其它同学）；预计算相关项目（即将结题，因保密协议不便透漏）；复现（实际是配置）了一篇大.

2022-05-30 17:15:02 199

转载在控制台应用程序下，创建窗口，避开WinMain函数入口(示例代码)

转载自：https://www.136.la/tech/show-149674.html#include "Windows.h"#include <iostream>using namespace std;#define MAX_LOADSTRING 100// 全局变量: HINSTANCE hInst; // 当前实例std::wstring szTitle = L"RenderCore"; // .

2021-07-16 14:48:05 590

原创 DX10/11/12、OpenGL4.0、Vulkan开启Flat shading着色模式

在现代图形引擎中编程管线经历了由固定管线到可编程管线的发展，所以DX、OpenGL早期版本可以在固定管线下直接调用相关API设置着色模式为Flat shading。以DirectX9中开启Flat shading为例：Device->SetRenderState(D3DRS_SHADEMODE, D3DSHADE_FLAT);以OpenGL旧版本中开启Flat shading为例：glShadeModel(GL_FLAT);但是目前这些图形引擎（DX10/11/12、OpenGL

2021-04-14 21:28:27 642

原创 python获取当前文件所在目录、获取上级目录的坑

在项目里为了方便迁移到其它机器不会出现路径错误，经常使用相对路径。在python中获取当前文件所在路径的方式有以下几种：第一种是获取当前文件的全路径：# 获取当前文件的路径，包括文件名print(__file__)第二种是获取当前文件所在目录：# dirname去掉文件名，返回目录print(os.path.dirname(__file__))第三种是获取当前文件的工作目录：# getcwd返回当前工作目录，有可能和当前文件所在目录不同print(os.getcwd

2021-03-24 17:13:26 6613

原创 Github上传大项目失败改用ssh传输解决RPC failed； HTTP 413 curl 22 The requested URL returned error: 413 Request Ent

错误类型：RPC failed; HTTP 413 curl 22 The requested URL returned error: 413 Request Entity Too Large第一次将本地项目上传到github/gitee上时，可以先在GitHub/gitee上新建仓库，在本地新建目录下将网络仓库clone下来（git clone + 远程仓库链接），然后复制项目主要文件到该目录，接着再add、commit、push当前修改到网络仓库；如果上传内容过大会导致上传失败，此时需要将.

2021-03-12 08:39:57 1128

原创 Git见习心得

提醒：测试git管理项目前，先备份一下您的项目。非常想要分享的其实是对github的理解，还有当您已经把本地库和线上库绑定之后，在日常维护中的最最最基本指令操作。1.对GitHub的理解GitHub是一个代码托管服务，我们可以把自己的项目提交到GitHub服务器上，通常说的GitHub包含了GitHub网页和Git本地管理系统。GitHub网页没什么好说的，它可以实现代码管理的部分功能，提供直观的内容显示，是宣传您的项目的窗口。Git本地管理系统是我（菜鸟）开发时使用比较多的部分。这个

2020-11-19 18:49:36 381 2

原创图形学方向（渲染）相关实用工具整理

所介绍到的内容来自于师兄在讨论班上做的一堂报告，在这里分享给有志耕耘计算机图形学-渲染方向的后来人们。推荐一下师兄整理的计算机图形学学习资源list：https://github.com/FancyVin/fun-with-graphics此外师兄的GitHub主页：https://github.com/FancyVin

2020-10-14 20:11:07 783

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

VulkanAPI说明文档.pdf

.slang文件语法高亮插件SLang-VS-Plugin

龙书D3DX12随书源码

附件：LZMA算法应用项目及库文件.rar

stb_image_write.h

空空如也