关于stylegan2-ada中的bias_act_plugin

最新推荐文章于 2025-06-13 11:40:29 发布

asue-小白

最新推荐文章于 2025-06-13 11:40:29 发布

阅读量3.3k

点赞数 6

CC 4.0 BY-SA版权

本文链接：https://blog.csdn.net/weixin_44180836/article/details/119615131

博客作者遇到了一个程序运行异常的问题，程序在重新运行后停滞在'设置插件bias_act_plugin'步骤。通过分析log并查找file_baton.py相关资料，发现问题是由于互斥锁导致的。解决方案集中在torch.utils.cpp_extension.load函数上，该函数因互斥锁而卡住无响应。最后，作者成功解决了这一问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本来运行正常的程序，重新运行之后一直卡在“setting up plugin bias_act_plugin”。根据log内容百度了一下file_baton.py，最终找到解决方法。
由于互斥锁的存在，程序停滞。
torch.utils.cpp_extension.load卡住无响应
感谢大佬！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

asue-小白

关注关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

DragGAN报错Setting up PyTorch plugin “bias_act_plugin“... Failed!和FAILED: bias_act.cuda.o解决办法

满目星辰

06-28

1920

DragGAN终于开源了，于是下载安装结果报错了，查了一大堆资料，都没有解决办法，于是安装了个ChatGLM2-6B，在上面将自己的问题粘贴上去，给出了解决方案，结果直接解决了一天没有解决的问题。我直接按照它给的命令使用pip install nvcc ninja直接安装，之后再运行DragGAN，结果果然能够运行了。我在ChatGLM2-6B里面将输出信息输入，然后叫ChatGLM2-6B给出具体解决方案。有任何问题可以关注公众号添加作者，进入科技交流群，一起学习，一起努力！

报错解决：RuntimeError: Error building extension ‘bias_act_plugin‘

2301_77554343的博客

01-09

2234

解决报错：Setting up PyTorch plugin "bias_act_plugin"... Failed! RuntimeError: Error building extension 'bias_act_plugin' ninja: build stopped: subcommand failed.

2 条评论您还未登录，请先登录后发表或查看评论

stylegan3:Setting up PyTorch plugin “bias_act_plugin“... Failed或“upfirdn2d_plugin“... Failed

地理信息系统、摄影测量与遥感、人工智能

02-23

8366

stylegan3: Setting up PyTorch plugin "bias_act_plugin"... Failed Setting up PyTorch plugin "upfirdn2d_plugin"... Failed

StyleGAN-xl Setting up PyTorch plugin “bias_act_plugin“... Failed或“upfirdn2d_plugin“... Failed

最新发布

weixin_43940981的博客

06-13

242

目录（若存在），并重新运行。

【已解决】Setting up PyTorch plugin “bias_act_plugin“... Failed!ModuleNotFoundError: Nomodulenamed ‘imgui

BetrayFree的博客

09-22

3105

最近在复现DragGAN的时候遇到了一些小问题，这个效果太令人赞叹了。在自己电脑跑的过程中，出现了以下问题，包括且不限于：Setting up PyTorch plugin "bias_act_plugin"... Failed!、ModuleNotFoundError: No module named 'imgui'，ModuleNotFoundError: No module named 'glfw',RuntimeError: Tried to instantiate dummy base cl

RuntimeError: Error building extension ‘bias_act_plugin‘: [1/3] /usr/local/cuda-11.3:/usr/local/cuda

july_Ai的博客

09-21

1036

看了一下报错日志，大致和nvcc有关，要保证cuda版本是一致的。用绝对路径的nvcc命令时会发现是11.1，和我的环境中不一样。然后用绝对路径nvcc命令时：会发现都是一致的了。torch对应的cuda版本：cuda11.3。（1）环境配置文件：（我配的是11.3。

【已解决】报错RuntimeError: Error building extension ‘bias_act_plugin‘: [1/2]

m0_59841476的博客

06-12

1698

解决运行StyleGAN3模型的时候遇到的 Setting up PyTorch plugin "bias_act_plugin"... Failed 的问题

stylegan2-ada-pytorch-tools:与Nvidia的stylegan2配合使用的工具和脚本

03-18

stylegan2-ada-pytorch-工具与Nvidia的stylegan2配合使用的工具和脚本合作包含用于设置Google Colab的Shell脚本。在终端中运行bash install_env.sh 键入conda activate stylegan 运行bash install_stylegan.sh

Setting up PyTorch plugin “bias_act_plugin“... Failed!

yuhaix的博客

01-16

1485

但是我跑的项目要求cudatoolkit=11.1，因此，你还需要在本地系统中重装一个cuda(cudatoolkit=11.1),如下，我已经有两个啦。如何通过以上，你还没有解决，那就是你gcc的版本不符合cuda的版本，cuda11.1 要求gcc的版本为10以上哦，别忘了升级一下。接下来要配置环境 vim ~/.bashrc (前面注释掉的那一堆是我头大了好久，苦苦借鉴他人设置的，对我都没有，哭晕～)（在不改变环境配置的时候，默认使用的是，本地系统的cuda(我的是12.2)

stylegan2 示例命令fused_bias_act.cu环境配置异常(无法打开包括文件: “tensorflow/core/framework/op.h”)

qq_39024280的博客

12-29

3489

问题描述在python运行stylegan2示例时,运行过程中,触发fused_bias_act.cu中的异常,可以看到fused_bias_act.cu中实际上是用c/c++写的实现代码. 仔细看异常信息会发现这句话无法打开包括文件: “tensorflow/core/framework/op.h”: 解决策略 1.首先确保你安装了c/c++工具集,版本号可以有些不一致,这影响不大,在这里: 2.确定你已经调整了工具集引用 3.这里我取巧做了步骚操作,不合理但最简单:

解决stylegan3运行卡在‘Setting up PyTorch plugin “bias_act_plugin“’的问题

weixin_46114765的博客

04-10

1956

在此之前下载了stylegan3代码，安装好对应的环境后，经测试，gen_image.py、gen_vedio.py文件均可以成功运行，过了一段时间后，不知道为什么，这两个文件竟然都不能运行了？！

stylegan2-ada-pytorch:StyleGAN2-ADA-官方PyTorch实施

03-07

StyleGAN2-ADA —官方PyTorch实施用有限的数据训练生成对抗网络Tero Karras，Miika Aittala，Janne Hellsten，Samuli Laine，Jaakko Lehtinen，Timo Aila 摘要：使用太少的数据训练生成对抗网络（GAN）通常会导致判别器过度拟合，从而导致训练分散。我们提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据环境中的训练。该方法不需要更改丢失功能或网络体系结构，并且适用于从头开始训练以及在其他数据集上对现有GAN进行微调时。我们在几个数据集上证明，仅使用几千个训练图像就可以取得良好的效果，并且通常将StyleGAN2的结果与较少的图像数量级进行匹配。我们希望这将为GAN开辟新的应用程序域。我们还发现，实际上，广泛使用的CIFAR-10只是一个有限的数据基准，并将记录FID从5.59提高到2.4

ADA_Project:StyleGAN2-ada再现性挑战

03-20

ADA_项目

stylegan2-ADAxCLIP:你的猫看起来像魔鬼！

03-22

stylegan2-ADAxCLIP 一个简单的笔记本，灵感来自笔记本： : 可以根据模型想象句子中的图片（在Stylegan2-ada架构和CLIP模型）附带一个cli： usage: stylegan2ada-image [-h] [-i TEXT] -n NETWORK [-e NUM_EPOCHS] [-p TOTAL_PLOTS] [-b BATCH_SIZE] [-s STYLEGAN2_DIR] [-c CLIP_DIR] [--seed SEED] [-o OUTDIR] optional arguments: -h, --help show this help message and exit -i TEXT, --text TE

stylegan2-ada:具有自适应鉴别器增强（ADA）的StyleGAN2-官方TensorFlow实施

03-16

具有自适应鉴别器增强（ADA）的StyleGAN2 — TensorFlow正式实施用有限的数据训练生成对抗网络Tero Karras，Miika Aittala，Janne Hellsten，Samuli Laine，Jaakko Lehtinen，Timo Aila 摘要：使用太少的数据训练生成对抗网络（GAN）通常会导致判别器过度拟合，从而导致训练分散。我们提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据体制中的训练。该方法不需要更改丢失功能或网络体系结构，并且适用于从头开始训练以及在其他数据集上对现有GAN进行微调时。我们在几个数据集上证明，仅使用几千个训练图像就可以取得良好的效果，并且通常将StyleGAN2的结果与较少的图像数量级进行匹配。我们希望这将为GAN开辟新的应用程序域。我们还发现，实际上，广泛使用的CIFAR-10只是一个有限的数据基准，并将

stylegan2-ada-MorphNF1

03-30

StyleGAN2应用于小型NF1数据集。请参阅MakeNf1Data文件夹。请与我们联系以获取我们的预训练模型。值得注意的变化（来自原始的Nvidia来源）是 training/networks.py dense_layer_with_average 。 train_with_labels.py 。（原始自述文件）具有自适应鉴别器增强（ADA）的StyleGAN2 — TensorFlow正式实施用有限的数据训练生成对抗网络Tero Karras，Miika Aittala，Janne Hellsten，Samuli Laine，Jaakko Lehtinen，Timo Aila 摘要：使用太少的数据训练生成对抗网络（GAN）通常会导致判别器过度拟合，从而导致训练分散。我们提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据体制中的训练。该方法不需要更改丢失

StyleGAN2源码以及相应译文

12-16

4564

2018年12月，美国芯片巨头英伟达开发的一款超逼真面部生成器。这个基于GAN的模型表现得非常好，以至于大多数人都无法分辨它是一张合成的“假脸”。2019年2月，英伟达宣布将开源这款漂亮的工具，并将其命名为“StyleGAN”。这一机器学习技术是为了生成模拟真实图像的新图像。使用StyleGAN，不同于大多数其他生成器，可以定制不同的因素来更改生成的图像的结果。 Styl...

跑stylegan2模型时报错：fused_bias_act.cu环境配置异常(无法打开包括文件: “tensorflow/core/framework/op.h”

weixin_45869622的博客

03-21

823

后发现是因为styleGAN2用的版本是1.14.0，这个版本op.h就在tensorflow/core/framework/目录下，而我使用的是1.15，但在1.15.0中tensorflow目录结构改变了，所以提示找不到文件。为了扩充原有的数据集，我使用StyleGAN2模型，在运行run_training.py文件时遇到报错无法打开包括文件: “tensorflow/core/framework/op.h”找到anaconda下相应的虚拟环境下的core文件夹，将其打包复制。

StyleGAN阅读笔记和源码阅读

我的博客有点东西

06-21

2547

StyleGAN以Style为名，有两个含义：1. 借鉴在风格迁移中常用到的adain操作。2. 通过adain 把不同层次的样式（style）embed到不同分辨率的特征图上，能够影响不同层次（level）的生成图像的样式。高级层次有人脸的姿态，脸型，发型等宏观的样式，低级点的有细小的细节风格（脸的细节，像源A还是源B，），眼镜。 StyleGAN以渐进式GAN为baseline，通过改进了一些方面，来生成高清（1024*1024）逼真的人脸图像。这些改进主要有：改进渐进GAN的上采样层和超参数添

1 error detected in the compilation of "C:/Users/lenovo/AppData/Local/torch_extensions/torch_extensions/Cache/py38_cu121/bias_act_plugin/3cb576a0039689487cfba59279dd6d46-nvidia-geforce-rtx-4060-laptop-gpu/bias_act.cu". bias_act.cu ninja: build stopped: subcommand failed. stylegan训练时出现这个错误什么原因

03-28

<think>嗯，用户在使用StyleGAN训练时遇到了编译错误，具体是关于bias_act.cu文件的错误，ninja构建失败。首先，我需要回忆一下常见的CUDA编译错误可能的原因。可能的原因包括CUDA环境配置问题、PyTorch版本与CUDA版本不兼容、GPU算力不匹配、或者代码本身的兼容性问题。首先，用户提到错误发生在编译bias_act_plugin这个扩展时，这可能是一个自定义的CUDA内核。这类问题通常和CUDA工具链有关。比如，用户安装的PyTorch版本可能和本地安装的CUDA版本不一致。例如，如果用户用CUDA 12.1编译，但PyTorch是为CUDA 11.x构建的，就可能出现兼容性问题。接下来，检查GPU算力。NVIDIA RTX 4060移动版的GPU架构是Ada Lovelace，算力版本可能是8.9。如果PyTorch扩展的编译过程中没有正确指定算力，或者CUDA工具包不支持该算力，就会导致编译失败。需要确认PyTorch是否支持该算力，或者在编译时添加对应的算力标志。另外，ninja构建工具的问题也可能导致失败。可能ninja版本过旧，或者构建过程中缺少依赖项。用户可能需要升级ninja或者安装必要的构建工具，比如C++编译器和CUDA开发包。还有可能是PyTorch的扩展缓存问题。有时候旧的编译缓存会导致问题，清除缓存后重新编译可能会解决。用户可以尝试删除缓存目录，或者使用PyTorch的强制重建选项。此外，检查PyTorch官方是否支持当前的环境配置，比如CUDA 12.1是否被PyTorch版本支持。例如，PyTorch 2.0及以上版本才开始支持CUDA 12.x，如果用户使用的是较旧的PyTorch版本，可能需要升级。用户的环境变量是否正确设置也可能影响编译，比如PATH中是否包含正确的CUDA路径，或者是否有多个CUDA版本冲突。总结可能的解决步骤：首先确认CUDA和PyTorch版本兼容性，检查GPU算力支持，升级或重新安装相关工具链，清除缓存，尝试重新编译。如果问题依旧，可能需要检查具体的错误日志，或者联系项目维护者获取支持。</think>在StyleGAN训练过程中出现`bias_act.cu`编译错误，通常与CUDA环境配置、GPU算力兼容性或PyTorch扩展编译相关。以下是分步排查和解决方案： --- ### **1. 核心原因分析** - **CUDA版本与PyTorch版本不匹配** PyTorch对CUDA版本有严格依赖。例如： - 若安装的PyTorch是预编译的`cu121`（CUDA 12.1）版本，需确保本地CUDA Toolkit版本完全匹配。 - 使用`nvidia-smi`查看驱动支持的最高CUDA版本，`nvcc --version`查看当前CUDA Toolkit版本，`torch.version.cuda`查看PyTorch实际使用的CUDA版本。三者需一致。 - **GPU算力（Compute Capability）不支持** RTX 4060 Laptop GPU基于Ada Lovelace架构（算力8.9），若PyTorch扩展未明确支持该算力，编译会失败。可通过[CUDA官方算力表](https://developer.nvidia.com/cuda-gpus)确认GPU算力。 - **PyTorch扩展编译环境缺失** PyTorch自定义CUDA扩展需要完整的构建工具链（如`gcc`、`ninja`、`CUDA Toolkit`）。 - **缓存冲突或旧文件残留** 旧的编译缓存可能导致新环境下的编译错误。 --- ### **2. 具体解决步骤** #### **步骤1：验证CUDA与PyTorch版本匹配** ```python # 在Python中运行以下代码检查版本 import torch print(torch.__version__) # PyTorch版本 print(torch.version.cuda) # PyTorch使用的CUDA版本 print(torch.cuda.get_device_name(0)) # GPU型号 ``` - 若本地CUDA Toolkit版本（如12.1）与PyTorch的CUDA版本不一致，需重新安装PyTorch： ```bash # 例如安装CUDA 12.1版本的PyTorch pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 ``` --- #### **步骤2：检查GPU算力兼容性** - 确认PyTorch是否支持Ada Lovelace（算力8.9）： ```python # 检查PyTorch支持的算力列表 print(torch.cuda.get_arch_list()) # 输出应包含'sm_89'（Ada Lovelace） ``` - 若未包含`sm_89`，需通过环境变量强制指定算力： ```bash # 在训练命令前添加 export TORCH_CUDA_ARCH_LIST="8.9" ``` --- #### **步骤3：安装完整构建工具链** - 确保已安装以下依赖： ```bash # Ubuntu示例 sudo apt-get install ninja-build g++ nvidia-cuda-toolkit ``` --- #### **步骤4：清除缓存并强制重建扩展** - 删除PyTorch扩展缓存： ```bash rm -rf ~/.cache/torch_extensions/ ``` - 在训练命令中添加`--force-rebuild`选项（部分StyleGAN实现支持）： ```bash python train.py --force-rebuild ``` --- #### **步骤5：手动编译扩展（高级）** - 进入扩展源码目录，手动编译并查看具体错误： ```bash cd C:/Users/lenovo/AppData/Local/torch_extensions/torch_extensions/Cache/py38_cu121/bias_act_plugin/ ninja -v # 显示详细编译日志 ``` 根据日志中的错误信息进一步调整（如修复代码兼容性）。 --- ### **3. 附加建议** - **使用Docker环境**：通过NVIDIA官方镜像（如`nvcr.io/nvidia/pytorch:23.10-py3`）避免环境冲突。 - **降级CUDA版本**：若问题持续，尝试使用PyTorch官方更稳定的CUDA版本（如CUDA 11.8）。 --- ### **总结** 该错误通常由**环境版本冲突**或**GPU算力不支持**导致。优先检查CUDA与PyTorch版本匹配性，强制指定算力`sm_89`，并确保构建工具链完整。若问题仍未解决，建议提供完整的错误日志进一步分析。