一种大于2GB ONNX模型onnxsim优化方法

Luchang-Li

已于 2024-11-30 08:36:22 修改

阅读量5.8k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：推理引擎文章标签： python ONNX onnxsim 2GB

于 2023-04-24 10:36:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013701860/article/details/130337446

推理引擎专栏收录该内容

36 篇文章

订阅专栏

文章提出了针对大于2GB的ONNX模型的优化方法，包括将卷积和矩阵乘权重替换为ConstantOfShape，利用onnxsim避免大张量的优化，以及在优化后删除ConstantOfShape并恢复原始权重。这种方法可以减少内存需求和优化时间，适用于stablediffusionunet等大模型。需要注意ConstantOfShape的value应保持唯一，以及处理动态shape的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大于2GB模型onnxsim优化很耗时，容易挂掉，而且需要特别大的系统内存。

此外直接优化大于2GB模型可能报错：

model with IR version >= 3 must be specify opset_import for ONNX。

onnx.onnx_cpp2py_export.checker.ValidationError: The model does not have an ir_version set properly.

这里提出一种比较简单的优化大于2GB ONNX模型的方法：

把initializer换成模型的输入，onnxsim后再把input换成原来的initializer。

该方法也可以用于其他优化，例如onnx infer shape和opset转换。因为大于2GB模型需要写回到文件才能调用官方infershape，而大于2GB模型opset转换无官方方法。

项目代码：

https://github.com/luchangli03/onnxsim_large_model

该方法可以成功用于stable diffusion unet, llama, chatglm等导出的onnx的优化。

该方法可以显著降低onnxsim大模型需要的内存，以及优化时间。

需要注意几点，stable diffusion unet可以采用上面的方法压缩，然后设置压缩模型的输入shape并进行onnxsim优化。但是可能一次优化并不能消除所有的shape算子等动态shape 并且可能出现time_step从[1]变成[-1]的bug。需要重新设置一次输入shape再onnxsim优化一次即可消除所有动态shape算子。最后再进行解压缩。

如果明明设置了静态shape，onnxsim还是优化不完全，可以先删除旧的shape value info，再调用onnx infer shape工具infer shape，再使用onnxsim, 参考：

onnx模型图优化/模型修改_nodes in a graph must be topologically sorted_Luchang-Li的博客-CSDN博客

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Luchang-Li 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。