【大模型量化】AWQ 量化和 INT8 量化的区别是什么？

最新推荐文章于 2025-06-11 21:30:00 发布

页页读

最新推荐文章于 2025-06-11 21:30:00 发布

阅读量2.6k

点赞数 30

CC 4.0 BY-SA版权

分类专栏：大模型基础知识文章标签：人工智能大模型量化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014386899/article/details/141167752

1. INT8 量化原理

INT8 量化（8位整数量化）是一种深度学习模型优化技术，通过将模型中的浮点数权重和激活值转换为8位整数，从而减少计算和存储需求。INT8 量化主要用于提升推理速度和降低内存带宽需求。以下是 INT8 量化的核心原理和步骤：

1. 量化概述

量化将浮点数（通常为32位浮点数）转换为较低位数（如8位整数），以减少模型的存储空间和计算量。在 INT8 量化中，浮点数被映射到0到255之间的8位整数。

2. 量化过程

2.1 确定量化范围

范围计算：首先确定要量化的浮点数的范围。这通常包括权重和激活值的最小值和最大值。可以通过统计数据来计算这些范围。
缩放因子：根据范围计算缩放因子（scale factor）。缩放因子是将浮点值转换为整数的比例因子，计算方式为：
$scale=max_float−min_float2n−1 \text{scale} = \frac{\text{max\_float} - \text{min\_float}}{2^{n} - 1}$
其中，max_float 和 min_float 分别是浮点数的最大值和最小值，n 是量化位数（在 INT8 中，n = 8）。
零点偏移：计算零点（zero-point），它是量化后的整数值0所对应的浮点值。零点用于将浮点数的负值正确映射到整数范围。计算公式为：
$zero_point=round(−min_floatscale) \text{zero\_point} = \text{round}\left(\frac{-\text{min\_float}}{\text{scale}}\right)$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。