2026/2/15 15:18:15
网站建设
项目流程
华为云怎么做网站,重庆建设局网站,做电子商务网站实验总结,网站程序问题一、PTQ 模型量化问题
1.1、模型问题
基于公版模型训练#xff0c;没有对模型做范围做约束#xff0c;weight_decay1e-6#xff0c; 训练出的 float 模型数值分布很大#xff0c;如图 2#xff0c;可以看到模型的后面几层数据分布范围很广#xff0c;最大阈值超过了 8000…一、PTQ 模型量化问题1.1、模型问题基于公版模型训练没有对模型做范围做约束weight_decay1e-6 训练出的 float 模型数值分布很大如图 2可以看到模型的后面几层数据分布范围很广最大阈值超过了 8000对我们量化来说并不友好。1.2、算子问题如图 2基于全 int16 算子配置量化当前版本 resize 算子有约束请查阅工具链算子支持情况只能支持 int8 量化即使配置了 int16但算子依旧退化到 int8因此算子的 cosine 相似度也比较低基于此阈值max_qscale6653/12752.385此 scale 过于大并不能精细化量化模型所以全 BPU 算子的整体精度都不高。图 1 公版训练 float 模型二、精度优化2.1、cpu 高精度定位resize 算子有限制但对于回退 cpu 算子就能实现 float 精度推理配置如图 2图 2 配置 cpu 算子配置了算子后精度提升了如图 3可视化效果对比如图 4整体量化精度可对齐定位到了具体问题就是 resize 算子限制导致。图 3 cpu 算子精度图 4 cpu 算子可视化精度2.2、添加 bn加大 weight_decay在最后的 conv 层后加上 bn 算子限制特征数据分布同时 weight_decay 从 1e-6 调整到 1e-3整体数据范围如图 5、图 6模型的数据分布变小了最后的 cosine 相似度精度也很高非常利于 int8 量化后期配置了 int8 量化模型也可实现高精度量化。图 5 全 int16 量化图 6 部分 int16 量化