onnx模的量子化

2024-06-12 16:53:24 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我正在尝试使用https://github.com/microsoft/onnxruntime/tree/e26e11b9f7f7b1d153d9ce2ac160cffb241e4ded/onnxruntime/python/tools/quantization工具对onxx模型进行量化。在

我的量化代码如下:

import onnx
from quantize import quantize, QuantizationMode

# Load the onnx model     
model = onnx.load('3ddfa_optimized_withoutflatten.onnx')
# Quantize
quantized_model = quantize(model, quantization_mode=QuantizationMode.IntegerOps)

# Save the quantized model
onnx.save(quantized_model, 'quantized_model.onnx')

在这个方法之后,我得到的模型有0维模型,有谁能告诉我,在量子化函数中,我需要传递什么参数,这样我就能得到一个合适的模型。在


Tags: thehttps模型importgithubcomtreemodel