Qwen2.5 VL AWQ量化
环境
python 3.10
ms-swift 3.4.1
autoawq 0.2.9
步骤
安装环境
pip install 'ms-swift[all]' -U
pip install autoawq -U
量化
CUDA_VISIBLE_DEVICES=7,6,5,4 swift \
export --model_type qwen2_5_vl --template qwen2_5_vl --model /data/share/models/Qwen--Qwen2.5-VL-72B-Instruct \
--output_dir /data/share/models/Qwen--Qwen2.5-VL-72B-Instruct-AWQ \
--dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \
'AI-ModelScope/alpaca-gpt4-data-en#500' \
'modelscope/coco_2014_caption:validation#500' \
'swift/VideoChatGPT:Generic#500' \
--quant_n_samples 256 \
--quant_batch_size -1 \
--max_length 8192 \
--quant_method awq \
--quant_bits 4
参考
最后更新于