手把手教你用LLaMA-Factory微调Qwen3大模型

2025-05-30 21:40:58 +0800 CST
来源: https://mp.weixin.qq.com/s/wwbLoBFTzUER7Yq38S7mEg
↑↑↑ 点击关注,分享IT技术|职场晋升技巧|AI工具 **思路:** 在AutoDL云服务器上安装LLaMA-Factory环境,然后微调Qwen3-4B大模型 **一、环境准备** 1)购买AutoDL云主机,3090显卡的即可(如果本地有GPU机器,请用自己的),我购买AutoDL时,选择了PyTorch ![](https://pic.haode.com/img/news/fdaf01d41cbe00ffad9df8fa8be5c67d.png) 2)安装Anaconda(AutoDL上已默认安装miniconda3) Anacoda官网:https://www.anaconda.com/ 根据你自己的系统下载对应版本 安装完成后,打开终端(Linux/macOS)或Anaconda Prompt(Windows),输入以下命令创建一个新环境: (AutoDL上需要做以下操作) * * conda create -n llama_factory python=3.10 conda activate llama_factory  ` 3)安装Git(AutoDL已安装) * Linux:在终端输入: * sudo apt-get install git * * Windows:下载并安装Git for Windows * macOS:在终端输入: * brew install git(需先安装Homebrew) * 4)安装cuda(AutoDL已安装) 参考: https://help.aliyun.com/zh/egs/user-guide/install-a-gpu-driver-on-a-gpu-accelerated-compute-optimized-linux-instance **二、下载LLaMA-Factory** 需要从GitHub下载,使用git命令下载: * * git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factory ` **三、安装依赖** 在LLaMA-Factory目录下安装所需的Python包 * pip install -e .[metrics] 如果使用GPU,确保安装支持CUDA的PyTorch: ` * pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 说明: 根据您的CUDA版本调整cu118,如11.7用cu117,如果你使用的是AutoDL,CUDA版本应该是128 ` **四、下载Qwen3-4b大模型** 在modelscope社区下载,安装魔搭(modelscope)模块 * pip install modelscope 下载模型 ` * * mkdir -p /models/modelscope download --model Qwen/Qwen3-4B --local_dir /models/Qwen3-4B ` **五、准备数据集(alpaca格式)** 步骤略,可以参考前面章节[教你如何10分钟内批量制作上万条大模型微调数据集](https://mp.weixin.qq.com/s?__biz=MjM5MTk1ODE0MA==&mid=2648440606&idx=1&sn=b72045e7c2d09d2ffab3743ed51e73bc&scene=21#wechat_redirect)制作自己的数据集,然后将数据集文件放到LLaMA-Factory/data目录,例如my_data.json,然后编辑data/dataset_info.json,添加: * * * "my_dataset":  说明:alpaca_zh_demo.json是llama factory内置的一个测试数据集 ` **六、微调前的测试** 微调之前可以先加载初始模型做推理测试 * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \  --model_name_or_path /models/Qwen3-4B \  --template qwen 它会监听7860端口,如果使用AutoDL,还需要配置自定义服务: ` 1)首先要实名认证 ![](https://pic.haode.com/img/news/bebc38809645659e9972d3c198da5bec.png) 2)自定义服务 控制台 --> 容器实例 --> 快捷工具 ![](https://pic.haode.com/img/news/e9ecbd3aaef527de5190f29f32380220.png)![](https://pic.haode.com/img/news/3bc9b3a94f2e4ba28a8f882fe76b9e69.png) **七、启动微调** 微调之前,先把之前的llamafactory-cli命令结束掉,然后执行下面命令,将webui打开,监听7860端口: * llamafactory-cli webui 浏览器访问 http://ip:7860, AutoDL需要做自定义服务 ` ![](https://pic.haode.com/img/news/ca979281e4df4628a12e04deddc23ee9.png)![](https://pic.haode.com/img/news/0d268d40816aa32bb65eadae4bd39e16.png)![](https://pic.haode.com/img/news/946bd617481ec05f413f1aaadc742ee4.png)![](https://pic.haode.com/img/news/691f2f25d5449ae84ac35c78a5d4e371.png)![](https://pic.haode.com/img/news/bbf6a53353a0eb965abb806d975f9779.png)![](https://pic.haode.com/img/news/30b48eeb40368256cad45b5e49f9cab2.png) **八、模型推理与测试** 微调后的模型可以用WebUI测试: * * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \  --model_name_or_path /models/Qwen3-4B \  --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \  --template qwen 浏览器访问: http://localhost:7860 ` 如果web方式访问不方便,也可以终端形式: * * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli chat \  --model_name_or_path /models/Qwen3-4B \  --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \  --template qwen ` **九、导出模型** 如果需要分享模型,导出为Hugging Face格式: * * * * * * llamafactory-cli export \  --model_name_or_path /models/Qwen3-4B \  --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \  --template qwen \  --finetuning_type lora \  --export_dir /models/Qwen3-4B-Aminglinux 最后介绍下我的大模型课:[我的运维大模型课上线了](https://mp.weixin.qq.com/s?__biz=MjM5MTk1ODE0MA==&mid=2648440484&idx=1&sn=22835cd34be458e7f2764c09a4a270e5&scene=21#wechat_redirect),目前还是预售期,有很大优惠。AI越来越成熟了,大模型技术也是强需求,大家一定要提前学一下。 ![](https://pic.haode.com/img/news/9ff467458f546aa83e2557a66a9255de.jpeg) ` **·············· END ··············**哈喽,我是阿铭,《跟阿铭学Linux》作者,曾就职于腾讯,有着18年的IT从业经验,现全职做IT类职业培训:运维、k8s、大模型。日常分享运维、AI、大模型相关技术以及职场相关,欢迎围观。