手把手教你用LLaMA-Factory微调Qwen3大模型

2025-05-30 21:40:58 +0800 CST

来源: https://mp.weixin.qq.com/s/wwbLoBFTzUER7Yq38S7mEg

AI大模型与框架

↑↑↑ 点击关注，分享IT技术|职场晋升技巧|AI工具 **思路：** 在AutoDL云服务器上安装LLaMA-Factory环境，然后微调Qwen3-4B大模型 **一、环境准备** 1）购买AutoDL云主机，3090显卡的即可（如果本地有GPU机器，请用自己的），我购买AutoDL时，选择了PyTorch ![](https://pic.haode.com/img/news/fdaf01d41cbe00ffad9df8fa8be5c67d.png) 2）安装Anaconda（AutoDL上已默认安装miniconda3） Anacoda官网：https://www.anaconda.com/ 根据你自己的系统下载对应版本安装完成后，打开终端（Linux/macOS）或Anaconda Prompt（Windows），输入以下命令创建一个新环境：（AutoDL上需要做以下操作） * * conda create -n llama_factory python=3.10 conda activate llama_factory ` 3）安装Git（AutoDL已安装） * Linux：在终端输入： * sudo apt-get install git * * Windows：下载并安装Git for Windows * macOS：在终端输入： * brew install git（需先安装Homebrew） * 4）安装cuda（AutoDL已安装）参考： https://help.aliyun.com/zh/egs/user-guide/install-a-gpu-driver-on-a-gpu-accelerated-compute-optimized-linux-instance **二、下载LLaMA-Factory** 需要从GitHub下载，使用git命令下载： * * git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factory ` **三、安装依赖** 在LLaMA-Factory目录下安装所需的Python包 * pip install -e .[metrics] 如果使用GPU，确保安装支持CUDA的PyTorch： ` * pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 说明：根据您的CUDA版本调整cu118，如11.7用cu117，如果你使用的是AutoDL，CUDA版本应该是128 ` **四、下载Qwen3-4b大模型** 在modelscope社区下载，安装魔搭(modelscope)模块 * pip install modelscope 下载模型 ` * * mkdir -p /models/modelscope download --model Qwen/Qwen3-4B --local_dir /models/Qwen3-4B ` **五、准备数据集（alpaca格式）** 步骤略，可以参考前面章节[教你如何10分钟内批量制作上万条大模型微调数据集](https://mp.weixin.qq.com/s?__biz=MjM5MTk1ODE0MA==&mid=2648440606&idx=1&sn=b72045e7c2d09d2ffab3743ed51e73bc&scene=21#wechat_redirect)制作自己的数据集，然后将数据集文件放到LLaMA-Factory/data目录，例如my_data.json，然后编辑data/dataset_info.json，添加： * * * "my_dataset": 说明：alpaca_zh_demo.json是llama factory内置的一个测试数据集 ` **六、微调前的测试** 微调之前可以先加载初始模型做推理测试 * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \ --model_name_or_path /models/Qwen3-4B \ --template qwen 它会监听7860端口，如果使用AutoDL，还需要配置自定义服务： ` 1）首先要实名认证 ![](https://pic.haode.com/img/news/bebc38809645659e9972d3c198da5bec.png) 2）自定义服务控制台 --> 容器实例 --> 快捷工具 ![](https://pic.haode.com/img/news/e9ecbd3aaef527de5190f29f32380220.png)![](https://pic.haode.com/img/news/3bc9b3a94f2e4ba28a8f882fe76b9e69.png) **七、启动微调** 微调之前，先把之前的llamafactory-cli命令结束掉，然后执行下面命令，将webui打开，监听7860端口： * llamafactory-cli webui 浏览器访问 http://ip:7860, AutoDL需要做自定义服务 ` ![](https://pic.haode.com/img/news/ca979281e4df4628a12e04deddc23ee9.png)![](https://pic.haode.com/img/news/0d268d40816aa32bb65eadae4bd39e16.png)![](https://pic.haode.com/img/news/946bd617481ec05f413f1aaadc742ee4.png)![](https://pic.haode.com/img/news/691f2f25d5449ae84ac35c78a5d4e371.png)![](https://pic.haode.com/img/news/bbf6a53353a0eb965abb806d975f9779.png)![](https://pic.haode.com/img/news/30b48eeb40368256cad45b5e49f9cab2.png) **八、模型推理与测试** 微调后的模型可以用WebUI测试： * * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \ --model_name_or_path /models/Qwen3-4B \ --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \ --template qwen 浏览器访问： http://localhost:7860 ` 如果web方式访问不方便，也可以终端形式： * * * * CUDA_VISIBLE_DEVICES=0 llamafactory-cli chat \ --model_name_or_path /models/Qwen3-4B \ --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \ --template qwen ` **九、导出模型** 如果需要分享模型，导出为Hugging Face格式： * * * * * * llamafactory-cli export \ --model_name_or_path /models/Qwen3-4B \ --adapter_name_or_path saves/Qwen3-4B-Instruct/lora/my_finetune \ --template qwen \ --finetuning_type lora \ --export_dir /models/Qwen3-4B-Aminglinux 最后介绍下我的大模型课：[我的运维大模型课上线了](https://mp.weixin.qq.com/s?__biz=MjM5MTk1ODE0MA==&mid=2648440484&idx=1&sn=22835cd34be458e7f2764c09a4a270e5&scene=21#wechat_redirect)，目前还是预售期，有很大优惠。AI越来越成熟了，大模型技术也是强需求，大家一定要提前学一下。 ![](https://pic.haode.com/img/news/9ff467458f546aa83e2557a66a9255de.jpeg) ` **·············· END ··············**哈喽，我是阿铭，《跟阿铭学Linux》作者，曾就职于腾讯，有着18年的IT从业经验，现全职做IT类职业培训：运维、k8s、大模型。日常分享运维、AI、大模型相关技术以及职场相关，欢迎围观。