使用LLaMA-Factory實現(xiàn)模型微調(diào)和量化
LLaMA-Factory框架簡介
安裝LLaMA-Factory框架并搭建微調(diào)環(huán)境
基座模型選擇和下載:根據(jù)微調(diào)任務(wù)選擇不同的基座模型
微調(diào)數(shù)據(jù)集準備
理解identity.json認知數(shù)據(jù)集
微調(diào)數(shù)據(jù)集的結(jié)構(gòu)解析
使用deepseek和知識庫生成微調(diào)數(shù)據(jù)集
開始使用LoRA訓練模型
使用訓練模型進行聊天測試
理解模型訓練之超參數(shù)調(diào)優(yōu)
合并和導出模型
使用訓練后模型進行測試
理解量化理論機制
什么是模型量化
模型量化機制探討
實現(xiàn)將Lora模型進行量化
將導出模型轉(zhuǎn)成Ollama,實現(xiàn)部署
使用vLLM部署微調(diào)模型
搭建和使用LLaMA-Factory WebUI
使用WEBUI實現(xiàn)模型Lora微調(diào)、合并和導出
使用代碼方式使用Lora模型微調(diào)
使用代碼方式實現(xiàn)Lora模型合并和導出