ChatGLM-Instruct-Tuning

基于清华的 ChatGLM-6B + Alpaca 方式进行finetune.

准备

安装依赖

pip install -r requirements.txt

下载数据

cd data
git clone https://github.com/carbonz0/alpaca-chinese-dataset

数据预处理

转化alpaca数据集为按行存储的Intruct格式数据

python cover_alpaca2jsonl.py

然后把数据划分为train.txt和valid.txt，保存在 ./data/example/路径下

训练

bash scripts/finetune.sh

推理

# 要先把文件中的 "output/your_model_dir"替换为实际模型路径
python infer.py

交流

如果有疑问和建议，欢迎加入我们的大模型交流群

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
assets		assets
scripts		scripts
.gitignore		.gitignore
README.md		README.md
chat_dataset.py		chat_dataset.py
configuration_chatglm.py		configuration_chatglm.py
cover_alpaca2jsonl.py		cover_alpaca2jsonl.py
infer.py		infer.py
modeling_chatglm.py		modeling_chatglm.py
requirements.txt		requirements.txt
run_clm.py		run_clm.py
tokenization_chatglm.py		tokenization_chatglm.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ChatGLM-Instruct-Tuning

准备

安装依赖

下载数据

数据预处理

训练

推理

交流

About

Releases

Packages

Contributors 2

Languages

thinksoso/ChatGLM-Instruct-Tuning

Folders and files

Latest commit

History

Repository files navigation

ChatGLM-Instruct-Tuning

准备

安装依赖

下载数据

数据预处理

训练

推理

交流

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages