[Feature] Support finetune Deepseek v2 #663

HIT-cwh · 2024-05-08T13:05:26Z

No description provided.

* support deepseek v2 * fix dispatch * refactor deepseek v2 * fix lint * fix bugs * fix bugs * delete useless codes * refactor deepseek config * rewrite DeepseekV2PreTrainedModel.from_pretrained * revert sft.py to main * delete useless codes * add deepseek v2 config * add deepseek readme * add HFCheckpointHook * optimize mixtral moe * fix bugs * delete useless codes * delete evalchathook * fix bugs * fix bugs * add moe SUPPORT_MODELS and fix HFCheckpointHook * add moe SUPPORT_MODELS and fix HFCheckpointHook * fix bugs * refactor modeling_deepseek * update deepseek readme * support deepseek v2 lite * fix bugs

HIT-cwh added 30 commits May 8, 2024 18:45

support deepseek v2

aec8f23

fix dispatch

20a7001

merge main and fix conflicts

4a3d846

refactor deepseek v2

f48044c

fix lint

bbd81ac

fix bugs

9404c7d

fix bugs

9fadc2d

Merge branch 'main' into deepseek_v2

91f9fd2

delete useless codes

41f76c6

refactor deepseek config

d4856c1

rewrite DeepseekV2PreTrainedModel.from_pretrained

3de3de6

revert sft.py to main

27d876f

delete useless codes

0fe3ea1

add deepseek v2 config

b7c6dc7

add deepseek readme

ffbdff4

add HFCheckpointHook

3ab30c7

optimize mixtral moe

ee5ec79

fix bugs

999ee25

delete useless codes

c04f3fc

delete evalchathook

300cfd5

fix bugs

a78ab8a

fix bugs

b9cb912

add moe SUPPORT_MODELS and fix HFCheckpointHook

0b135e5

add moe SUPPORT_MODELS and fix HFCheckpointHook

fdba813

fix bugs

373b060

refactor modeling_deepseek

eec04a2

update deepseek readme

930579e

support deepseek v2 lite

37d121f

merge main and fix conflicts

3e9c2eb

fix bugs

4218411

pppppM approved these changes Jun 13, 2024

View reviewed changes

pppppM merged commit f7d1aea into InternLM:main Jun 13, 2024
3 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Feature] Support finetune Deepseek v2 #663

[Feature] Support finetune Deepseek v2 #663

HIT-cwh commented May 8, 2024

[Feature] Support finetune Deepseek v2 #663

[Feature] Support finetune Deepseek v2 #663

Conversation

HIT-cwh commented May 8, 2024