python_code_assistant

finetuned Salesforce/codegen-350M-mono model into a python code assistant using peft.
Dataset used : iamtarun/python_code_instructions_18k_alpaca
Base model size : 350 Million
Total tokens Trained for 6 epochs : 23 Million
Trainable parameters of the peft model : 2,621,440

Metrics

17k samples for Training.
3.5 Hours on Tesla P100 -16 GB (Free kaggle GPU support)
Dataset : https://huggingface.co/datasets/iamtarun/python_code_instructions_18k_alpaca

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
README.md		README.md
Train_python-code-assistant.ipynb		Train_python-code-assistant.ipynb
test_codegenmodel.ipynb		test_codegenmodel.ipynb