Skip to content

Latest commit

 

History

History
57 lines (31 loc) · 2.54 KB

README.md

File metadata and controls

57 lines (31 loc) · 2.54 KB

KoVicuna icon

Update Logs


KoVicuna: Korean Vicuna Model based on Vicuna (feat. LLAMA)

Vicuna 모델을 학습한 방식과 동일한 방식과 모델셋으로 학습을 진행한, 한국어 Vicuna 모델입니다.

예시

스크린샷 2023-04-20 오후 12 59 37

데이터셋 제작 방법

데이터셋은 기본적으로 ShareGPT에서 제공한 62만 대화문 데이터셋을 기반으로 합니다.

해당 대화문을 DeepL 을 통해 모두 번역했습니다. 번역본 링크

학습경과

  1. 번역된 62만 대화문과 Vicuna 7B 를 준비
  2. A100 * 8 개로 15시간 동안 학습 진행
  3. 자세한 학습 내역은 이곳을 참고해주세요.

W B Chart 2023  4  20  오후 3_57_14

데모

코랩

코랩프로일 경우 코랩에서 바로 사용해 보실수 있습니다.

주소를 통해 코랩에 들어간후 자세한 가이드를 따라해주세요.

우바부가 (text-generation-webui)

해당 모델은 비쿠나1.1v으로 학습되었으므로 우바부가를 사용할경우 Character 탭 에서 다음을 설정해주세요.

  1. Your name -> USER:
  2. Character's name -> ASSISTANT:

가중치공개

  • 준의 허깅페이스에서 가중치 를 확인할 수 있습니다.

Author