Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ver 1.0 (23.05.11) #12

Open
dnjdsxor21 opened this issue May 11, 2023 · 0 comments
Open

ver 1.0 (23.05.11) #12

dnjdsxor21 opened this issue May 11, 2023 · 0 comments

Comments

@dnjdsxor21
Copy link
Contributor

dnjdsxor21 commented May 11, 2023

ver 1.0 코드입니다

1. train

config 파일을 수정하고 train.py 파일을 실행합니다.

python src/python.py

학습이 완료되면 test_result.csv(EDA용), submission.csv(제출용) 파일이 생성됩니다.

2. train_sweep

config_sweep 파일을 수정하고 train_sweep.py 파일을 실행합니다.
sweep하고 싶은 파라미터는 리스트로 입력합니다.

3. Entity masking, Entity Marker

config 파일을 수정해서 input_format을 변경할 수 있습니다.

  • default : [CLS] Subject [SEP] Object [SEP] Sentence [SEP]
  • entity_mast : [SUBJ-PER] was born in [OBJ-CITY].
  • entity_marker_punct : @ Bill @ was born in # Seattle #.
  • typed_entity_marker_punct : @ *person* Bill @ was born in # ^ city ^ Seattle #.

4. Model

config 파일을 수정해서 model_class를 변경할 수 있습니다.

  • BaseModel : 기본 모델로, BertForSeqeunceClassification를 사용합니다.
  • ModelWithBinaryClassification : 커스텀모델, input_representation으로 처음에 [CLS]토큰이 두 개 들어갑니다. Feature/binary classification #10

요약

config 파일을 잘 확인하세요~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant