-
Notifications
You must be signed in to change notification settings - Fork 2
/
pretraining_step.sh
43 lines (42 loc) · 1.15 KB
/
pretraining_step.sh
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
MONO_DATASET='en:./data/PRETRAIN/en.train.pth,,;hi:./data/PRETRAIN/hi.train.pth,,'
PARA_DATASET='en-hi:./data/PRETRAIN/XX.train.pth,./data/PRETRAIN/XX.valid.pth,./data/PRETRAIN/XX.test.pth'
PRETRAINED='./data/all.256.vec'
#CUDA_VISIBLE_DEVICES=0
python3 main.py \
--exp_name pretraining_step \
--transformer True \
--n_enc_layers 3 \
--n_dec_layers 3 \
--share_enc 2 \
--share_dec 2 \
--share_lang_emb True \
--share_output_emb True \
--emb_dim 256 \
--langs 'en,hi' \
--n_mono -1 \
--n_para -1 \
--mono_dataset $MONO_DATASET \
--para_dataset $PARA_DATASET \
--mono_directions 'en,hi' \
--para_directions 'en-hi,hi-en' \
--word_shuffle 3 \
--word_dropout 0.1 \
--word_blank 0.2 \
--pretrained_emb $PRETRAINED \
--pretrained_out True \
--lambda_xe_mono 1 \
--lambda_xe_para 1 \
--otf_num_processes 30 \
--otf_sync_params_every 1000 \
--enc_optimizer adam,lr=0.0001 \
--group_by_size True \
--batch_size 16 \
--epoch_size 100000 \
--stopping_criterion bleu_en_hi_valid,10 \
--freeze_enc_emb False \
--freeze_dec_emb False \
--save_periodic True
# --eval_only True \
# --reload_model dumped/opus_pretrain_temp/best-bleu_en_hi_valid.pth \
# --reload_enc True \
# --reload_dec True