[Model][MXNet] MXNet Tree LSTM example #279

szha · 2018-12-08T07:31:42Z

Description

continue #234

jermainewang · 2018-12-08T22:43:00Z

Continue from your last comments:

I wanted to use gluonnlp for this. The thing is, the vocabulary of SST is never exposed, so I cannot shuffle the embedding outside of SST class beforehand.

Maybe you could use this? https://github.com/dmlc/dgl/blob/master/python/dgl/data/tree.py#L68 . We could expose this member and doc it clearly.

szha · 2018-12-09T02:14:22Z

Not really. That's still only available after instantiating SST class.

jermainewang · 2018-12-13T20:18:01Z

@szha feel free to change the data module as you wish. We could change the dataset to accept the external vocabulary.

szha · 2018-12-14T22:37:26Z

Epoch 00019 | Step 00005 | Loss 4429.1836 | Acc 0.8113 | Root Acc 0.4727 | Time(s) 0.1602
Epoch 00019 | Step 00010 | Loss 4375.8833 | Acc 0.8147 | Root Acc 0.5352 | Time(s) 0.1601
Epoch 00019 | Step 00015 | Loss 4424.3398 | Acc 0.8081 | Root Acc 0.5703 | Time(s) 0.1600
Epoch 00019 | Step 00020 | Loss 4459.7549 | Acc 0.8126 | Root Acc 0.5156 | Time(s) 0.1598
Epoch 00019 | Step 00025 | Loss 4357.2935 | Acc 0.8135 | Root Acc 0.4961 | Time(s) 0.1596
Epoch 00019 | Step 00030 | Loss 4382.1328 | Acc 0.8193 | Root Acc 0.4961 | Time(s) 0.1593
Epoch 00019 training time 7.0636s
Epoch 00019 | Dev Acc 0.8139 | Root Acc 0.4723
0.04089534687986153
0.04089534687986153
Epoch 00020 | Step 00005 | Loss 4621.7788 | Acc 0.8121 | Root Acc 0.5508 | Time(s) 0.1593
Epoch 00020 | Step 00010 | Loss 4439.5488 | Acc 0.8166 | Root Acc 0.5117 | Time(s) 0.1593
Epoch 00020 | Step 00015 | Loss 4391.4717 | Acc 0.8120 | Root Acc 0.5430 | Time(s) 0.1593
Epoch 00020 | Step 00020 | Loss 4558.4761 | Acc 0.8156 | Root Acc 0.5586 | Time(s) 0.1594
Epoch 00020 | Step 00025 | Loss 4441.6011 | Acc 0.8065 | Root Acc 0.5977 | Time(s) 0.1592
Epoch 00020 | Step 00030 | Loss 4231.6099 | Acc 0.8100 | Root Acc 0.5195 | Time(s) 0.1593
Epoch 00020 training time 8.3417s
Epoch 00020 | Dev Acc 0.8143 | Root Acc 0.4668
0.040486393411062915
0.040486393411062915
Epoch 00021 | Step 00005 | Loss 4228.3027 | Acc 0.8208 | Root Acc 0.5469 | Time(s) 0.1595
Epoch 00021 | Step 00010 | Loss 4437.4014 | Acc 0.8099 | Root Acc 0.5117 | Time(s) 0.1594
Epoch 00021 | Step 00015 | Loss 4464.4297 | Acc 0.8190 | Root Acc 0.5273 | Time(s) 0.1595
Epoch 00021 | Step 00020 | Loss 4361.5220 | Acc 0.8083 | Root Acc 0.5117 | Time(s) 0.1598
Epoch 00021 | Step 00025 | Loss 4393.3721 | Acc 0.8164 | Root Acc 0.4961 | Time(s) 0.1598
Epoch 00021 | Step 00030 | Loss 4480.3940 | Acc 0.8085 | Root Acc 0.4727 | Time(s) 0.1601
Epoch 00021 training time 8.7110s
Epoch 00021 | Dev Acc 0.8138 | Root Acc 0.4714
------------------------------------------------------------------------------------
Epoch 00011 | Test Acc 0.8063 | Root Acc 0.4855

jermainewang · 2018-12-16T00:37:32Z

It seems that the speed has improved a lot !

jermainewang · 2018-12-17T03:51:44Z

Is this ready to be reviewed?

szha · 2018-12-17T21:23:48Z

yes, it's ready to be reviewed.

yzh119

Looks good to me.

yzh119 · 2018-12-25T04:50:50Z

examples/mxnet/tree_lstm/README.md

+> [**Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks**](http://arxiv.org/abs/1503.00075)
+> *Kai Sheng Tai, Richard Socher, and Christopher Manning*.
+
+The provided implementation can achieve a test accuracy of 51.72 which is comparable with the result reported in the original paper: 51.0(±0.5).


Does MXNet Tree-LSTM produce the same result as PyTorch? That's interesting

yzh119 · 2018-12-25T04:51:51Z

examples/mxnet/tree_lstm/train.py

+    return batcher_dev
+
+def prepare_glove():
+    if not (os.path.exists('glove.840B.300d.txt')


I think PyTorch Tree LSTM should prepare glove inside training script too.

yzh119 · 2018-12-25T05:01:26Z

examples/mxnet/tree_lstm/train.py

+                                {'learning_rate': args.lr})
+
+    dur = []
+    L = gluon.loss.SoftmaxCrossEntropyLoss(axis=1)


In DyNet implementation, they use reduction=sum instead of mean, I'm also not sure which one is better, but in practice using sum produce higher results.

zheng-da · 2018-12-26T04:37:53Z

@szha what you did improves its speed?

szha · 2018-12-27T20:19:36Z

Hybridization has more noticable effect on throughput when batch size is bigger.

szha force-pushed the treelstm branch from 2b5a81a to ed2d170 Compare December 13, 2018 19:46

szha added 3 commits December 14, 2018 20:59

TreeLSTM MXNet example

cd29a85

hybridize

5341b21

add glove download

7eb2271

szha force-pushed the treelstm branch from ed2d170 to 042f598 Compare December 14, 2018 21:13

usability

2c14e3b

szha force-pushed the treelstm branch from 042f598 to 2c14e3b Compare December 14, 2018 22:02

jermainewang requested review from yzh119 and jermainewang December 16, 2018 00:36

Merge branch 'master' into treelstm

d117b4d

szha requested a review from zheng-da December 18, 2018 06:42

szha added 2 commits December 24, 2018 10:43

Merge branch 'master' into treelstm

08d4153

Update README.md

77a2ccf

yzh119 approved these changes Dec 25, 2018

View reviewed changes

yzh119 reviewed Dec 25, 2018

View reviewed changes

zheng-da approved these changes Dec 26, 2018

View reviewed changes

Merge branch 'master' into treelstm

0c90b6f

zheng-da merged commit 1e50cd2 into dmlc:master Dec 27, 2018

szha deleted the treelstm branch December 27, 2018 20:13

jermainewang mentioned this pull request Feb 18, 2019

[Roadmap] v0.2 release checklist #302

Closed

26 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Model][MXNet] MXNet Tree LSTM example #279

[Model][MXNet] MXNet Tree LSTM example #279

szha commented Dec 8, 2018

jermainewang commented Dec 8, 2018

szha commented Dec 9, 2018

jermainewang commented Dec 13, 2018

szha commented Dec 14, 2018

jermainewang commented Dec 16, 2018

jermainewang commented Dec 17, 2018

szha commented Dec 17, 2018

yzh119 left a comment

yzh119 Dec 25, 2018

yzh119 Dec 25, 2018

yzh119 Dec 25, 2018

zheng-da commented Dec 26, 2018

szha commented Dec 27, 2018

[Model][MXNet] MXNet Tree LSTM example #279

[Model][MXNet] MXNet Tree LSTM example #279

Conversation

szha commented Dec 8, 2018

Description

jermainewang commented Dec 8, 2018

szha commented Dec 9, 2018

jermainewang commented Dec 13, 2018

szha commented Dec 14, 2018

jermainewang commented Dec 16, 2018

jermainewang commented Dec 17, 2018

szha commented Dec 17, 2018

yzh119 left a comment

Choose a reason for hiding this comment

yzh119 Dec 25, 2018

Choose a reason for hiding this comment

yzh119 Dec 25, 2018

Choose a reason for hiding this comment

yzh119 Dec 25, 2018

Choose a reason for hiding this comment

zheng-da commented Dec 26, 2018

szha commented Dec 27, 2018