Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Cập nhật kết quả thử nghiệm trong tập dữ liệu VLSP 2013 #20

Open
rain1024 opened this issue Oct 18, 2018 · 5 comments
Assignees

Comments

@rain1024
Copy link
Collaborator

Cần cập nhật thêm kết quả thử nghiệm trong tập dữ liệu VLSP 2013, giống các thử nghiệm ở paper của VnCoreNLP

@Vietdung113 vào review hộ anh nhé

@rain1024 rain1024 self-assigned this Oct 18, 2018
@rain1024
Copy link
Collaborator Author

cần có dữ liệu từ tập dữ liệu cho bài toán word segmentation (gồm 75k câu)

@rain1024 rain1024 assigned Vietdung113 and unassigned rain1024 Oct 19, 2018
@Vietdung113
Copy link

So sánh hiệu năng giữa bản 1.1.8 và 1.1.9a6
Tổng quan : Bản 1.1.8 có độ chính xác tốt hơn so với bản 1.1.9a6 tuy nhiên bản 1.1.8 có lỗi với văn bản có quá nhiều từ trong khi bản 1.1.9a6 có thể xử lý đc

@rain1024
Copy link
Collaborator Author

@Vietdung113 thanks em

Kết quả cụ thể là thế nào em?

@Vietdung113
Copy link

Test trên 10 văn bản lấy từ wiki tiếng việt

  • Bản 1.1.9a6
    1 1 9a6
  • Bản 1.1.8
    1 1 8

@rain1024
Copy link
Collaborator Author

@Vietdung113 cho anh một vài ví dụ cụ thể trường hợp 1.1.8 tách tốt hơn 1.1.9a6 nhé

rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 23, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 24, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 24, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 24, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 24, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 25, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 25, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 26, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 26, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 26, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Dec 26, 2018
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 13, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 13, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 14, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 15, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 15, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 15, 2019
rain1024 referenced this issue in undertheseanlp/word_tokenize Jan 21, 2019
@rain1024 rain1024 transferred this issue from undertheseanlp/word_tokenize Dec 25, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants