-
Notifications
You must be signed in to change notification settings - Fork 52
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Validation 精度很高,但是 test 精度很低 #19
Comments
为什么我验证时有95%的正确率测试时不到56为什么高和宽都一样 |
可以分享下测试数据集吗? |
说明一下,文字识别在公开的数据集上的指标是不区分大小写(Case ins)的,这是公开论文的通用做法,请阅读相关论文。代码中在训练时为简单打印的是不区分大小写的指标。而使用test.py文件推理时为了更通用,打印了两种指标,分别是区分大小写的(Sequence Accuracy)和不区分大小写的(Case_ins)指标。希望解惑。如果为了对齐论文的指标,请看Case_ins的指标。 |
Open
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
我使用了你们提供的 lmdb 数据集来复现论文结果,训练过程中的验证集精度很高:
但是使用 test.py 读取 lmdb evaluation 数据集进行预测时得到的 Sequence Accuracy 却相去甚远。而我把 lmdb 格式的数据读取成 Image 格式并保存成 jpg 图片后再使用 test.py 预测,能得到不错的 Case_ins 精度的结果,但是 Sequence Accuracy 还是很低:
我看到读取训练集时 transform 参数是这个类:CustomImagePreprocess,但是 test.py 的 transform 却是这个类:ResizeWeight,它们的作用都是 resize。test.py 默认读取的图片数据不是 lmdb,那么我换成直接读取 lmdb 格式的测试集:test.py,并使用跟读取训练集时 transform 参数同一个 CustomImagePreprocess 得到的测试精度就会很低。请问是什么原因呢?
还有一个问题,config_lmdb.json 中指定的 n_class 应该是论文中说的 66 类吧?
请问论文中这个表格的精度是 Case_ins 精度吗?
The text was updated successfully, but these errors were encountered: