Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

Open
eragonruan opened this issue Dec 5, 2017 · 13 comments

Comments

@eragonruan
Copy link
Owner

http://slade-ruan.me/2017/12/05/STR-SCCM/

@magicdream2222
Copy link

博主,我想问一下,这个中文训练出来的效果怎么样呀

@eragonruan
Copy link
Owner Author

@qq919056489 中文效果不错,英文一般般

@double-vane
Copy link

博主,您好,我想问一下,这里面的激活函数是每一层conv后都有吗?那dropout是加在激活函数后还是加在conv层后

@eragonruan
Copy link
Owner Author

@double-vane 对,卷积后面都有激活函数,dropout加在激活函数之后

@double-vane
Copy link

@eragonruan 十分感谢,对我很有帮助。那能问您一个细节问题吗?参数初始化是用的Xavier还是gaussian?

@double-vane
Copy link

您好,我有个疑问,论文中说自己的model很小,0.41M,这个是作者在何凯明大神1K层的ResNet上的模型大小吗?还是论文中3.2节构建的网络?还是哪个?我自己构建的3.2节的模型大小并没有那么小(caffe),是我理解有误还是我构建网络不对呢

@eragonruan
Copy link
Owner Author

@double-vane 我用的Xavier,0.41M的模型不是何凯明的残差网络,应该只是用了残差形式连接的他们自己的网络。

@double-vane
Copy link

@eragonruan 嗯嗯,感谢您的回复,我理解错误这个0.41M的M(兆),这个应该是百万参数的意思,谢谢您的回复!

@bianlongpeng
Copy link

博主,你好,请问你的github上面text-detection-ctpn源码下checkpoints/下的model从哪里下载?想复现下代码没找到额

@zzzzzzrc
Copy link

请问,这篇文章的思想是把一张图片按照siding window分割成多个小图,然后这组小图做batch输入cnn吗,这样看的话,整体网络的batch size=1?

@eragonruan
Copy link
Owner Author

@zzzzzzrc 对的,是把一个文本行首先分割成小图,但是实际训练的时候一次可以放多个文本行一起训练的,也就是说这个网络的batchsize不一定要是1

@perrywu1989
Copy link

博主,我能加你联系方式一起讨论吗,这里我说下自己的想法,我觉得CRNN的缺点在于感受野不是自适应的,很难不住到II或者11这种连接很紧密的字符,我现在一直在CRNN上面尝试做感受野的调整,发现不同感受野差别很多,这个文章好像也存在这个问题吧?(我还没看,抱歉),因为他都是固定32by32的,我的微信chayeDD

@KingfaLuis
Copy link

最近也是需要研读一下这篇文章,感兴趣的读者可以加我的微信共同探讨:wxid1387784879099up

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

7 participants