论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

eragonruan · 2017-12-05T07:23:33Z

http://slade-ruan.me/2017/12/05/STR-SCCM/

magicdream2222 · 2018-01-24T08:31:41Z

博主，我想问一下，这个中文训练出来的效果怎么样呀

eragonruan · 2018-01-26T14:13:05Z

@qq919056489 中文效果不错，英文一般般

double-vane · 2018-02-28T08:47:44Z

博主，您好，我想问一下，这里面的激活函数是每一层conv后都有吗？那dropout是加在激活函数后还是加在conv层后

eragonruan · 2018-03-07T02:43:04Z

@double-vane 对，卷积后面都有激活函数，dropout加在激活函数之后

double-vane · 2018-03-07T02:50:39Z

@eragonruan 十分感谢，对我很有帮助。那能问您一个细节问题吗？参数初始化是用的Xavier还是gaussian？

double-vane · 2018-03-09T02:49:17Z

您好，我有个疑问，论文中说自己的model很小，0.41M，这个是作者在何凯明大神1K层的ResNet上的模型大小吗？还是论文中3.2节构建的网络？还是哪个？我自己构建的3.2节的模型大小并没有那么小（caffe），是我理解有误还是我构建网络不对呢

eragonruan · 2018-03-22T02:17:22Z

@double-vane 我用的Xavier，0.41M的模型不是何凯明的残差网络，应该只是用了残差形式连接的他们自己的网络。

double-vane · 2018-03-22T02:21:02Z

@eragonruan 嗯嗯，感谢您的回复，我理解错误这个0.41M的M(兆),这个应该是百万参数的意思，谢谢您的回复！

bianlongpeng · 2018-05-31T09:12:24Z

博主，你好，请问你的github上面text-detection-ctpn源码下checkpoints/下的model从哪里下载？想复现下代码没找到额

zzzzzzrc · 2018-06-22T10:22:48Z

请问，这篇文章的思想是把一张图片按照siding window分割成多个小图，然后这组小图做batch输入cnn吗，这样看的话，整体网络的batch size=1？

eragonruan · 2018-07-08T07:59:22Z

@zzzzzzrc 对的，是把一个文本行首先分割成小图，但是实际训练的时候一次可以放多个文本行一起训练的，也就是说这个网络的batchsize不一定要是1

perrywu1989 · 2018-07-17T10:00:45Z

博主，我能加你联系方式一起讨论吗，这里我说下自己的想法，我觉得CRNN的缺点在于感受野不是自适应的，很难不住到II或者11这种连接很紧密的字符，我现在一直在CRNN上面尝试做感受野的调整，发现不同感受野差别很多，这个文章好像也存在这个问题吧？（我还没看，抱歉），因为他都是固定32by32的，我的微信chayeDD

KingfaLuis · 2020-07-29T14:30:01Z

最近也是需要研读一下这篇文章，感兴趣的读者可以加我的微信共同探讨：wxid1387784879099up

eragonruan added gitment http://slade-ruan.me/2017/12/05/STR-SCCM/ labels Dec 5, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

eragonruan commented Dec 5, 2017

magicdream2222 commented Jan 24, 2018

eragonruan commented Jan 26, 2018

double-vane commented Feb 28, 2018

eragonruan commented Mar 7, 2018

double-vane commented Mar 7, 2018

double-vane commented Mar 9, 2018

eragonruan commented Mar 22, 2018

double-vane commented Mar 22, 2018

bianlongpeng commented May 31, 2018

zzzzzzrc commented Jun 22, 2018

eragonruan commented Jul 8, 2018

perrywu1989 commented Jul 17, 2018

KingfaLuis commented Jul 29, 2020

论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

论文笔记--Scene text recognition with sliding convolutional character models - 阮少辉的博客 | Slade Blog #16

Comments

eragonruan commented Dec 5, 2017

magicdream2222 commented Jan 24, 2018

eragonruan commented Jan 26, 2018

double-vane commented Feb 28, 2018

eragonruan commented Mar 7, 2018

double-vane commented Mar 7, 2018

double-vane commented Mar 9, 2018

eragonruan commented Mar 22, 2018

double-vane commented Mar 22, 2018

bianlongpeng commented May 31, 2018

zzzzzzrc commented Jun 22, 2018

eragonruan commented Jul 8, 2018

perrywu1989 commented Jul 17, 2018

KingfaLuis commented Jul 29, 2020