-
Notifications
You must be signed in to change notification settings - Fork 65
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于参数的一些调节 #23
Comments
@BboyHanat 能请问一下大概提升了多少吗。 你是在这些数据集上做纯识别的任务吗? 大概训练多久? |
|
谢谢告知 |
谢谢关注。 |
|
@BboyHanat 很有趣的发现。我之前的想法是CAM用来进行视觉对齐不需要学习具体文字特征,所以没有尝试把通道设太多,增大CAM channel可以提升性能这个是出乎我意料的。 |
是的,可能在任意形状的识别任务上可以学到更好的序列attention |
有道理,论文里的任务都是排列比较规则的,可能任意形状增多channel更有优势 |
@BboyHanat 你好除了GRU修改为LSTMCell之外还有什么网络的修改么,我进行修改之后,发现有些问题,想问下LSTMCell里面怎么设置 |
|
我的问题在于gru->lstm, 如果直接把这一行: Decoupled-attention-network/DAN.py Line 175 in 64806d7
更换为: self.rnn = nn.LSTMCell(nchannel * 2, nchannel)的话, Decoupled-attention-network/DAN.py Line 203 in 64806d7
|
@whuhangzhang LSTMcell的输入比GRUcell多了一个c,直接换肯定不行的 |
|
@BboyHanat ,十分感谢您的回复。最后想问您两个问题
如果改为
Decoupled-attention-network/cfgs_scene.py Lines 49 to 55 in 64806d7
|
因为我读取数据的方式和本工程不一样,所以这一块我使用的是自己写的dataloader, 数据处理方式没有变 |
感谢楼主的调优分享。请问有在中文长文本上测试过吗 |
我的目标文本在1-20之间,精度还可以 |
感谢回复🙏 |
你好,请问我像下面这种制作标签的方式对吗? import inspect currentdir = os.path.dirname(os.path.abspath(inspect.getfile(inspect.currentframe()))) 这里的label_dict/icdar_labels.txt文件是我的汉字 if name == 'main': 上面的汉字标签文件是如下: anno_data文本图像标签 |
你好,请问发论文了吗?可以给个论文链接吗? |
channels=64的效果远不如channels=512的效果,channels=512时attention得到了非常好的效果!不过这样cam模块会变的非常大,参数量从5M到了96M。整体的参数量为178M左右。
cam channels=512时,我把主干网络换成了Darknet-light,依然得到了非常好的效果。我把两层的gru 换成了单层的lstm 以后效果也提升了不少,就是prelstm去掉,GRUCell换成了LSTMCell。
数据集是,LSVT, ReCTs, ICDAR2017RCTW, ART, 还有部分自己生成数据集。
这个Issues希望能给后来的人少走弯路。
谢谢作者开源!
The text was updated successfully, but these errors were encountered: