Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

训练和预测的评估问题 #2

Open
QingGeGe opened this issue Jul 22, 2019 · 9 comments
Open

训练和预测的评估问题 #2

QingGeGe opened this issue Jul 22, 2019 · 9 comments

Comments

@QingGeGe
Copy link

请问,您好,训练模型的时候用的是mse,loss值达到了0.0几的值,但是预测评估的时候rmse居然有大约20左右的值,rmse是mse的开根号,怎么样都不会差距那么大,这是为什么呀
请大佬帮忙解答,感谢

@TolicWang
Copy link
Owner

一部分是由于过拟合造成的(但在你说的问题中不是主要);
另外一部分是因为在训练过程中,数据都是经过特征缩放的(-1,1),而预测出来的结果是特征缩放回复后的值,所以差距很大

@QingGeGe
Copy link
Author

哦哦,谢谢哈,貌似明白了。
还有一个问题,我用自己的数据训练模型,发现才迭代2-3轮就收敛了,loss都不下降了,而且loss值好低,0.0003,这正常的吗?感谢

@TolicWang
Copy link
Owner

1.如果是换成自己数据集的话可能要修改一些参数,比如学习率之类的;
2.这个Loss不像是准确率一样,我们明确它的含义,所以我们并不知道“0.0003”到底是高还是低;
3.对于这种情况loss看起来好低,且看起来不降的情况,也许是数值太小精度的问题,你可以将最终的Loss乘以1000之类的输出看看,如果这样到后面还是不降的话,那就考虑调整更多的超参数了;

@QingGeGe
Copy link
Author

我预测出来的值,进行特征rescale后,都变成了0,真是奇怪了。测试集的RMSE=8.34

@TolicWang
Copy link
Owner

那你好好debug一下,肯定哪儿有问题。

@QingGeGe
Copy link
Author

你好,我一直看不懂卷积残差网络,残差网络对输入进行了卷积操作后,图片的大小不应该会变化的吗,怎么还可以喝输入的数据进行相加操作的呀,两个图片的大小都不一样?我不是很理解?麻烦大佬指点指点,感谢!

@TolicWang
Copy link
Owner

如果尺寸不一样的话,会进行调整。可以参考原文https://arxiv.org/pdf/1512.03385.pdf

@QingGeGe
Copy link
Author

我有点不明白,为什么论文中要把数据都是经过特征缩放到(-1,1)直接,最后输出用tanh?
我用自己的数据实验的时候,按照论文的方式,预测出来值就都是0,最后我就把这些转换操作都不用了,预测出来的值还有点样子,但是会预测出负值

@TolicWang
Copy link
Owner

这样缩小范围做只为了方便快速收敛,好训练。你也可以缩放到(0,1)最后预测时用sigmoid都行,怎么效果好,怎么来

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants