Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问如何训练自己的Glyce,或者在你们开放的预训练模型上微调 #29

Open
Crescentz opened this issue Sep 7, 2020 · 5 comments

Comments

@Crescentz
Copy link

reademe 不是很清晰

@drumzhang
Copy link

真的很不清晰!

@drumzhang
Copy link

请问start quick里的input_idx怎么输入呢?怎么把句子embedding成向量呢?

@SunnyPann
Copy link

请问,自己训练Glyce成功了吗

@Young1993
Copy link

Young1993 commented Apr 20, 2021

模型用from PIL import ImageFont来读取字体的,然后转换embedding形式的张量,
embeddings = position_embeddings + glyph_embeddings 直接和位置embed相加
再和下游的bert一起训练,训练保存词向量,完成训练后,应该可以直接就使用glece-bert层之后的进行预测推理

理解错了:(这篇论文不是一个预训练任务?没有利用Glyce生成一个embedding词表么?然后再下游任务的时候,不是查这个词表的来获取权重值的?)

@maturecat
Copy link

来自PIL的模型用import ImageFont来读取字体的,然后转换embedding形式的形式张量,
嵌入= position_embeddings + glyph_embeddings直接和位置embed相加
再和下游的bert一起训练,训练保存词向量,完成训练后,应该可以直接就使用glece-bert层之后的进行预测推理

理解错了:(这篇论文不是一个预训练任务?没有利用Glyce生成一个embeddding词表么?然后再下游任务的时候,不是查这个词表的来获取权重值的?)

请教你个问题,论文中提到的损失函数我看不太懂,论文中讲到使用图像分类做辅助任务,那么这个图象识别任务的损失是什么?论文终提到的预测其对应的charid 这个charid是不是表明的是某个字?论文中提到的图像x的标签是z,请问这个标签是什么?在代码中图像分类任务是在哪个文件怎么做到的将数据打上标签,损失函数是在哪个文件怎么定义的?图像分类的话,常用的中文汉字几千个,他的分类是几千分类吗?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants