请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29

Crescentz · 2020-09-07T07:44:16Z

reademe 不是很清晰

drumzhang · 2020-11-07T09:11:04Z

真的很不清晰！

drumzhang · 2020-11-07T09:12:04Z

请问start quick里的input_idx怎么输入呢？怎么把句子embedding成向量呢？

SunnyPann · 2021-01-12T12:30:42Z

请问，自己训练Glyce成功了吗

Young1993 · 2021-04-20T09:00:28Z

模型用from PIL import ImageFont来读取字体的，然后转换embedding形式的张量，
embeddings = position_embeddings + glyph_embeddings 直接和位置embed相加
再和下游的bert一起训练，训练保存词向量，完成训练后，应该可以直接就使用glece-bert层之后的进行预测推理

理解错了：（这篇论文不是一个预训练任务？没有利用Glyce生成一个embedding词表么？然后再下游任务的时候，不是查这个词表的来获取权重值的？）

maturecat · 2021-05-28T07:50:27Z

来自PIL的模型用import ImageFont来读取字体的，然后转换embedding形式的形式张量，
嵌入= position_embeddings + glyph_embeddings直接和位置embed相加
再和下游的bert一起训练，训练保存词向量，完成训练后，应该可以直接就使用glece-bert层之后的进行预测推理

理解错了：（这篇论文不是一个预训练任务？没有利用Glyce生成一个embeddding词表么？然后再下游任务的时候，不是查这个词表的来获取权重值的？）

请教你个问题，论文中提到的损失函数我看不太懂，论文中讲到使用图像分类做辅助任务，那么这个图象识别任务的损失是什么？论文终提到的预测其对应的charid 这个charid是不是表明的是某个字？论文中提到的图像x的标签是z，请问这个标签是什么？在代码中图像分类任务是在哪个文件怎么做到的将数据打上标签，损失函数是在哪个文件怎么定义的？图像分类的话，常用的中文汉字几千个，他的分类是几千分类吗？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29

请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29

Crescentz commented Sep 7, 2020

drumzhang commented Nov 7, 2020

drumzhang commented Nov 7, 2020

SunnyPann commented Jan 12, 2021

Young1993 commented Apr 20, 2021 •

edited

Loading

maturecat commented May 28, 2021

请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29

请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29

Comments

Crescentz commented Sep 7, 2020

drumzhang commented Nov 7, 2020

drumzhang commented Nov 7, 2020

SunnyPann commented Jan 12, 2021

Young1993 commented Apr 20, 2021 • edited Loading

maturecat commented May 28, 2021

Young1993 commented Apr 20, 2021 •

edited

Loading