Encoder data 的預處理 #12

hsuanchia · 2021-04-28T10:00:49Z

batch size : 500 1000 2000 5000 10000 20000 30000
每一組資料你要給我

feature map (None, 14, 14, 512)
img_name or id 有辦法讓我知道是哪個圖片對應到哪個caption即可
檔案格式:最好是用tf.data.dataset 備案: json 或 pickle

hsuanchia · 2021-04-29T13:59:22Z

或是你給我超過30000的資料 40000 50000 之類的我再自己決定要取多少的資料做training 順便還可以做shuffle

snsd0805 · 2021-05-02T13:04:31Z

@hsuanchia 我們的雲端都還沒有 train_2017 的 Pictures

所以我在我的電腦直接跑 feature maps 的 predict，在 10000張圖的時候存取 pkl 就會超過記憶體大小，所以我先更新到這階段

另外我還沒用 tensorflow 的 dataset 套件包起來是因為我覺得 train data 和 target 我們需要再討論一下

hsuanchia · 2021-05-03T16:20:35Z

我的雲端當中其實有train_2017.zip，但我沒辦法在colab上解壓縮再存回雲端，因為RAM不夠，我也沒辦法把train_2017.zip載下來，我沒辦法把我的電腦一直放著讓他載，所以可能要麻煩你將train_2017傳上雲端再分享給我們。或是我們商量好資料格式之後，image處理都交給你，你給我feature map就好，就像現在這樣。
另外，如果我們要做validation的話，那5000張val_2017的image也需要你幫忙處理。

hsuanchia assigned snsd0805 Apr 28, 2021

snsd0805 added a commit that referenced this issue May 2, 2021

Update pickle files (#12)

d2e7872

jiazheng0609 pushed a commit that referenced this issue May 2, 2021

Update pickle files (#12)

2c78676

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Encoder data 的預處理 #12

Encoder data 的預處理 #12

hsuanchia commented Apr 28, 2021 •

edited

Loading

hsuanchia commented Apr 29, 2021

snsd0805 commented May 2, 2021

hsuanchia commented May 3, 2021

Encoder data 的預處理 #12

Encoder data 的預處理 #12

Comments

hsuanchia commented Apr 28, 2021 • edited Loading

hsuanchia commented Apr 29, 2021

snsd0805 commented May 2, 2021

hsuanchia commented May 3, 2021

hsuanchia commented Apr 28, 2021 •

edited

Loading