20Fall-CS539-ML

Course project of CS539. Image caption task on Flickr8k and Google Conceptual Caption dataset.

Environment

The project was moved from Google Colab, you can use jupyter notebook to run the .ipynb files.

Dependencies

Keras 2.4.3, Tqdm 4.41.1, Numpy 1.18.5, PIL 7.0.0

How to run

1. Download The GCC dataset.

Tools/DownloadGCC.py

2. Format Each Dataset

Dataset/Data-img/: All images.

Dataset/Data-text/caption.txt: xxx.jpg,captionscaptions...(Each row)

Dataset/Data-text/train_imgname.txt: xxx.jpg(Each row)

Dataset/Data-text/test_imgname.txt: xxx.jpg(Each row)

Dataset/filter.pkl: {imgname1:captionscaptions,imgname2:captionscaptions...}

The Training program reads 2 txt files first. Then keeps the rows in the filter.pkl. This mechanism helps user easly scale down or split a dataset.

3. Train a model

Open ./Trainonxxx.ipynb

Hyper-parameters can be set within the file.

Run all.

4. Predict

Open ./PridictCCD.ipynb

Set the model name and test data path.

Run all.

5. Evaluation

Open ./eval.ipynb

Prepare output.csv and ref1.csv,ref2.csv...

Captions in the same row are considered as the corresponding y and yhat.

Datasets

Flickr 8k(24k Captions)

https://www.kaggle.com/adityajn105/flickr8k/activity

Google Conceptual Caption (Randomly chose 24K)

https://ai.google.com/research/ConceptualCaptions

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
result		result
tools		tools
Final Presentation.pptx		Final Presentation.pptx
README.md		README.md
TrainonFlickr8K-Resnet50.ipynb		TrainonFlickr8K-Resnet50.ipynb
TrainonFlickr8K-VGG16.ipynb		TrainonFlickr8K-VGG16.ipynb
TrainonGCC-ResNet50l.ipynb		TrainonGCC-ResNet50l.ipynb
TrainonGCC-inceptionV3.ipynb		TrainonGCC-inceptionV3.ipynb
TrainonInceptionV3_Flicker8k.ipynb		TrainonInceptionV3_Flicker8k.ipynb
Work log .docx		Work log .docx
eval.ipynb		eval.ipynb
predictCCD.ipynb		predictCCD.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

20Fall-CS539-ML

Environment

Dependencies

How to run

1. Download The GCC dataset.

2. Format Each Dataset

3. Train a model

4. Predict

5. Evaluation

Datasets

About

Releases

Packages

Languages

azuredream/20Fall-CS539-ML

Folders and files

Latest commit

History

Repository files navigation

20Fall-CS539-ML

Environment

Dependencies

How to run

1. Download The GCC dataset.

2. Format Each Dataset

3. Train a model

4. Predict

5. Evaluation

Datasets

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages