(NeurIPS24) NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

Links:

🚩 News

✅ NaturalBench-Retrieval Dataset: the download link from huggingface homepage.
✅ We have integrated NaturalBench into lmms-eval and VLMEvalKit.
🎉 Sep. 26, 2024. NaturalBench was accepted by NeurIPS!

Usages

You can learn how to use and evaluate NaturalBench by reviewing the simple examples in example.py.

Citation Information

@inproceedings{naturalbench,
  title={NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples},
  author={Li, Baiqi and Lin, Zhiqiu and Peng, Wenxuan and Nyandwi, Jean de Dieu and Jiang, Daniel and Ma, Zixian and Khanuja, Simran and Krishna, Ranjay and Neubig, Graham and Ramanan, Deva},
  booktitle={The Thirty-eight Conference on Neural Information Processing Systems Datasets and Benchmarks Track},
  year={2024},
  url={https://openreview.net/forum?id=Dx88A9Zgnv}
}

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
README.md		README.md
example.py		example.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

(NeurIPS24) NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

Links:

🚩 News

Usages

Citation Information

About

Releases

Packages

Languages

Baiqi-Li/NaturalBench

Folders and files

Latest commit

History

Repository files navigation

(NeurIPS24) NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

Links:

🚩 News

Usages

Citation Information

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages