Docker Image ―
OpenAI API-Compatible Pre-loaded LLM Server

Docker images are based on Nvidia CUDA images. LLMs are pre-loaded and served via vLLM.

Environment Variables

The OpenAI API is exposed on port 8000.

Note

The VRAM column is the minimum required amount of VRAM used by the model on a single GPU.

Tag	Model	RunPod	Vast.ai	VRAM
`ivangabriele/llm:lmsys__vicuna-13b-v1.5-16k`				26GB
`ivangabriele/llm:open-orca__llongorca-13b-16k`				26GB

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
.github		.github
model		model
.commitlintrc		.commitlintrc
.editorconfig		.editorconfig
.env.sample		.env.sample
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
LICENSE.md		LICENSE.md
Makefile		Makefile
README.hub.md		README.hub.md
README.md		README.md
SECURITY.md		SECURITY.md
build.sh		build.sh
docker-compose.yml		docker-compose.yml
entrypoint.sh		entrypoint.sh
load.py		load.py
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
test.py		test.py