☁️ 🦜

Instantly deploy your local LoRA-tuned Llama in the cloud and scale to as much throughput as you want.

from typing import List
from cloud_lora.main import CloudLora, GenerationRequest
import peft
from peft import PeftModel

PROMPTS: List[str] = ...

peft_model = ... # create your Llama model, then apply your LoRA adapters

cloud_model = CloudLora.create(peft_model)

from concurrent import futures

with futures.ThreadPoolExecutor(128) as pool:
    generation_requests = map(lambda prompt: GenerationRequest(prompt=prompt), PROMPTS)
    for result in pool.map(cloud_model.remote().get_completion, generation_requests):
        print(result)

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
cloud_lora		cloud_lora
Dockerfile		Dockerfile
README.md		README.md
notebook.py		notebook.py
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

☁️ 🦜

About

Releases

Packages

Languages

PrimeIntellect-ai/cloud-lora

Folders and files

Latest commit

History

Repository files navigation

☁️ 🦜

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages