Pricing

You only pay for what you use

Fine-Tuning

Model

Type of Finetuning

Price (per 1M Tokens)

Llama 3.1 8B

qLoRA

$2

Llama 3.1 8B

LoRA

$2

Llama 3.1 8B

Full Finetuning

$2

Inference

Model type

Model Size

Price (per 1M Tokens)

Llama 3.2

1B & 3B

¢3

Llama 3.1 & Llama 3.2

8B & 11B

¢9

Llama 3.1 & Llama 3.3

70B & 70B

¢60

Llama 3.2

90B

¢90

Llama 3.1

405B

$2

Model type

Model Size

Price (per minute)

Llama 3.2

1B & 3B

¢1

Llama 3.1 & Llama 3.2

8B & 11B

¢3