🔮All Our Models

Unsloth model catalog for all our Dynamic GGUF, 4-bit, 16-bit models on Hugging Face.

GGUFs let you run models in tools like Ollama, Open WebUI, and llama.cpp. Instruct (4-bit) safetensors can be used for inference or fine-tuning.

New & recommended models:

Model

Variant

GGUF

Instruct (4-bit)

gpt-oss (new)

120b

link

20b

link

DeepSeek-V3.1 (new)

Terminus

link

—

V3.1

link

—

Qwen3-2507

30B-A3B-Instruct

link

—

30B-A3B-Thinking

link

—

235B-A22B-Thinking

link

—

235B-A22B-Instruct

link

—

Qwen3-Coder

30B-A3B

link

—

480B-A35B

link

—

Granite-4.0 (new)

H-Small

link

GLM (new)

4.6

link

—

4.5-Air

link

—

Kimi-K2-0905

link

—

Gemma 3n

E2B

link

E4B

link

DeepSeek-R1-0528

R1-0528-Qwen3-8B

link

R1-0528

link

—

Mistral

Magistral Small (2509)

link

Magistral Small (2507)

link

Small 3.2 24B (2506)

link

FLUX.1

Kontext-dev

link

—

Qwen3

0.6 B

1.7 B

4 B

8 B

14 B

30B-A3B

32 B

235B-A22B

—

Llama 4

Scout 17B 16E

link

Maverick 17B 128E

link

—

Grok 2

270B

link

—

Qwen-2.5 Omni

3 B

link

—

7 B

link

—

Phi-4

Reasoning-plus

link

Reasoning

link

DeepSeek models:

Model

Variant

GGUF

Instruct (4-bit)

DeepSeek-V3.1

Terminus

link

V3.1

link

DeepSeek-V3

V3-0324

link

—

link

—

DeepSeek-R1

R1-0528

link

—

R1-0528-Qwen3-8B

link

—

R1 Zero

link

—

Distill Llama 3 8 B

link

Distill Llama 3.3 70 B

link

Distill Qwen 2.5 1.5 B

link

Distill Qwen 2.5 7 B

link

Distill Qwen 2.5 14 B

link

Distill Qwen 2.5 32 B

link

Llama models:

Model

Variant

GGUF

Instruct (4-bit)

Llama 4

Scout 17 B-16 E

link

Maverick 17 B-128 E

link

—

Llama 3.3

70 B

link

Llama 3.2

1 B

link

3 B

link

11 B Vision

—

link

90 B Vision

—

link

Llama 3.1

8 B

link

70 B

—

link

405 B

—

link

Llama 3

8 B

—

link

70 B

—

link

Llama 2

7 B

—

link

13 B

—

link

CodeLlama

7 B

—

link

13 B

—

link

34 B

—

link

Gemma models:

Model

Variant

GGUF

Instruct (4-bit)

Gemma 3n

E2B

link

E4B

link

Gemma 3

270M

1 B

4 B

12 B

27 B

MedGemma

4 B (vision)

link

27 B (vision)

link

Gemma 2

2 B

link

9 B

—

link

27 B

—

link

Qwen models:

Model

Variant

GGUF

Instruct (4-bit)

Qwen 3

0.6 B

1.7 B

4 B

8 B

14 B

30 B-A3B

32 B

235 B-A22B

—

Qwen 2.5 Omni

3 B

link

—

7 B

link

—

Qwen 2.5 VL

3 B

7 B

32 B

72 B

Qwen 2.5

0.5 B

—

link

1.5 B

—

link

3 B

—

link

7 B

—

link

14 B

—

link

32 B

—

link

72 B

—

link

Qwen 2.5 Coder (128 K)

0.5 B

1.5 B

3 B

7 B

14 B

32 B

QwQ

32 B

link

QVQ (preview)

72 B

—

link

Qwen 2 (chat)

1.5 B

—

link

7 B

—

link

72 B

—

link

Qwen 2 VL

2 B

—

link

7 B

—

link

72 B

—

link

Mistral models:

Model

Variant

GGUF

Instruct (4-bit)

Mistral Small

3.2-24 B (2506)

link

3.1-24 B (2503)

link

3-24 B (2501)

link

Magistral

Small-24 B (2506)

link

Devstral

Small-24 B (2507)

link

Small-24 B (2505)

link

Pixtral

12 B (2409)

—

link

Mistral Small

2409-22 B

—

link

Mistral NeMo

12 B (2407)

link

Mistral Large

2407

—

link

Mistral 7 B

v0.3

—

link

v0.2

—

link

Mixtral

8 × 7 B

—

link

Phi models:

Model

Variant

GGUF

Instruct (4-bit)

Phi-4

Reasoning-plus

Reasoning

Mini-Reasoning

Phi-4 (instruct)

mini (instruct)

Phi-3.5

mini

—

link

Phi-3

mini

—

link

medium

—

link

Other (GLM, Orpheus, Smol, Llava etc.) models:

Model

Variant

GGUF

Instruct (4-bit)

GLM

4.5-Air

link

4.5

4-32B-0414

Hunyuan

A13B

link

—

Orpheus

0.1-ft (3B)

link

LLava

1.5 (7 B)

—

link

1.6 Mistral (7 B)

—

link

TinyLlama

Chat

—

link

SmolLM 2

135 M

link

360 M

link

1.7 B

link

Zephyr-SFT

7 B

—

link

6 B (v1.5)

—

link

6 B (v1.0)

—

link

34 B (chat)

—

link

34 B (base)

—

link

16-bit and 8-bit Instruct models are used for inference or fine-tuning:

New models:

Model

Variant

Instruct (16-bit)

gpt-oss (new)

20b

link

120b

link

Gemma 3n

E2B

link

E4B

link

DeepSeek-R1-0528

R1-0528-Qwen3-8B

link

R1-0528

link

Mistral

Small 3.2 24B (2506)

link

Small 3.1 24B (2503)

link

Small 3.0 24B (2501)

link

Magistral Small (2506)

link

Qwen 3

0.6 B

1.7 B

4 B

8 B

14 B

30B-A3B

32 B

235B-A22B

Llama 4

Scout 17B-16E

link

Maverick 17B-128E

link

Qwen 2.5 Omni

3 B

link

7 B

link

Phi-4

Reasoning-plus

link

Reasoning

link

DeepSeek models

Model

Variant

Instruct (16-bit)

DeepSeek-V3

V3-0324

link

DeepSeek-R1

R1-0528

R1-0528-Qwen3-8B

R1 Zero

Distill Llama 3 8B

Distill Llama 3.3 70B

link

Distill Qwen 2.5 1.5B

Distill Qwen 2.5 7B

Distill Qwen 2.5 14B

Distill Qwen 2.5 32B

Llama models

Family

Variant

Instruct (16-bit)

Llama 4

Scout 17B-16E

link

Maverick 17B-128E

link

Llama 3.3

70 B

link

Llama 3.2

1 B

3 B

11 B Vision

90 B Vision

Llama 3.1

8 B

link

70 B

link

405 B

link

Llama 3

8 B

link

70 B

link

Llama 2

7 B

link

Gemma models:

Model

Variant

Instruct (16-bit)

Gemma 3n

E2B

link

E4B

link

Gemma 3

1 B

4 B

12 B

27 B

Gemma 2

2 B

link

9 B

link

27 B

link

Qwen models:

Family

Variant

Instruct (16-bit)

Qwen 3

0.6 B

1.7 B

4 B

8 B

14 B

30B-A3B

32 B

235B-A22B

Qwen 2.5 Omni

3 B

link

7 B

link

Qwen 2.5 VL

3 B

7 B

32 B

72 B

Qwen 2.5

0.5 B

1.5 B

3 B

7 B

14 B

32 B

72 B

Qwen 2.5 Coder 128 K

0.5 B

1.5 B

3 B

7 B

14 B

32 B

QwQ

32 B

link

QVQ (preview)

72 B

—

Qwen 2 (Chat)

1.5 B

link

7 B

link

72 B

link

Qwen 2 VL

2 B

link

7 B

link

72 B

link

Mistral models:

Model

Variant

Instruct (16-bit)

Mistral

Small 2409-22B

link

Mistral

Large 2407

link

Mistral

7B v0.3

link

Mistral

7B v0.2

link

Pixtral

12B 2409

link

Mixtral

8×7B

link

Mistral NeMo

12B 2407

link

Devstral

Small 2505

link

Phi models:

Model

Variant

Instruct (16-bit)

Phi-4

Reasoning-plus

Reasoning

Phi-4 (core)

Mini-Reasoning

Mini

Phi-3.5

Mini

link

Phi-3

Mini

link

Medium

link

Text-to-Speech (TTS) models:

Model

Instruct (16-bit)

Orpheus-3B (v0.1 ft)

link

Orpheus-3B (v0.1 pt)

link

Sesame-CSM 1B

link

Whisper Large V3 (STT)

Llasa-TTS 1B

Spark-TTS 0.5B

Oute-TTS 1B

PreviousUnsloth Notebooks NextInstall & Update

Last updated 19 days ago

Was this helpful?

New & recommended models:

DeepSeek models:

Llama models:

Gemma models:

Qwen models:

Mistral models:

Phi models:

Other (GLM, Orpheus, Smol, Llava etc.) models:

New models:

DeepSeek models

Llama models

Gemma models:

Qwen models:

Mistral models:

Phi models:

Text-to-Speech (TTS) models:

New models:

Llama models:

Qwen models:

Llama models:

Gemma models

Mistral models:

Other (TTS, TinyLlama) models: