Tiny (Under 2B params)

Tiny models that run on phones, browsers, and edge devices.

54 models, ranked by Hugging Face downloads.

all-MiniLM-L6-v2

Sentence Transformers · 0.023B · apache-2.0

BGE Small EN v1.5

BAAI · 0.033B · mit

Nomic Embed Text v1.5

Nomic AI · 0.137B · apache-2.0

Alibaba · 1.5B · apache-2.0

1.54GB · Q4_K_M

BGE Large EN v1.5

BAAI · 0.335B · mit

Whisper Large v3 Turbo

OpenAI · 0.81B · mit

BGE Reranker v2 M3

BAAI · 0.568B · mit

Alibaba · 0.5B · apache-2.0

0.96GB · Q4_K_M

Whisper Large v3

OpenAI · 1.55B · mit

Llama 3.2 1B Instruct

Meta · 1.24B · llama3.2

1.25GB · Q4_K_M

TinyLlama · 1.1B · apache-2.0

1.12GB · Q4_K_M

Moondream · 1.8B · apache-2.0

1.5GB · Q4_K_M

OpenAI · 0.24B · mit

Stable Diffusion 1.5 (CoreML)

Runway · 0.86B · creativeml-openrail-m

2.5GB · CoreML-Palettized

OpenAI · 0.074B · mit

Distil-Whisper Large v3

HuggingFace · 0.76B · mit

Google · 1B · gemma

1.25GB · Q4_K_M

HuggingFace · 0.135B · apache-2.0

OpenAI · 0.039B · mit

DeepSeek R1 Distill 1.5B

DeepSeek · 1.5B · mit

1.54GB · Q4_K_M

Qwen 2.5 Coder 1.5B

Alibaba · 1.5B · apache-2.0

1.54GB · Q4_K_M

OpenAI · 0.77B · mit

HuggingFace · 0.36B · apache-2.0

0.75GB · Q4_K_M

Qwen 2.5 Coder 0.5B

Alibaba · 0.5B · apache-2.0

OpenBMB · 2B · apache-2.0

2.1GB · Q4_K_M

HuggingFace · 1.7B · apache-2.0

1.48GB · Q4_K_M

Meta · 0.3B · cc-by-nc-4.0

0.78GB · ONNX-Q4F16

Whisper Tiny English (Quantized)

OpenAI · 0.039B · mit

Kokoro · 0.082B · apache-2.0

0.58GB · ONNX-Q8F16

Whisper Base English

OpenAI · 0.074B · mit

DeepSeek Coder 1.3B

DeepSeek · 1.3B · mit

1.31GB · Q4_K_M

Snowflake Arctic Embed S

Snowflake · 0.033B · apache-2.0

H2O.ai · 0.5B · apache-2.0

0.8GB · Q4_K_M

IBM · 2B · apache-2.0

1.94GB · Q4_K_M

Google · 2B · gemma

2.02GB · Q4_K_M

TII · 1B · apache-2.0

1.48GB · Q4_K_M

Jina Reranker Tiny EN

Jina AI · 0.033B · apache-2.0

Stable Diffusion 1.5 (GGUF)

Runway / GPUStack · 0.86B · creativeml-openrail-m

01.AI · 1.5B · apache-2.0

1.4GB · Q4_K_M

Stable Diffusion 2.1 Base (CoreML)

Stability AI / Apple · 0.86B · creativeml-openrail-m

1.56GB · CoreML-Palettized

Piper TTS - Amy (English)

Rhasspy · 0.02B · mit

Piper TTS - Lessac (English)

Rhasspy · 0.02B · mit

Piper TTS - LibriTTS-R (English)

Rhasspy · 0.02B · mit

Stable Diffusion 2.1 (GGUF)

Stability AI · 0.86B · creativeml-openrail-m

Piper TTS - Spanish (MLS)

Rhasspy · 0.02B · mit

Piper TTS - French (Siwis)

Rhasspy · 0.02B · mit

Piper TTS - German (Thorsten)

Rhasspy · 0.02B · mit

Piper TTS - Chinese (Huayan)

Rhasspy · 0.02B · mit

Piper TTS - Japanese (Kokoro)

Rhasspy · 0.02B · mit

Piper TTS - Korean

Rhasspy · 0.02B · mit

Piper TTS - Russian (Irina)

Rhasspy · 0.02B · mit

Piper TTS - Portuguese (Faber)

Rhasspy · 0.02B · mit

Piper TTS - Italian (Riccardo)

Rhasspy · 0.02B · mit

Piper TTS - Arabic (Kareem)

Rhasspy · 0.02B · mit