Tiny (Under 2B params)

Tiny models that run on phones, browsers, and edge devices.

54 models, ranked by Hugging Face downloads.

all-MiniLM-L6-v2
Sentence Transformers · 0.023B · apache-2.0
0.1GB · Q8_0
194504K dl
BGE Small EN v1.5
BAAI · 0.033B · mit
0.1GB · Q8_0
16376K dl
Nomic Embed Text v1.5
Nomic AI · 0.137B · apache-2.0
0.3GB · Q8_0
10616K dl
Qwen 2.5 1.5B
Alibaba · 1.5B · apache-2.0
1.54GB · Q4_K_M
9923K dl
BGE Large EN v1.5
BAAI · 0.335B · mit
0.83GB · Q8_0
7571K dl
Whisper Large v3 Turbo
OpenAI · 0.81B · mit
2.01GB · Q8_0
6100K dl
BGE Reranker v2 M3
BAAI · 0.568B · mit
1.58GB · FP16
5981K dl
Qwen 2.5 0.5B
Alibaba · 0.5B · apache-2.0
0.96GB · Q4_K_M
5357K dl
Whisper Large v3
OpenAI · 1.55B · mit
3.38GB · Q8_0
4761K dl
Llama 3.2 1B Instruct
Meta · 1.24B · llama3.2
1.25GB · Q4_K_M
4172K dl
TinyLlama 1.1B
TinyLlama · 1.1B · apache-2.0
1.12GB · Q4_K_M
2966K dl
Moondream 2
Moondream · 1.8B · apache-2.0
1.5GB · Q4_K_M
2834K dl
Whisper Small
OpenAI · 0.24B · mit
0.95GB · Q8_0
1875K dl
Stable Diffusion 1.5 (CoreML)
Runway · 0.86B · creativeml-openrail-m
2.5GB · CoreML-Palettized
1690K dl
Whisper Base
OpenAI · 0.074B · mit
0.3GB · Q8_0
1468K dl
Distil-Whisper Large v3
HuggingFace · 0.76B · mit
1.92GB · Q8_0
1176K dl
Gemma 3 1B
Google · 1B · gemma
1.25GB · Q4_K_M
890K dl
SmolLM2 135M
HuggingFace · 0.135B · apache-2.0
0.64GB · Q8_0
889K dl
Whisper Tiny
OpenAI · 0.039B · mit
0.2GB · Q8_0
756K dl
DeepSeek R1 Distill 1.5B
DeepSeek · 1.5B · mit
1.54GB · Q4_K_M
751K dl
Qwen 2.5 Coder 1.5B
Alibaba · 1.5B · apache-2.0
1.54GB · Q4_K_M
571K dl
Whisper Medium
OpenAI · 0.77B · mit
1.93GB · Q8_0
532K dl
SmolLM2 360M
HuggingFace · 0.36B · apache-2.0
0.75GB · Q4_K_M
443K dl
Qwen 2.5 Coder 0.5B
Alibaba · 0.5B · apache-2.0
1.13GB · Q8_0
390K dl
MiniCPM-V 2.6
OpenBMB · 2B · apache-2.0
2.1GB · Q4_K_M
142K dl
SmolLM2 1.7B
HuggingFace · 1.7B · apache-2.0
1.48GB · Q4_K_M
130K dl
MusicGen Small
Meta · 0.3B · cc-by-nc-4.0
0.78GB · ONNX-Q4F16
110K dl
Whisper Tiny English (Quantized)
OpenAI · 0.039B · mit
0.1GB · Q5_1
100K dl
Kokoro 82M TTS
Kokoro · 0.082B · apache-2.0
0.58GB · ONNX-Q8F16
85K dl
Whisper Base English
OpenAI · 0.074B · mit
0.3GB · Q8_0
79K dl
DeepSeek Coder 1.3B
DeepSeek · 1.3B · mit
1.31GB · Q4_K_M
73K dl
Snowflake Arctic Embed S
Snowflake · 0.033B · apache-2.0
0.1GB · Q8_0
44K dl
Danube 3 500M
H2O.ai · 0.5B · apache-2.0
0.8GB · Q4_K_M
34K dl
Granite 3.3 2B
IBM · 2B · apache-2.0
1.94GB · Q4_K_M
29K dl
CodeGemma 2B
Google · 2B · gemma
2.02GB · Q4_K_M
12K dl
Falcon 3 1B
TII · 1B · apache-2.0
1.48GB · Q4_K_M
11K dl
Jina Reranker Tiny EN
Jina AI · 0.033B · apache-2.0
0.15GB · FP16
4K dl
Stable Diffusion 1.5 (GGUF)
Runway / GPUStack · 0.86B · creativeml-openrail-m
2.13GB · Q4_0
1K dl
Yi Coder 1.5B
01.AI · 1.5B · apache-2.0
1.4GB · Q4_K_M
0K dl
Stable Diffusion 2.1 Base (CoreML)
Stability AI / Apple · 0.86B · creativeml-openrail-m
1.56GB · CoreML-Palettized
0K dl
Piper TTS - Amy (English)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Lessac (English)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - LibriTTS-R (English)
Rhasspy · 0.02B · mit
0.57GB · ONNX
Stable Diffusion 2.1 (GGUF)
Stability AI · 0.86B · creativeml-openrail-m
2.66GB · Q8_0
Piper TTS - Spanish (MLS)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - French (Siwis)
Rhasspy · 0.02B · mit
0.53GB · ONNX
Piper TTS - German (Thorsten)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Chinese (Huayan)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Japanese (Kokoro)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Korean
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Russian (Irina)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Portuguese (Faber)
Rhasspy · 0.02B · mit
0.15GB · ONNX
Piper TTS - Italian (Riccardo)
Rhasspy · 0.02B · mit
0.53GB · ONNX
Piper TTS - Arabic (Kareem)
Rhasspy · 0.02B · mit
0.15GB · ONNX