| OpenAI | GPT-4o | Closed Source | 128k | Entrée : 5$ Sortie : 20$ | ✅ Multimodal temps-réel, qualité SOTA ⭕ Coûteux, quota API 🔍 Agents vocaux, assistants multimodaux
|
| GPT-4.1 | Closed Source | 1M | Entrée : 2$ Sortie : 8$ | ✅ Contexte géant, meilleur raisonnement ⭕ Latence > 3.5 T 🔍 Analyse docs très volumineux |
| GPT-4.1 mini | Closed Source | 1M | Entrée : 0.4$ Sortie : 1.6$ | ✅ Bon compromis coût/qualité ⭕ Moins précis qu’Opus 🔍 Chatbots, RAG |
| GPT-3.5 Turbo | Closed Source | 16k | Entrée : 0.5$ Sortie : 1.5$ | ✅ Ultra-économique, rapide ⭕ Qualité inférieure, petit contexte 🔍 Chat à gros volume, classification |
| Anthropic | Claude 3 Opus | Closed Source | 200k | Entrée : 15$ Sortie : 75$ | ✅ Raisonnement très haut niveau, vision ⭕ Prix le plus élevé 🔍 Recherche, planification complexe |
| Claude 3.7 Sonnet | Closed Source | 200k | Entrée : 3$ Sortie : 15$ | ✅ Bon rapport qualité / coût ⭕ Encore cher vs open 🔍 Assistants entreprise, RAG |
| Claude 3 Haiku | Closed Source | 200k | Entrée : 0.25$ Sortie : 1.25$ | ✅ Très rapide & bon marché ⭕ Perf. limitée 🔍 Service client temps-réel |
| Google / DeepMind | Gemini 1.5 Pro | Closed Source | 1M (2 M preview) | Entrée : 0.3125$ Sortie : 1.25$ (≤ 200 K) | ✅ Multimodal, long contexte ⭕ Tarification complexe 🔍 Analyse doc, code, data |
| Gemini 1.5 Flash | Closed Source | 1M | Entrée : 0.0188$ Sortie : 0.075$ | ✅ Latence ultra-basse, économique ⭕ Qualité < Pro 🔍 Chatbots, streaming |
| Gemini 2.5 Pro | Closed Source | 1M | Entrée : 1.25$ Sortie : 10$ | ✅ QI↑, multimodal ⭕ Coût élevé 🔍 RAG complexe, agents |
| DeepSeek | DeepSeek-Chat (V3) | Closed Source | 8k | Entrée : 0.27$ Sortie : 1.10$ | ✅ Prix plancher ⭕ Contexte court 🔍 FAQ, support |
| DeepSeek-R1 | Open Source | 128k | Libre (open-weights) | ✅ MoE 671 B, raisonnement fort ⭕ Poids énorme 🔍 Recherche, math, code |
| Alibaba Qwen | Qwen 2.5 72B Instr. | Open Source | 128k | Entrée : 0.12$ Sortie : 0.39$ | ✅ Long contexte, multilingue ⭕ Besoin GPU > 24 GB 🔍 Assistants OSS, agents |
| Qwen 2.5-1M Turbo | Closed Source | 1M | Entrée : 0.20$ Sortie : 0.60$ | ✅ Contexte 1 M à bas coût ⭕ Preview limitée 🔍 Docs massifs |
| Meta | Llama 3.1 70B Instr. | Open Source | 128k | Entrée : 0.30$ Sortie : 0.40$ | ✅ OSS, 128 K via RoPE ⭕ Qualité < GPT-4 🔍 Dév local, fine-tune |
| Mistral AI | Mistral Medium 3 | Closed Source | 128k | Entrée : 0.4$ Sortie : 2.0$ | ✅ Perf ≈ Claude Sonnet, peu cher ⭕ API privée 🔍 Apps B2B |
| Mixtral 8x22B Instr. | Open Source | 65 536 | Entrée : 0.90$ Sortie : 0.90$ | ✅ MoE efficace, cost-eff ⭕ Contexte < 128 K 🔍 RAG, code |
| Cohere | Command R+ | Closed Source | 128k | Entrée : 2.5$ Sortie : 10$ | ✅ Optimisé RAG & outils ⭕ Plus cher qu’OSS 🔍 Agents, pipelines RAG |
| Command R | Closed Source | 128k | Entrée : 0.15$ Sortie : 0.60$ | ✅ Très bon coût/perf ⭕ Perf < R+ 🔍 Chatbot, extraction |
| AI21 Labs | Jamba 1.5 Large | Open Source | 256k | Entrée : 2$ Sortie : 8$ | ✅ 256 K SSM-Transformer ⭕ Mémoire gourmande 🔍 Long-doc RAG |
| Jamba 1.5 Mini | Open Source | 256k | Entrée : 0.20$ Sortie : 0.40$ | ✅ Léger, rapide ⭕ Qualité < Large 🔍 Mobile RAG |
| Jurassic-2 Ultra | Closed Source | 8k | Entrée : 15$ Sortie : 15$ | ✅ 30+ langues ⭕ Contexte court 🔍 Marketing, NLG |
| xAI | Grok 2 | Closed Source | 128k | Entrée : 2$ Sortie : 10$ | ✅ Accès temps-réel à X ⭕ Politique usage 🔍 Conversation, recherche live |
| Grok 3 (beta) | Closed Source | 1M | N/A (beta) | ✅ Contexte 1 M, agents ⭕ Pas de prix public 🔍 RAG long |
| Microsoft | Phi-3 mini-128K | Open Source | 128k | Entrée : 0.13$ Sortie : 0.13$ | ✅ Très léger, mobile ⭕ Capacité limitée 🔍 Edge inference |
| Phi-3 medium | Open Source | 128k | Entrée : 0.15$ Sortie : 0.15$ | ✅ + Raisonnement, 13 B ⭕ GPU requis 🔍 Copilots |
| Stability AI | Stable LM 2 12B | Open Source | ~64k* | Libre (self-host) | ✅ Multilingue, code ⭕ Qualité < 70B+ 🔍 Local generation |
| Databricks | DBRX Instruct | Open Source | 32k | Libre (open-weights) | ✅ SOTA open, 132 B MoE ⭕ Mémoire élevée 🔍 Analytics, code + RAG |