Context window comparison
Bağlam Penceresi Kıyaslamaları
Modeller | |||||
---|---|---|---|---|---|
Llama 4 Scout | 32,000,000 | 900 t/s | 0.33s | ||
Llama 4 Maverick | 32,000,000 | 900 t/s | 0.44s | ||
Gemini 3 Pro | 128,000 | n/a | n/a | 800 t/s | 0.72s |
Qwen 3 [Beta] | n/a | n/a | n/a | n/a | n/a |
Gemini 2.0 Pro | 1,000,000 | 800 t/s | 0.50s | ||
Claude 3.7 Sonnet | 200,000 | 750 t/s | 0.55s | ||
GPT-4.5 | 128,000 | 450 t/s | 1.20s | ||
Claude 3.7 Sonnet [P] | 200,000 | 750 t/s | 0.55s | ||
DeepSeek V3 | 128,000 | 350 t/s | 4.00s | ||
OpenAI o1-mini | 200,000 | 250 t/s | 14.00s | ||
OpenAI o1 | 128,000 | 200 t/s | 12.64s | ||
OpenAI o1-mini-2 | 750,000 | n/a | n/a | n/a | n/a |
DeepSeek V3 G324 | 128,000 | 350 t/s | 4.00s | ||
Qwen o1 | 200,000 | 900 t/s | 20.00s | ||
Gemini 2.0 Flash | 128,000 | 500 t/s | 0.32s | ||
Llama 3.1 70b | 128,000 | 500 t/s | 0.72s | ||
Nous Pro | 300,000 | 500 t/s | 0.64s | ||
Claude 3.5 Haiku | 200,000 | 850 t/s | 0.35s | ||
Llama 3.1 405b | 128,000 | 350 t/s | 0.72s | ||
GPT-4o-mini | 128,000 | 450 t/s | 0.50s | ||
GPT-4o | 128,000 | 450 t/s | 0.50s | ||
Claude 3.5 Sonnet | 200,000 | 750 t/s | 1.20s |
Model Detayları
Llama 4 Serisi (Meta)
Devasa 32M token bağlam pencereleriyle sektöre öncülük eden Scout ve Maverick varyantları, eşsiz bağlam işleme yetenekleri sunuyor. Daha yüksek maliyetlere rağmen (-/M token), mükemmel hızı (900 t/s) ve minimum gecikmeyi (0.33-0.44s) koruyarak, büyük ölçekli belge işleme ve karmaşık analizler için ideal hale geliyorlar.
Gemini Serisi (Google)
Sürümler arasında dikkat çekici kontrast: Gemini 3 Pro gelişmiş hızla (800 t/s) standart 128K bağlam sunarken, Gemini 2.0 Pro rekabetçi fiyatlandırmayla (/M girdi) etkileyici 1M token bağlam penceresi sunuyor. Her ikisi de kurumsal uygulamalar için uygun olan düşük gecikme ile mükemmel işlem hızlarını koruyor.
Claude Serisi (Anthropic)
Claude ailesi 200K bağlam pencereleriyle tutarlı performans gösteriyor. 3.7 Sonnet ve [P] varyantı mükemmel değer (/M girdi, /M çıktı) ve güçlü hız (750 t/s) sunuyor. 3.5 versiyonları gecikmede küçük farklılıklarla benzer yetenekleri koruyor.
OpenAI Serisi
Çeşitli yeteneklere sahip farklı modeller: o1 modelleri 128K ile 750K arasında bağlam pencereleri sunuyor, temel o1 iyi bir değer sunuyor (/M girdi, /M çıktı). Mini varyantlar hız ve gecikme arasında farklı dengeler gösterirken, GPT-4 modelleri tutarlı performansa odaklanıyor.
DeepSeek V3 Serisi
Oldukça rekabetçi fiyatlandırmayla (/M girdi, /M çıktı) 128K bağlam penceresi sağlıyor. İşlem hızı (350 t/s) ve gecikme (4s) orta düzeyde olsa da, maliyet etkinliği bütçe odaklı uygulamalar için uygun hale getiriyor.
Özelleştirilmiş Modeller
- Qwen Serisi: Orta seviye fiyatlandırma ile 200K bağlam sunuyor ancak etkileyici hıza sahip (900 t/s)
- Nous Pro: Uygun fiyatlı (/M girdi, /M çıktı) daha büyük 300K bağlam penceresi sunuyor
- Llama 3.1 Serisi: Ekonomik fiyatlandırma ve güvenilir performansla tutarlı 128K bağlam sağlıyor