Bağlam Penceresi Kıyaslamaları

Modeller
Llama 4 Scout32,000,000900 t/s0.33s
Llama 4 Maverick32,000,000900 t/s0.44s
Gemini 3 Pro128,000n/an/a800 t/s0.72s
Qwen 3 [Beta]n/an/an/an/an/a
Gemini 2.0 Pro1,000,000800 t/s0.50s
Claude 3.7 Sonnet200,000750 t/s0.55s
GPT-4.5128,000450 t/s1.20s
Claude 3.7 Sonnet [P]200,000750 t/s0.55s
DeepSeek V3128,000350 t/s4.00s
OpenAI o1-mini200,000250 t/s14.00s
OpenAI o1128,000200 t/s12.64s
OpenAI o1-mini-2750,000n/an/an/an/a
DeepSeek V3 G324128,000350 t/s4.00s
Qwen o1200,000900 t/s20.00s
Gemini 2.0 Flash128,000500 t/s0.32s
Llama 3.1 70b128,000500 t/s0.72s
Nous Pro300,000500 t/s0.64s
Claude 3.5 Haiku200,000850 t/s0.35s
Llama 3.1 405b128,000350 t/s0.72s
GPT-4o-mini128,000450 t/s0.50s
GPT-4o128,000450 t/s0.50s
Claude 3.5 Sonnet200,000750 t/s1.20s

Model Detayları

Llama 4 Serisi (Meta)

Devasa 32M token bağlam pencereleriyle sektöre öncülük eden Scout ve Maverick varyantları, eşsiz bağlam işleme yetenekleri sunuyor. Daha yüksek maliyetlere rağmen (-/M token), mükemmel hızı (900 t/s) ve minimum gecikmeyi (0.33-0.44s) koruyarak, büyük ölçekli belge işleme ve karmaşık analizler için ideal hale geliyorlar.

Gemini Serisi (Google)

Sürümler arasında dikkat çekici kontrast: Gemini 3 Pro gelişmiş hızla (800 t/s) standart 128K bağlam sunarken, Gemini 2.0 Pro rekabetçi fiyatlandırmayla (/M girdi) etkileyici 1M token bağlam penceresi sunuyor. Her ikisi de kurumsal uygulamalar için uygun olan düşük gecikme ile mükemmel işlem hızlarını koruyor.

Claude Serisi (Anthropic)

Claude ailesi 200K bağlam pencereleriyle tutarlı performans gösteriyor. 3.7 Sonnet ve [P] varyantı mükemmel değer (/M girdi, /M çıktı) ve güçlü hız (750 t/s) sunuyor. 3.5 versiyonları gecikmede küçük farklılıklarla benzer yetenekleri koruyor.

OpenAI Serisi

Çeşitli yeteneklere sahip farklı modeller: o1 modelleri 128K ile 750K arasında bağlam pencereleri sunuyor, temel o1 iyi bir değer sunuyor (/M girdi, /M çıktı). Mini varyantlar hız ve gecikme arasında farklı dengeler gösterirken, GPT-4 modelleri tutarlı performansa odaklanıyor.

DeepSeek V3 Serisi

Oldukça rekabetçi fiyatlandırmayla (/M girdi, /M çıktı) 128K bağlam penceresi sağlıyor. İşlem hızı (350 t/s) ve gecikme (4s) orta düzeyde olsa da, maliyet etkinliği bütçe odaklı uygulamalar için uygun hale getiriyor.

Özelleştirilmiş Modeller

  • Qwen Serisi: Orta seviye fiyatlandırma ile 200K bağlam sunuyor ancak etkileyici hıza sahip (900 t/s)
  • Nous Pro: Uygun fiyatlı (/M girdi, /M çıktı) daha büyük 300K bağlam penceresi sunuyor
  • Llama 3.1 Serisi: Ekonomik fiyatlandırma ve güvenilir performansla tutarlı 128K bağlam sağlıyor