مقاييس نافذة السياق

النماذج
Llama 4 Scout32,000,000900 t/s0.33s
Llama 4 Maverick32,000,000900 t/s0.44s
Gemini 3 Pro128,000n/an/a800 t/s0.72s
Qwen 3 [Beta]n/an/an/an/an/a
Gemini 2.0 Pro1,000,000800 t/s0.50s
Claude 3.7 Sonnet200,000750 t/s0.55s
GPT-4.5128,000450 t/s1.20s
Claude 3.7 Sonnet [P]200,000750 t/s0.55s
DeepSeek V3128,000350 t/s4.00s
OpenAI o1-mini200,000250 t/s14.00s
OpenAI o1128,000200 t/s12.64s
OpenAI o1-mini-2750,000n/an/an/an/a
DeepSeek V3 G324128,000350 t/s4.00s
Qwen o1200,000900 t/s20.00s
Gemini 2.0 Flash128,000500 t/s0.32s
Llama 3.1 70b128,000500 t/s0.72s
Nous Pro300,000500 t/s0.64s
Claude 3.5 Haiku200,000850 t/s0.35s
Llama 3.1 405b128,000350 t/s0.72s
GPT-4o-mini128,000450 t/s0.50s
GPT-4o128,000450 t/s0.50s
Claude 3.5 Sonnet200,000750 t/s1.20s

تفاصيل النموذج

سلسلة Llama 4 (Meta)

تتصدر الصناعة بنوافذ سياق ضخمة تبلغ 32 مليون رمز، حيث يوفر كل من إصداري Scout وMaverick قدرات معالجة سياق لا مثيل لها. على الرغم من التكاليف الأعلى (-/مليون رمز)، فإنها تحافظ على سرعة ممتازة (900 رمز/ثانية) مع زمن استجابة منخفض (0.33-0.44 ثانية)، مما يجعلها مثالية لمعالجة المستندات واسعة النطاق والتحليلات المعقدة.

سلسلة Gemini (Google)

تباين ملحوظ بين الإصدارات: يوفر Gemini 3 Pro سياقًا قياسيًا بحجم 128 ألف رمز ولكن بسرعة محسنة (800 رمز/ثانية)، بينما يتميز Gemini 2.0 Pro بنافذة سياق مثيرة للإعجاب تبلغ مليون رمز مع تسعير تنافسي (/مليون مدخلات). يحافظ كلاهما على سرعات معالجة ممتازة مع زمن استجابة منخفض، مما يجعلهما مناسبين للتطبيقات المؤسسية.

سلسلة Claude (Anthropic)

تُظهر عائلة Claude أداءً متسقًا مع نوافذ سياق بحجم 200 ألف رمز. يوفر Claude 3.7 Sonnet وإصدار [P] منه قيمة ممتازة (/مليون مدخلات، /مليون مخرجات) مع سرعة قوية (750 رمز/ثانية). تحافظ إصدارات 3.5 على قدرات مماثلة مع اختلافات طفيفة في زمن الاستجابة.

سلسلة OpenAI

مجموعة متنوعة بقدرات متفاوتة: تتراوح نوافذ سياق نماذج o1 من 128 ألف إلى 750 ألف رمز، مع توفير o1 الأساسي قيمة جيدة (/مليون مدخلات، /مليون مخرجات). تُظهر الإصدارات المصغرة مفاضلات مختلفة بين السرعة وزمن الاستجابة، بينما تركز نماذج GPT-4 على الأداء المتسق.

سلسلة DeepSeek V3

توفر نافذة سياق بحجم 128 ألف رمز مع تسعير تنافسي للغاية (/مليون مدخلات، /مليون مخرجات). في حين أن سرعة المعالجة (350 رمز/ثانية) وزمن الاستجابة (4 ثوانٍ) معتدلة، فإن فعالية التكلفة تجعلها مناسبة للتطبيقات التي تراعي الميزانية.

النماذج المتخصصة

  • سلسلة Qwen: توفر سياقًا بحجم 200 ألف رمز مع تسعير متوسط ولكن بسرعة مثيرة للإعجاب (900 رمز/ثانية)
  • Nous Pro: يتميز بنافذة سياق أكبر بحجم 300 ألف رمز مع تسعير معقول (/مليون مدخلات، /مليون مخرجات)
  • سلسلة Llama 3.1: توفر سياقًا متسقًا بحجم 128 ألف رمز مع تسعير اقتصادي وأداء موثوق