Context window comparison

مقاييس نافذة السياق

النماذج
Llama 4 Scout	32,000,000	900 t/s	0.33s
Llama 4 Maverick	32,000,000	900 t/s	0.44s
Gemini 3 Pro	128,000	n/a	n/a	800 t/s	0.72s
Qwen 3 [Beta]	n/a	n/a	n/a	n/a	n/a
Gemini 2.0 Pro	1,000,000	800 t/s	0.50s
Claude 3.7 Sonnet	200,000	750 t/s	0.55s
GPT-4.5	128,000	450 t/s	1.20s
Claude 3.7 Sonnet [P]	200,000	750 t/s	0.55s
DeepSeek V3	128,000	350 t/s	4.00s
OpenAI o1-mini	200,000	250 t/s	14.00s
OpenAI o1	128,000	200 t/s	12.64s
OpenAI o1-mini-2	750,000	n/a	n/a	n/a	n/a
DeepSeek V3 G324	128,000	350 t/s	4.00s
Qwen o1	200,000	900 t/s	20.00s
Gemini 2.0 Flash	128,000	500 t/s	0.32s
Llama 3.1 70b	128,000	500 t/s	0.72s
Nous Pro	300,000	500 t/s	0.64s
Claude 3.5 Haiku	200,000	850 t/s	0.35s
Llama 3.1 405b	128,000	350 t/s	0.72s
GPT-4o-mini	128,000	450 t/s	0.50s
GPT-4o	128,000	450 t/s	0.50s
Claude 3.5 Sonnet	200,000	750 t/s	1.20s

تفاصيل النموذج

سلسلة Llama 4 (Meta)

تتصدر الصناعة بنوافذ سياق ضخمة تبلغ 32 مليون رمز، حيث يوفر كل من إصداري Scout وMaverick قدرات معالجة سياق لا مثيل لها. على الرغم من التكاليف الأعلى (-/مليون رمز)، فإنها تحافظ على سرعة ممتازة (900 رمز/ثانية) مع زمن استجابة منخفض (0.33-0.44 ثانية)، مما يجعلها مثالية لمعالجة المستندات واسعة النطاق والتحليلات المعقدة.

سلسلة Gemini (Google)

تباين ملحوظ بين الإصدارات: يوفر Gemini 3 Pro سياقًا قياسيًا بحجم 128 ألف رمز ولكن بسرعة محسنة (800 رمز/ثانية)، بينما يتميز Gemini 2.0 Pro بنافذة سياق مثيرة للإعجاب تبلغ مليون رمز مع تسعير تنافسي (/مليون مدخلات). يحافظ كلاهما على سرعات معالجة ممتازة مع زمن استجابة منخفض، مما يجعلهما مناسبين للتطبيقات المؤسسية.

سلسلة Claude (Anthropic)

تُظهر عائلة Claude أداءً متسقًا مع نوافذ سياق بحجم 200 ألف رمز. يوفر Claude 3.7 Sonnet وإصدار [P] منه قيمة ممتازة (/مليون مدخلات، /مليون مخرجات) مع سرعة قوية (750 رمز/ثانية). تحافظ إصدارات 3.5 على قدرات مماثلة مع اختلافات طفيفة في زمن الاستجابة.

سلسلة OpenAI

مجموعة متنوعة بقدرات متفاوتة: تتراوح نوافذ سياق نماذج o1 من 128 ألف إلى 750 ألف رمز، مع توفير o1 الأساسي قيمة جيدة (/مليون مدخلات، /مليون مخرجات). تُظهر الإصدارات المصغرة مفاضلات مختلفة بين السرعة وزمن الاستجابة، بينما تركز نماذج GPT-4 على الأداء المتسق.

سلسلة DeepSeek V3

توفر نافذة سياق بحجم 128 ألف رمز مع تسعير تنافسي للغاية (/مليون مدخلات، /مليون مخرجات). في حين أن سرعة المعالجة (350 رمز/ثانية) وزمن الاستجابة (4 ثوانٍ) معتدلة، فإن فعالية التكلفة تجعلها مناسبة للتطبيقات التي تراعي الميزانية.

النماذج المتخصصة

سلسلة Qwen: توفر سياقًا بحجم 200 ألف رمز مع تسعير متوسط ولكن بسرعة مثيرة للإعجاب (900 رمز/ثانية)
Nous Pro: يتميز بنافذة سياق أكبر بحجم 300 ألف رمز مع تسعير معقول (/مليون مدخلات، /مليون مخرجات)
سلسلة Llama 3.1: توفر سياقًا متسقًا بحجم 128 ألف رمز مع تسعير اقتصادي وأداء موثوق

عام

مقدمة

هندسة الموجهات

مواضيع نموذجية

مستويات التعلم

البحث

Context window comparison

مقاييس نافذة السياق

تفاصيل النموذج

سلسلة Llama 4 (Meta)

سلسلة Gemini (Google)

سلسلة Claude (Anthropic)

سلسلة OpenAI

سلسلة DeepSeek V3

النماذج المتخصصة

عام

مقدمة

هندسة الموجهات

مواضيع نموذجية

مستويات التعلم

البحث

​مقاييس نافذة السياق

​تفاصيل النموذج

​سلسلة Llama 4 (Meta)

​سلسلة Gemini (Google)

​سلسلة Claude (Anthropic)

​سلسلة OpenAI

​سلسلة DeepSeek V3

​النماذج المتخصصة

مقاييس نافذة السياق

تفاصيل النموذج

سلسلة Llama 4 (Meta)

سلسلة Gemini (Google)

سلسلة Claude (Anthropic)

سلسلة OpenAI

سلسلة DeepSeek V3

النماذج المتخصصة