Context window comparison

コンテキストウィンドウベンチマーク

モデル
Llama 4 Scout	32,000,000	900 t/s	0.33s
Llama 4 Maverick	32,000,000	900 t/s	0.44s
Gemini 3 Pro	128,000	n/a	n/a	800 t/s	0.72s
Qwen 3 [Beta]	n/a	n/a	n/a	n/a	n/a
Gemini 2.0 Pro	1,000,000	800 t/s	0.50s
Claude 3.7 Sonnet	200,000	750 t/s	0.55s
GPT-4.5	128,000	450 t/s	1.20s
Claude 3.7 Sonnet [P]	200,000	750 t/s	0.55s
DeepSeek V3	128,000	350 t/s	4.00s
OpenAI o1-mini	200,000	250 t/s	14.00s
OpenAI o1	128,000	200 t/s	12.64s
OpenAI o1-mini-2	750,000	n/a	n/a	n/a	n/a
DeepSeek V3 G324	128,000	350 t/s	4.00s
Qwen o1	200,000	900 t/s	20.00s
Gemini 2.0 Flash	128,000	500 t/s	0.32s
Llama 3.1 70b	128,000	500 t/s	0.72s
Nous Pro	300,000	500 t/s	0.64s
Claude 3.5 Haiku	200,000	850 t/s	0.35s
Llama 3.1 405b	128,000	350 t/s	0.72s
GPT-4o-mini	128,000	450 t/s	0.50s
GPT-4o	128,000	450 t/s	0.50s
Claude 3.5 Sonnet	200,000	750 t/s	1.20s

モデル詳細

Llama 4 シリーズ（Meta）

巨大な32Mトークンのコンテキストウィンドウで業界をリードし、ScoutとMaverickの両バリアントは比類のないコンテキスト処理能力を提供します。コストは高め（-/Mトークン）ですが、優れた速度（900 t/s）と最小限のレイテンシ（0.33-0.44s）を維持し、大規模な文書処理や複雑な分析に最適です。

Geminiシリーズ（Google）

バージョン間の顕著な対比：Gemini 3 Proは標準的な128Kコンテキストを提供しながら速度が向上（800 t/s）し、Gemini 2.0 Proは印象的な1Mトークンのコンテキストウィンドウと競争力のある価格（/M入力）を特徴としています。どちらも低レイテンシで優れた処理速度を維持し、エンタープライズアプリケーションに適しています。

Claudeシリーズ（Anthropic）

Claudeファミリーは200Kのコンテキストウィンドウで一貫したパフォーマンスを示しています。3.7 Sonnetとその[P]バリアントは優れた価値（/M入力、/M出力）と強力な速度（750 t/s）を提供します。3.5バージョンはレイテンシにわずかな違いがありますが、同様の機能を維持しています。

OpenAIシリーズ

様々な能力を持つ多様なラインナップ：o1モデルは128Kから750Kのコンテキストウィンドウを提供し、基本o1は良い価値（/M入力、/M出力）を提供します。miniバリアントは速度とレイテンシの間で異なるトレードオフを示し、GPT-4モデルは一貫したパフォーマンスに焦点を当てています。

DeepSeek V3シリーズ

128Kのコンテキストウィンドウを非常に競争力のある価格（/M入力、/M出力）で提供します。処理速度（350 t/s）とレイテンシ（4s）は中程度ですが、コスト効率の良さから予算を重視するアプリケーションに適しています。

特化型モデル

Qwenシリーズ：中程度の価格で200Kのコンテキストを提供しますが、印象的な速度（900 t/s）を誇ります
Nous Pro：手頃な価格（/M入力、/M出力）で大きな300Kコンテキストウィンドウを特徴としています
Llama 3.1シリーズ：経済的な価格と信頼性の高いパフォーマンスで一貫した128Kコンテキストを提供します

一般

はじめに

プロンプトエンジニアリング

サンプルトピック

学習レベル

研究

Context window comparison

コンテキストウィンドウベンチマーク

モデル詳細

Llama 4 シリーズ（Meta）

Geminiシリーズ（Google）

Claudeシリーズ（Anthropic）

OpenAIシリーズ

DeepSeek V3シリーズ

特化型モデル

一般

はじめに

プロンプトエンジニアリング

サンプルトピック

学習レベル

研究

​コンテキストウィンドウベンチマーク

​モデル詳細

​Llama 4 シリーズ（Meta）

​Geminiシリーズ（Google）

​Claudeシリーズ（Anthropic）

​OpenAIシリーズ

​DeepSeek V3シリーズ

​特化型モデル

コンテキストウィンドウベンチマーク

モデル詳細

Llama 4 シリーズ（Meta）

Geminiシリーズ（Google）

Claudeシリーズ（Anthropic）

OpenAIシリーズ

DeepSeek V3シリーズ

特化型モデル