Denyut visual pemimpin performa yang mendukung AnyInt.
Filter benchmark di seluruh kecerdasan, kecepatan, latensi, biaya, konteks, dan kesiapan enterprise untuk menerapkan kecerdasan yang tepat ke alur kerja AI Anda.
Peringkat Indeks Kecerdasan
Indeks Kecerdasan AnyInt v4.0 menggabungkan 10 evaluasi termasuk penalaran, pengetahuan, matematika & benchmark coding. Skor lebih tinggi menunjukkan kecerdasan keseluruhan yang lebih baik.
GPT-5.3 Codex (xhigh)
Claude Opus 4.6 (max)
Claude Sonnet 4.6 (max)
GPT-5.2 (xhigh)
GLM-5
GPT-5.2 Codex (xhigh)
Kimi K2.5
Claude Opus 4.6
Gemini 3 Flash
Qwen3.5 397B A17B
MiniMax-M2.5
DeepSeek V3.2
Grok 4
MiMo-V2-Flash (Feb 2026)
Grok 4.1 Fast
Claude Haiku 4.5
KAT-Coder-Pro V1
Nova 2.0 Pro (medium)
gpt-oss-120B (high)
K-EXAONE
gpt-oss-20B (high)
NVIDIA Nemotron Nano 3
K2 Think V2
Mistral Large 3
Llama 4 Maverick
Peringkat Jendela Konteks
Ukuran jendela konteks menentukan seberapa banyak teks yang dapat diproses model dalam satu permintaan. Jendela konteks yang lebih besar memungkinkan analisis dokumen yang lebih panjang dan percakapan yang lebih kompleks.
Grok 4.1 Fast
Llama 4 Maverick
Gemini 3.1 Pro Preview
NVIDIA Nemotron Nano 4
Gemini 3
GPT-5.3 (xhigh)
GPT-5.2 Codex (xhigh)
K2 Think V2
Qwen3.5 397B A17B
Mistral Large 3
Grok 4
Nova 2.0 Pro (medium)
gpt-oss-120B (high)
Kimi K2.5
K-EXAONE
gpt-oss-20B (high)
MiMo-V2-Flash (Feb 2026)
KAT-Coder-Pro V1
MiniMax-M2.5
Claude Opus 4.6 (max)
Claude Opus 4.6
Claude Sonnet 4.6 (max)
Claude Haiku 4.5
GLM-5
DeepSeek V3.2
Peringkat Kecepatan Output
Kecepatan output mengukur seberapa cepat model menghasilkan token. Kecepatan lebih tinggi memungkinkan interaksi yang lebih responsif dan penyelesaian konten panjang yang lebih cepat.
