Az LLM modellválasztás nem technikai kuriózum — a vállalat teljes AI stratégiáját meghatározza. A döntés kihat:
A költségekre: A legdrágább és legolcsóbb modell között 100x árkülönbség van (o3: $60/1M output token vs. Gemini 2.0 Flash: $0.40)
A teljesítményre: Amit az egyik modell kiválóan old meg (kódelemzés), azt a másik gyengén (komplex reasoning)
A sebességre: Egy valós idejű chatbotnál a latency kritikus — a modellválasztás 500ms vs. 5s különbséget jelent
Az adatvédelemre: Cloud API vs. lokális futtatás alapvetően más adatkezelési kockázatot jelent
A vendor lock-in kockázatra: Egyetlen modellre építés → kiszolgáltatottság
A CTO feladata: nem a „legjobb" modellt választani, hanem a feladathoz legjobban illő modellt, a megfelelő költségen, elfogadható kockázattal.
A szereplők — Ki mit tud 2026-ban?
Tier 1 — Frontier modellek
OpenAI
Modell
Kontextus
Erősség
Gyengeség
Ár (input/output per 1M token)
o3
200K
Legjobb reasoning, matematika, kód
Nagyon drága, lassú
$10 / $60
o4-mini
200K
Jó reasoning, alacsonyabb ár
Kevésbé kreatív
$1.10 / $4.40
GPT-4o
128K
Legjobb all-round, jó tool calling
Drágább a mini-nél
$2.50 / $10
GPT-4o-mini
128K
Legjobb ár/érték, gyors, jó magyar
Gyengébb complex reasoning
$0.15 / $0.60
GPT-4.1
1M
Kódolás, hosszú kontextus, instrukció-követés
Új, kevésbé tesztelt
$2 / $8
GPT-4.1-mini
1M
Kiváló ár/teljesítmény, 1M kontextus
Komplex reasoning limitált
$0.40 / $1.60
Ökoszisztéma-előny: Legnagyobb API infrastruktúra, legjobb tooling (Assistants API, Batch API, Fine-tuning), Azure integráció. Az OpenAI a vállalati piacon is domináns — a Microsoft Azure-on keresztül elérhető modellek GDPR-kompatibilis EU régióból is futtathatók, ami a legtöbb európai vállalat számára kritikus szempont.
Anthropic
Modell
Kontextus
Erősség
Gyengeség
Ár (input/output per 1M token)
Claude 4 Opus
200K
Csúcskategóriás reasoning és kreativitás
Nagyon drága, lassabb
$15 / $75
Claude 3.7 Sonnet
200K
Kiváló reasoning + extended thinking
Közepes ár
$3 / $15
Claude 3.5 Haiku
200K
Gyors, olcsó, jó minőség
Gyengébb komplex feladatoknál
$0.80 / $4
Differenciátor: Alkotmány-alapú AI (Constitutional AI), kiemelkedő safety, nagyon jó a hosszú dokumentumok feldolgozásában. Az Anthropic a biztonságot a termékfejlesztés központi elemévé tette — a Claude modellek kevésbé hajlamosak hallucináció-ra és a válaszok konzisztensebbek magas tétű feladatoknál (jogi elemzés, compliance).
Google
Modell
Kontextus
Erősség
Gyengeség
Ár (input/output per 1M token)
Gemini 2.5 Pro
1M
Natív multimodális (kép+szöveg+videó+kód), óriási kontextus
Tool calling kevésbé megbízható
$1.25 / $10
Gemini 2.0 Flash
1M
Nagyon gyors, nagyon olcsó, multimodális
Egyszerűbb reasoning
$0.10 / $0.40
Differenciátor: 1M token kontextus, natív multimodalitás, a legolcsóbb high-quality modell (Flash), Google Cloud integráció. A Gemini különösen erős ott, ahol nagy mennyiségű dokumentumot, képet vagy videót kell egyszerre feldolgozni — és mindezt a piacon elérhető legversenyképesebb áron teszi.
Tier 2 — Az erős kihívók
Modell
Erősség
Ár (input/output per 1M token)
Mistral Large 2
EU-alapú, erős kód és reasoning
$2 / $6
Mistral Small
EU, gyors, jó ár/érték
$0.10 / $0.30
DeepSeek-V3
Kínai, benchmark-szinten frontier
$0.27 / $1.10
Cohere Command R+
RAG-ra optimalizált, vállalati fókusz
$2.50 / $10
Tier 3 — Nyílt modellek (lokálisan futtatható)
Modell
Paraméter
Erősség
Hardware igény
Llama 3.3 (Meta)
70B
Legjobb nyílt modell, szabad licensz
1-2× A100 GPU vagy quantized: RTX 4090
Llama 4 Scout (Meta)
109B (17B aktív MoE)
Multimodális, 10M kontextus
1× H100 vagy quantized
Mistral 7B
7B
Lokális futtatás akár CPU-n
16GB RAM, nincs GPU szükséges
Phi-4 (Microsoft)
14B
Kiváló reasoning a méretéhez képest
1× RTX 3090+
Qwen 2.5 (Alibaba)
72B
Többnyelvű, jó magyar
1-2× A100
A 6 döntési dimenzió
Minden modellválasztást 6 dimenzió mentén kell értékelni. Ezek a dimenziók egymással összefüggnek — a feladat komplexitása meghatározza a latency elvárásokat, a költségérzékenység befolyásolja a modellválasztást, és az adatvédelmi kockázat szűkítheti az opciókat. A 6 dimenzió együttes mérlegelése az, ami a stratégiai döntést megalapozza.