Miért kellenek multi-ágens rendszerek?
Egy tipikus AI ágens jól csinál egy dolgot: válaszol az ügyfélnek, elemzi az emaileket, vagy feladatokat generál. De az üzleti valóságban a feladatok nem izoláltak — egy bejövő email kezelése 6 különálló lépést igényelhet: email értelmezés, ügyfél-azonosítás, időpont-keresés, foglalás, megerősítő email, bevétel-predikció frissítés.
Ha egyetlen „szuperágens" csinálja mindezt, az túl komplex, nem skálázható, és szinte lehetetlen debuggolni. A megoldás: specializált ágensek, amelyek együttműködnek — pont úgy, ahogy a microservice-ek forradalmasították a backend-fejlesztést.
Két protokoll, két szint
Két nyílt szabvány alakítja az AI ágensek kommunikációját:
Az A2A (Agent-to-Agent) — a Google 2025-ös nyílt protokollja az ágensek egymás közötti kommunikációjához. Minden ágens egy „Agent Card"-ot publikál (JSON), ami leírja a képességeit, végpontját és autentikációját — hasonlóan az OpenAPI spec-hez. Egy ismeretlen ágens is megszólíthatja a másikat: elolvassa az Agent Card-ot, megérti a képességeit, és szabványos formátumban küld kérést.
Az MCP (Model Context Protocol) — az Anthropic szabványa az ágensek és a külső eszközök közötti kapcsolathoz. Az MCP tool-ok (Gmail, Calendar, CRM) dinamikusan regisztrálódnak — ha egy szolgáltató bekapcsolja a Gmail connector-t, az ágens automatikusan „megtanulja", hogy tud emailt küldeni.
A kettő együttes használata az igazán erős: az ágensek A2A-n koordinálnak, és MCP-n keresztül érik el a külső eszközöket.
Az Evaluator-Executor minta
A produkciós multi-ágens rendszerek gyakran logikai ágens-szerepköröket implementálnak egyetlen rendszeren belül:
-
Evaluator Agent (az „agy"): LLM-alapú, alacsony hőmérséklettel (T=0.3), strukturált JSON-t ad vissza. Kétféle módban működik: event mód (bejövő email, webhook → döntés), és scheduled mód (15 percenként proaktív javaslatok: lejárt feladatok, stale deal-ek, közelgő született napok).
-
Executor Agent (a „kéz"): Determinisztikus kód, ami végrehajtja az Evaluator döntéseit — 8 akciótípus (create_task, send_email, create_event stb.), mindegyik pontosan definiált bemenettel.
-
Chat Agent (a „hang"): A felhasználóval közvetlenül beszélő ágens. Más modellt (GPT-4o, Claude, Gemini), magasabb hőmérsékletet (T=0.7) és tool calling-ot használ.
Közöttük az Autonomy Gate áll — háromszintű kontroll:
notify_only: Csak logol, nincs végrehajtássuggest_and_wait: 24 órás jóváhagyási ablakact_and_report: Automatikus végrehajtás + naplózás
Biztonsági kontrollok
A multi-ágens rendszerben a kaszkád-hiba kockázat exponenciálisan nő: ha az Evaluator rosszul dönt, az Executor rossz emailt küld. A védelmi rétegek:
Mikor kell multi-ágens, és mikor A2A?
Multi-ágens architektúra kell, ha: a system prompt > 5000 token és nő; az ágens > 10 tool-t használ; különböző feladatokhoz különböző LLM-konfiguráció szükséges; a feladatok természetesen elkülönülnek (chat vs. háttér-elemzés).
A2A protokoll kell, ha: az ágensek különböző szervezeteknél futnak; harmadik fél ágensét akarod integrálni. Ha a rendszer zárt és belső, a shared state (DB + Queue) elegendő.
A jövővíziója az A2A-nak: cross-business szcenáriók, ahol az egyik cég AI ágense közvetlenül kommunikál a másiké-val — például egy orvosi AI asszisztens időpontot foglal a fodrász AI-nál, vagy egy raktárkészlet-ágens automatikusan rendel a szállítótól.
Érdekli a multi-ágens architektúra részleteiben?
Olvassa el a teljes whitepaper-t az A2A protokollról, az Evaluator-Executor mintáról, az adapter pattern-ről és a biztonsági kontrollokról — kódrészletekkel és architekturális döntésekkel. Ha konkrét tervei vannak, segítünk a megvalósításban.
Beszéljünk az AI stratégiájáról →