Arquitectura de sistemas IA — Maestría2 / 9
Single Agent vs. Multi-Agent — Choosing a Topology
Multi-agent is fashionable and usually premature. Here is how to decide honestly — and why most products should start with one well-equipped agent.

"Multi-agent" suena avanzado, así que los equipos lo adoptan temprano. Generalmente es un error. Un único agente con buenas herramientas es más simple, económico y fácil de depurar — empieza ahí y gánate tu camino hacia más.
Cuándo un agente gana
Si la tarea es principalmente secuencial y cabe en un contexto, un agente con las herramientas correctas supera a un enjambre. Menos piezas móviles, un único trace para depurar, sin overhead de coordinación. La mayoría de los productos viven aquí más tiempo del que piensan.
Las razones reales para ir multi-agent
- Paralelismo — subtareas genuinamente independientes (N archivos, N fuentes) se ejecutan concurrentemente para ganancias en tiempo real.
- Aislamiento de contexto — una subtarea pesada e intensiva en lectura no debería contaminar el contexto del agente principal.
- Especialización — un revisor o investigador precisamente indicado se comporta más consistentemente que un generalista malabareando roles.
Si ninguno de estos aplica, multi-agent es solo overhead vistiendo una tendencia.
El costo de coordinación
¿Decidiste que necesitas coordinación? Siguiente: los patrones de orquestación — pipelines, routers y enjambres.
Serie — Arquitectura de sistemas IA — Maestría
- Parte 01Arquitectura de productos de IA — Primeros principiosLos sistemas de IA fallan diferente del software normal: son no determinísticos, tienen costo por llamada y son difíciles de probar. La arquitectura debe considerar los tres.
- Parte 02Single Agent vs. Multi-Agent — Choosing a Topology — estás aquíMulti-agent is fashionable and usually premature. Here is how to decide honestly — and why most products should start with one well-equipped agent.
- Parte 03Patrones de Orquestación — Pipelines, Routers, SwarmsUna vez que tienes múltiples pasos o agentes, cómo están conectados determina el costo, la latencia y la confiabilidad. Cuatro patrones cubren casi todo.
- Parte 04Arquitectura de contexto y memoriaLa ventana de contexto es tu recurso más caro y más disputado. Lo que incluyas en ella —y lo que recuerdes entre llamadas— es una decisión arquitectónica.
- Parte 05Evaluation Pipelines as InfrastructureIn AI systems, evaluation is not QA you do at the end — it's infrastructure you build first. Without it, every change is a prayer.
- Parte 06Ingeniería de costos — Presupuestos de tokens que se sostienenUna característica de IA que encanta a 100 usuarios puede arruinarte a 100,000. El costo es una restricción arquitectónica, diseñada desde el inicio — no descubierta en la factura.
- Parte 07Latencia y rendimiento a escalaLa inferencia es lenta e impredecible. El streaming, el paralelismo y el límite asincrónico son lo que mantiene un producto de IA rápido bajo carga real.
- Parte 08Confiabilidad — Reintentos, Alternativas, ProteccionesLos modelos devuelven salidas malformadas, los proveedores se caen y la calidad se degrada. Un sistema de IA confiable anticipa estos tres escenarios y sigue funcionando de todas formas.
- Parte 09La arquitectura de referencia en producciónTopología, orquestación, memoria, evaluación, costo, latencia y confiabilidad — compuestos en un plano para un sistema de IA que sobrevive usuarios reales.