Arquitectura de sistemas IA — Maestría3 / 9
Patrones de Orquestación — Pipelines, Routers, Swarms
Una vez que tienes múltiples pasos o agentes, cómo están conectados determina el costo, la latencia y la confiabilidad. Cuatro patrones cubren casi todo.

Cuando el trabajo abarca múltiples pasos o agentes, el cableado — no el modelo — determina el costo, la latencia y la confiabilidad. Cuatro patrones cubren casi todo lo que construirás.
Los cuatro patrones
- Pipeline — secuencia fija: la salida del paso A alimenta a B que alimenta a C. Predecible, fácil de depurar. Úsalo cuando el camino es conocido (extract → transform → summarize).
- Router — un clasificador elige el camino: un modelo económico clasifica la solicitud al especialista o herramienta correcta. Úsalo cuando las entradas varían ampliamente (intents de soporte, tipos de consultas).
- Fan-out / fan-in paralelo — divide el trabajo independiente entre workers, luego fusiona. Úsalo para N-archivos, N-fuentes, revisión multi-perspectiva. Wall-clock = el worker más lento, no la suma.
- Loop evaluador-optimizador — un generador produce, un crítico puntúa, repite hasta que sea lo suficientemente bueno. Úsalo para salida crítica en calidad donde un único intento no es confiable.
Eligiendo
Opta por el patrón más simple que encaje: pipeline si el camino es fijo, router si se ramifica, paralelo solo para trabajo genuinamente independiente, loops solo cuando un pase no es suficiente. Componerlos (un router en pipelines, un fan-out con loops por elemento) maneja el resto.
Los patrones mueven datos entre pasos. Siguiente: qué recuerda el sistema entre ellos — arquitectura de contexto y memoria.
Serie — Arquitectura de sistemas IA — Maestría
- Parte 01Arquitectura de productos de IA — Primeros principiosLos sistemas de IA fallan diferente del software normal: son no determinísticos, tienen costo por llamada y son difíciles de probar. La arquitectura debe considerar los tres.
- Parte 02Single Agent vs. Multi-Agent — Choosing a TopologyMulti-agent is fashionable and usually premature. Here is how to decide honestly — and why most products should start with one well-equipped agent.
- Parte 03Patrones de Orquestación — Pipelines, Routers, Swarms — estás aquíUna vez que tienes múltiples pasos o agentes, cómo están conectados determina el costo, la latencia y la confiabilidad. Cuatro patrones cubren casi todo.
- Parte 04Arquitectura de contexto y memoriaLa ventana de contexto es tu recurso más caro y más disputado. Lo que incluyas en ella —y lo que recuerdes entre llamadas— es una decisión arquitectónica.
- Parte 05Evaluation Pipelines as InfrastructureIn AI systems, evaluation is not QA you do at the end — it's infrastructure you build first. Without it, every change is a prayer.
- Parte 06Ingeniería de costos — Presupuestos de tokens que se sostienenUna característica de IA que encanta a 100 usuarios puede arruinarte a 100,000. El costo es una restricción arquitectónica, diseñada desde el inicio — no descubierta en la factura.
- Parte 07Latencia y rendimiento a escalaLa inferencia es lenta e impredecible. El streaming, el paralelismo y el límite asincrónico son lo que mantiene un producto de IA rápido bajo carga real.
- Parte 08Confiabilidad — Reintentos, Alternativas, ProteccionesLos modelos devuelven salidas malformadas, los proveedores se caen y la calidad se degrada. Un sistema de IA confiable anticipa estos tres escenarios y sigue funcionando de todas formas.
- Parte 09La arquitectura de referencia en producciónTopología, orquestación, memoria, evaluación, costo, latencia y confiabilidad — compuestos en un plano para un sistema de IA que sobrevive usuarios reales.