Arquitectura de sistemas IA — Maestría4 / 9

Arquitectura de contexto y memoria

La ventana de contexto es tu recurso más caro y más disputado. Lo que incluyas en ella —y lo que recuerdes entre llamadas— es una decisión arquitectónica.

Publicado el 11 may 20261 min de lecturaHaythem Rehouma · Claude Mastery

La ventana de contexto es finita, cara, y donde el modelo realmente "piensa". Tratarla como un bloc de notas infinito es el error arquitectónico más común en sistemas de IA.

El contexto es un presupuesto

Cada token en contexto cuesta dinero y diluye la atención. Más contexto no es más inteligencia —pasado cierto punto es degradación de contexto: el modelo se vuelve más lento y vago a medida que el ruido ahoga la señal. Selecciona despiadadamente: incluye lo que este paso necesita, nada más.

Dos tipos de memoria

Corto plazo (de trabajo) — la conversación/tarea actual. Gestiona con resumen: compacta turnos anteriores en un recapitulativo apretado cuando crece, manteniendo lo esencial y descartando la transcripción.
Largo plazo (persistente) — hechos que sobreviven a una sesión (preferencias del usuario, decisiones previas, conocimiento de dominio). Almacena estas externamente y recupera la parte relevante en contexto por solicitud — RAG aplicado a memoria.

Recupera, no acumules

El patrón escalable no es "recuerda todo en contexto" — es "almacena todo afuera, recupera el bit relevante". Un vector store o DB estructurada sostiene la memoria; el agente tira solo lo que este turno requiere.

La memoria alimenta el sistema. Siguiente: cómo sabes que cualquiera de esto realmente funciona — evaluación como infraestructura.

El contexto es un presupuesto

Dos tipos de memoria

Recupera, no acumules

Skills de Claude relacionadas para instalar

Compartir este artículo

Serie — Arquitectura de sistemas IA — Maestría

Sigue aprendiendo

El curso Claude Mastery