Flujos de Trabajo Multi-Agente — Orquestando Tareas Complejas

Referencias Oficiales: Sub-agents · Agent Teams · Agent SDK · CLI usage

Ruta del currículo

CLAUDE.md Mastery — memoria del repo y reglas
Effective Prompting — framing de tareas y restricciones
MCP Power Tools — herramientas y contexto vivo
Multi-Agent Workflows — delegación y ejecución en paralelo ← Estás aquí
Hooks Automation — guardrails automáticos en local
GitHub Actions Workflows — mover trabajo repetible a automatización de equipo

Documentación oficial usada en esta guía

Subagentes y modelo de delegación — Sub-agents
Orquestación entre sesiones y compañeros de equipo — Agent Teams
Conceptos de orquestación programática — Agent SDK
Patrones de uso del CLI — CLI usage

Qué resuelven realmente los subagentes

Los subagentes de Claude Code sirven para delegar trabajo especializado sin ensuciar el contexto principal. Cada uno opera con su propia ventana de contexto, un prompt del sistema dedicado, herramientas acotadas y permisos independientes. Claude delega cuando la tarea encaja con la descripción del subagente y luego resume los resultados en la sesión principal.

La regla mental es simple:

Conversación principal — decide, sintetiza y mantiene la dirección
Subagentes — exploran, analizan o ejecutan partes concretas
Equipos de agentes — coordinan varias sesiones cuando los trabajadores necesitan hablar entre sí
Worktrees — aíslan cambios de archivo cuando varias sesiones editan en paralelo

Cómo pensar la decisión antes de paralelizar

No todo trabajo merece más agentes. Antes de dividir una tarea, pregúntate:

¿La tarea se puede partir en piezas independientes?
¿Cada pieza tiene un boundary claro de lectura y escritura?
¿El resultado de cada pieza cabe en un resumen corto?
¿Los workers necesitan coordinarse entre sí o solo reportar a un líder?
¿La coordinación extra compensa el coste de contexto y tokens?

Si respondes “no” a varias de estas preguntas, probablemente te conviene una sola sesión bien dirigida.

Subagentes integrados y subagentes personalizados

Claude Code incluye subagentes integrados como Explore, Plan y General-purpose. Además, puedes crear subagentes personalizados para tareas específicas de tu proyecto.

Qué conviene definir al crear un subagente

Descripción clara — Claude la usa para decidir cuándo delegar
Alcance concreto — un dominio, carpeta o tipo de tarea
Herramientas permitidas — solo las necesarias para ese trabajo
Modelo apropiado — usa uno más rápido o económico cuando el trabajo sea de exploración o lectura
Formato de salida — pide resúmenes, listas o decisiones explícitas

Qué más puedes ajustar

La documentación oficial de subagentes también expone controles que cambian bastante el comportamiento:

/agents — la interfaz recomendada para crear, editar y administrar subagentes
Ámbito — proyecto, usuario o sesión actual, según dónde lo definas
permissionMode — desde modo estándar hasta lectura, aprobación limitada o plan mode
skills — puedes precargar skills dentro del subagente para darle conocimiento de dominio desde el inicio
memory — puedes habilitar memoria persistente para que un subagente acumule aprendizajes entre conversaciones

Dos límites importantes:

los subagentes no heredan skills de la conversación principal
los subagentes no pueden generar otros subagentes; si necesitas delegación anidada, encadena desde la conversación principal o usa Skills

Dónde viven los subagentes

Según la documentación oficial, puedes guardarlos en:

.claude/agents/ — subagentes del proyecto
~/.claude/agents/ — subagentes de usuario

Eso hace que la configuración sea reutilizable sin copiar prompts por todas partes.

Cuándo dejarlos actuar solos y cuándo llamarlos explícitamente

Claude puede delegar automáticamente cuando la tarea coincide con la descripción del subagente. Si quieres forzar una ruta concreta, invócalo de forma explícita.

Usa el subagente code-reviewer para revisar el módulo de autenticación.

Haz que el subagente debugger investigue por qué falla el login.

En ambos casos, la clave es la misma: dale un objetivo estrecho y un resultado verificable.

Skills, subagentes y reutilización

Usa Skills cuando quieras reutilizar un procedimiento dentro del contexto principal. Usa subagentes cuando quieras separar contexto, herramientas y permisos. Si necesitas que un subagente arranque con conocimiento de dominio, precárgalo con skills en lugar de esperar que “aprenda” durante la ejecución.

El patrón orquestador

La conversación principal debe comportarse como un orquestador, no como un ejecutor disperso. Su trabajo es dividir, dirigir y recomponer.

Un patrón útil es este:

Objetivo: revisar y estabilizar el módulo de autenticación.
 
Divide el trabajo así:
- Agente 1: explorar auth/login.ts por riesgos de seguridad
- Agente 2: revisar auth/session.ts por manejo de tokens
- Agente 3: revisar auth/middleware.ts por bypasses de autorización
 
Cada agente debe devolver:
- hallazgos priorizados
- archivos afectados
- una recomendación concreta
- cualquier duda bloqueante

Ese formato funciona porque cada subagente sabe qué mirar, qué no tocar y qué debe devolver.

Patrones de orquestación que sí funcionan

1. Investigación paralela

Usa varios subagentes cuando quieras explorar ángulos distintos de un mismo problema.

Investiga en paralelo el backend, el frontend y las pruebas del flujo de notificaciones.
Devuelve un resumen breve por área y una conclusión final.

Esto funciona mejor cuando las rutas de investigación no dependen unas de otras.

2. Encadenado de subagentes

Cuando el trabajo es secuencial, encadena subagentes desde la conversación principal.

Primero usa un subagente para encontrar problemas de rendimiento.
Después usa otro subagente para proponer correcciones.
Luego sintetiza qué cambio es más seguro y pequeño.

La idea es que cada paso herede solo el contexto que necesita, no todo el ruido intermedio.

3. Aislar operaciones de alto volumen

Si una tarea produce mucha salida —tests largos, logs, documentación generada, análisis de archivos grandes— conviene mandarla a un subagente para que el detalle se quede allí y solo vuelva el resumen útil.

Ejecuta la suite de tests y reporta solo:
- fallos
- archivos implicados
- mensajes de error relevantes

4. Dividir por módulos o capas

Para cambios grandes, reparte el sistema por responsabilidad.

un subagente para auth
otro para API
otro para UI
otro para pruebas o validación

Este patrón es especialmente útil cuando cada área tiene boundaries de archivos claros y bajo solapamiento.

5. Explorar antes de implementar

Si el codebase es desconocido, usa primero un subagente de exploración o Plan Mode para mapear el terreno y solo después delega la implementación.

Ese orden reduce trabajo duplicado y evita que varios workers arranquen con hipótesis equivocadas.

Subagentes vs conversación principal

La documentación oficial recomienda usar conversación principal cuando necesitas ida y vuelta frecuente, refinamiento iterativo o latencia baja. Usa subagentes cuando el trabajo pueda hacerse de forma autónoma y devolver un resumen.

Caso	Conversación principal	Subagentes
Cambio rápido y directo	✅	❌ innecesario
Mucha ida y vuelta	✅	❌
Exploración paralela	❌	✅
Salida detallada que no quieres cargar en el hilo principal	❌	✅
Restricciones de herramientas o permisos	❌	✅
Flujo secuencial con fases compartidas	✅	⚠️ solo si el corte es claro

Regla práctica: si el siguiente paso depende mucho del anterior, mantén la sesión principal en control. Si el trabajo puede devolver un resumen limpio, delega.

Subagentes vs equipos de agentes

Aquí está el tradeoff importante de “workers”:

Subagentes — trabajan dentro de una sola sesión y reportan al llamador
Equipos de agentes — coordinan sesiones separadas y permiten comunicación directa entre compañeros de equipo

La página oficial de equipos de agentes los describe como experimentales y deshabilitados por defecto. También señala que los equipos agregan sobrecarga de coordinación y consumen más tokens que una sola sesión.

Aspecto	Subagentes	Equipos de agentes
Contexto	Ventana propia, pero dentro de una sesión	Ventana propia e independiente
Comunicación	Reportan al agente principal	Los compañeros de equipo pueden hablar entre sí
Mejor para	Tareas enfocadas y resúmenes	Investigación colaborativa, discusión y coordinación
Coste	Menor que un equipo completo	Mayor, por sesión separada
Complejidad operativa	Baja	Más alta

Usa subagentes cuando necesitas foco. Usa equipos de agentes cuando los workers necesiten desafiarse, coordinarse o dividir propiedad real entre varias sesiones.

Qué te da un equipo de agentes que un subagente no te da

La documentación de equipos de agentes añade varias capacidades útiles cuando el trabajo ya no cabe en un solo hilo:

una lista de tareas compartida con estados y dependencias
mensajería directa entre compañeros de equipo sin pasar siempre por el líder
modos de visualización distintos para trabajar en una sola terminal o en paneles divididos
aprobación de plan antes de implementar cuando el trabajo es riesgoso o complejo
hooks de calidad para frenar o redirigir el flujo si una tarea termina demasiado pronto
reclamo de tareas con dependencias para que una tarea bloqueada no se tome antes de tiempo
asignación explícita o auto-reclamo según quieras dirigir el equipo desde el líder o dejar que avance por sí mismo

Eso convierte al líder en coordinador y a los compañeros de equipo en sesiones realmente independientes. Úsalo cuando la colaboración entre workers sea tan importante como la ejecución.

Presupuesto de contexto: piensa antes de llenar el hilo

Cada subagente tiene su propia ventana de contexto, pero sus resultados vuelven a la conversación principal. El coste no está solo en correr el agente, sino también en cuánto texto devuelves y cuánto contexto arrastras después.

Reglas simples que ayudan

pide salidas cortas y estructuradas
evita logs crudos si basta un resumen
devuelve solo archivos, decisiones y errores relevantes
si una tarea va a vivir mucho tiempo, reanúdala en lugar de recrearla
no hagas que varios agentes vuelvan con el mismo detalle innecesario

Primer plano o fondo

La documentación oficial distingue dos modos de ejecución para subagentes:

Primer plano — bloquea la conversación principal hasta que el subagente termina
Fondo — corre concurrentemente mientras sigues trabajando en otra cosa

En fondo, Claude Code pide por adelantado los permisos que el subagente necesitará. Si luego necesita una aclaración interactiva, la llamada falla y el subagente sigue adelante. Si ese intento falla por permisos faltantes, puedes repetir la misma tarea en primer plano para responder preguntas en vivo.

Ese modo encaja bien cuando quieres seguir trabajando mientras se ejecuta un análisis largo, una suite de tests o una recopilación de contexto pesada.

Señales de que estás gastando contexto de más

cada subagente devuelve páginas de texto sin filtro
la conversación principal repite hallazgos ya resumidos
vuelves a pedir a otro worker que lea lo mismo desde cero
los resultados tardan más en sintetizarse que en producirse

Una buena orquestación protege el contexto principal como el recurso escaso que es.

Boundaries y ownership

El paralelismo funciona mejor cuando cada worker tiene ownership claro.

Define boundaries antes de lanzar agentes

un módulo por subagente
una carpeta por subagente
una capa por subagente
una pregunta por subagente

Si dos workers van a tocar el mismo archivo, el paralelismo deja de ser una ventaja y empieza a parecer coordinación manual disfrazada.

Reglas prácticas de ownership

Un dueño por área — evita que dos workers escriban en la misma superficie a la vez
Contratos compartidos primero — define tipos, interfaces o schemas antes de implementar
Lectura compartida, escritura aislada — los contratos se pueden leer; las implementaciones deben estar separadas
Síntesis centralizada — una sola sesión decide cómo se integra todo

Qué pasa cuando el boundary es malo

aparecen conflictos de archivos
se duplican decisiones arquitectónicas
el merge final se vuelve el trabajo más caro del flujo
los workers se bloquean por dependencias invisibles

Git worktrees: el aislamiento correcto cuando varias sesiones escriben

Si tienes varias sesiones de Claude Code que realmente van a escribir en paralelo, usa worktrees. La documentación oficial los presenta como la forma de ejecutar sesiones paralelas con aislamiento completo de archivos.

Cuándo aportan valor

cada worker necesita tocar archivos distintos sin pisarse
vas a mantener varias sesiones activas durante bastante tiempo
quieres revisar ramas distintas con independencia real
necesitas aislar experimentos o refactors grandes

Cuándo no son necesarios

solo estás investigando o leyendo
el trabajo sigue siendo secuencial
una sola sesión puede sintetizar el resultado sin problemas

Flujo práctico

1. Crea un worktree por tarea o por sesión.
2. Inicia Claude Code dentro de cada worktree.
3. Mantén una sola pieza de ownership por worktree.
4. Inicializa el entorno de desarrollo en cada uno.
5. Limpia el worktree cuando termines.

Regla operativa

Usa worktrees para aislar cambios de archivo. Usa subagentes para aislar razonamiento dentro de una sola sesión. Usa equipos de agentes cuando necesites coordinación entre sesiones.

Cuándo no usar paralelismo

Más agentes no siempre significa más velocidad. Evita paralelizar cuando veas alguno de estos casos:

Dependencias secuenciales — el paso B depende de la salida del paso A
Un solo archivo caliente — varios workers editarían lo mismo
Tarea muy pequeña — el overhead supera el beneficio
Scope borroso — nadie sabe qué parte le pertenece a quién
Necesidad de refinamiento constante — la conversación humana sigue cambiando el objetivo
Resultado único y delicado — quieres una sola síntesis, no tres opiniones competidoras

Regla práctica: si el trabajo no se puede resumir claramente en tareas independientes, no lo dividas.

Integración práctica: un loop que no pierde el hilo

Un loop sano suele verse así:

1. Explora

Usa un subagente de exploración o Plan Mode para entender el terreno.

2. Divide

Separa el trabajo por módulos, capas o responsabilidades.

3. Delegar

Lanza subagentes con boundaries claros y con el formato de salida que necesitas.

4. Sintetiza

Reúne los hallazgos en la conversación principal y decide qué hacer.

5. Implementa

Si el cambio toca varios archivos y varias sesiones, pasa a worktrees o a equipos de agentes. Si el trabajo aún cabe dentro de una sola sesión, quédate con subagentes y evita moverlo a una coordinación más pesada de la necesaria.

6. Verifica

Pide que se ejecuten tests, revisiones o validaciones, pero devuelve solo el resultado necesario.

7. Reanuda o cierra

Si el trabajo continúa, reanuda el subagente adecuado. Si terminó, limpia el contexto y los worktrees.

Ese loop reduce desorden porque cada fase tiene un propósito claro.

Ejemplo práctico: revisión, corrección y verificación

Necesito estabilizar el módulo de autenticación.
 
Paso 1: usa un subagente para revisar riesgos de seguridad.
Paso 2: usa otro subagente para identificar puntos de refactor mínimo.
Paso 3: sintetiza ambos resultados y elige una sola dirección.
Paso 4: ejecuta la corrección en un boundary claro.
Paso 5: valida el cambio con tests.

Lo importante aquí no es la cantidad de agentes, sino que cada uno tenga una función distinta en la cadena.

Cómo escribir mejores instrucciones para delegar

Un buen prompt de delegación tiene cinco partes:

Objetivo — qué quieres lograr
Boundary — qué área o archivos puede tocar
Restricción — qué no debe cambiar
Formato de salida — qué debe devolverte
Criterio de cierre — cuándo consideras que terminó

Plantilla breve

Objetivo: ...
Boundary: ...
No cambies: ...
Devuelve: ...
Termina cuando: ...

Cuanto mejor acotes la tarea, menos contexto desperdicia el subagente y más fácil es integrar su salida.

Cuándo conviene reanudar en vez de recrear

Reanuda un subagente cuando la tarea necesita continuidad real: ya tiene historial útil, decisiones previas, resultados de herramientas o un razonamiento que no quieres reconstruir. Crea uno nuevo solo cuando quieres una mirada fresca o cuando el scope cambió de verdad.

Errores comunes

“Voy a lanzar más workers y listo”

Sin boundaries claros, el paralelismo crea ruido, no velocidad.

“Cada worker puede decidir su propio scope”

Eso suele terminar en archivos solapados, decisiones duplicadas y merges más caros.

“Que todo lo que encuentren vuelva completo”

Demasiado detalle en el retorno mata el beneficio del contexto separado.

“Si una investigación ya empezó, recreo otro worker”

Primero intenta reanudar el mismo subagente si el trabajo necesita continuidad.

“Un worktree resuelve la coordinación”

No. Worktrees aíslan archivos; no reemplazan la necesidad de buena orquestación.

Resumen operativo

Usa esta heurística simple:

Subagentes cuando quieres foco y resúmenes
Equipos de agentes cuando los workers necesitan comunicarse y coordinarse entre sesiones
Worktrees cuando varios workers van a escribir a la vez con aislamiento Git
Una sola sesión cuando la tarea es pequeña, secuencial o necesita mucha ida y vuelta

En la práctica, la mejor orquestación es la que reduce contexto perdido, evita solapamientos y mantiene una sola fuente de decisión clara.

Comparación con flujos de agente único

Si vienes de un flujo de agente único, la diferencia clave es esta: no intentes que una sola conversación haga todo. Divide cuando el trabajo sea realmente paralelizable, pero conserva el control central de la síntesis, la verificación y la decisión final.

Ese equilibrio es lo que hace útil el sistema multi-agente sin volverlo caótico.

Guías Conectadas