El Fin de Scrum para la IA: Por Qué Tu “Sprint” de Prompts Está Destinado a Fallar

¿Recuerdas “El Auto Fantástico”?

En la serie ochentera, tenías dos formas de trabajo. Por un lado, tenías a los ingenieros en la Fundación Knight construyendo el auto. Eso es Scrum. “Sprint 1: instalar el chasis”. “Sprint 2: conectar el escáner rojo”. Es un trabajo determinista: o el motor está puesto, o no lo está. Al final del Sprint, el “feature” está “Done”.

Pero luego tenías a Devon Miles hablando con KITT. Eso, mi querido lector, es la Ingeniería de Prompts.

Devon no “construía” la personalidad de KITT en un sprint. Él la refinaba. Cuando Michael Knight (el usuario final) estaba en el campo y decía “¡Devon, KITT casi choca contra un camión! Entendió ‘atajo’ por ‘a través del centro comercial'”, Devon no abría un nuevo “story” para el próximo sprint. Él ajustaba las directivas de KITT en ese mismo instante. Es un diálogo, un refinamiento artístico y constante. Probabilístico.

Y aquí es donde veo el mayor “caos” en las empresas hoy: están intentando gestionar la IA (hablar con KITT) usando la metodología equivocada (construir el auto).

El Caos: Cuando Quieres que KITT esté “Terminado” para el Sprint Review

La escena es familiar. Eres un Gerente de Operaciones en Chile. Tienes un problema: clasificar 10.000 reclamos de clientes al día. Decides usar un Agente de IA. Tu equipo de desarrollo, que vive en Scrum, toma la tarea. Crean la “Historia de Usuario”: “Como agente de soporte, quiero que la IA clasifique los reclamos en ‘Urgente’, ‘Normal’ y ‘Spam’ para priorizar mi trabajo”.

Le asignan 8 “Story Points”. Empieza el Sprint de 2 semanas.

El equipo “desarrolla” el prompt. Lo prueban. Llega el Sprint Review. El Product Owner pregunta: “¿Está ‘Done’?”. El equipo, nervioso, muestra 10 ejemplos donde funciona perfecto. “¡Done!”, declaran. Pero al lanzarlo a producción el lunes, el caos es total. El 30% de los reclamos “Urgentes” terminan en “Spam” porque los clientes usaron sarcasmo, modismos chilenos o escribieron con rabia.

El equipo dice: “Es que el usuario no escribió bien”. El gerente dice: “¡La IA no funciona!”. Y yo, como Arquitecta, digo: “Están usando el mapa equivocado”.

Por Qué Tu “Definition of Done” Es Inútil para la IA

Scrum se construyó para un mundo determinista. Un botón de “comprar” en un e-commerce funciona o no funciona. El código compila o no compila. Puedes declararlo “Terminado”.

Un prompt de IA nunca está “terminado”. Solo está “mejor” o “peor” para un contexto dado.

La Ingeniería de Prompts no es albañilería; es psicología, lingüística y arte. Es un trabajo probabilístico. No estás escribiendo código; estás susurrándole instrucciones a un cerebro digital súper poderoso pero muy literal. Tu trabajo no es “terminar” el prompt en dos semanas; es mejorarlo en dos horas (o dos minutos) cuando falla.

Meter el refinamiento de prompts en un Sprint de 2 semanas es como decirle a un escultor que “termine” el 30% de una estatua esta semana. No tiene sentido. El ciclo de mejora es demasiado rápido y el feedback es instantáneo.

El Nuevo Modelo: De “Sprints” a “Refinamiento Continuo”

Necesitamos dejar de pensar en un Backlog de “features” y empezar a pensar en un Log de “excepciones”.

El trabajo de IA no se gestiona en Sprints; se opera en un bucle de feedback instantáneo. Así es como funciona el “Refinamiento Continuo”:

Ejecución: El Agente de IA (KITT) intenta realizar una tarea en el mundo real (clasificar un reclamo).
Excepción: El Agente falla (clasifica mal un reclamo “Urgente”).
Auditoría: Un humano (Michael Knight) o un sistema de monitoreo detecta el fallo.
Reporte: El fallo se reporta inmediatamente. No va a un backlog para el próximo Sprint.
Refinamiento: El “Diseñador de Prompts” (Devon Miles) analiza el fallo y ajusta la instrucción maestra (el “meta-prompt”) de inmediato.
Re-evaluación: Se vuelve a procesar el reclamo fallido. ¿Funcionó? Sí. El ciclo se repite con el siguiente fallo.

Este ciclo completo puede durar 15 minutos, no 2 semanas.

Los Nuevos Roles del Equipo de IA (Adiós al “Dev” Tradicional)

En este nuevo modelo, los roles cambian drásticamente:

El Diseñador de Prompts (El “Devon Miles”): Es el arquitecto de la conversación. No es necesariamente un programador; puede ser un lingüista, un psicólogo o un experto en el negocio (logística, finanzas). Su trabajo es escribir las instrucciones maestras y refinarlas.
El Auditor de Calidad (El “Michael Knight”): Es el experto en el campo. Es la persona que “sabe cómo huele” un reclamo urgente. Su trabajo no es escribir código, sino auditar las respuestas de la IA y reportar las excepciones con contexto de negocio.

Herramienta Práctica: El Playbook de “Refinamiento Continuo” (El Manual de Devon)

¿Quieres empezar a aplicar esto mañana? Aquí tienes el blueprint. No necesitas un software nuevo, solo un cambio de mentalidad y un nuevo tipo de reunión.

El Playbook de Refinamiento Continuo para Agentes de IA

Objetivo: Moverse de “entregar features” a “mejorar la calidad” de la IA en tiempo real.

Equipo Central:

1x Diseñador de Prompts (El “Dueño” del cerebro de la IA): Responsable de escribir y ajustar las instrucciones maestras.

1x Auditor de Calidad (El “Experto” del negocio): Responsable de validar las salidas y “cazar” errores.

(Opcional) 1x Integrador (El “Ingeniero”): Responsable de que la IA esté conectada a los sistemas (API, RPA, etc.).

El Flujo de Trabajo (El Bucle Rápido):

El “Log de Excepciones”: Crea un lugar simple (un canal de Slack, un Trello, una planilla de Google) donde el Auditor reporta fallos. Cada reporte debe tener: (1) Qué esperaba, (2) Qué obtuvo (la respuesta de la IA), (3) Por qué está mal (el contexto de negocio).

La “Sesión de Refinamiento” (Diaria, 30 min): Olvida el Daily Scrum. Reúne al Diseñador y al Auditor. Revisan el Log de Excepciones.

Refinamiento en Vivo: El Diseñador de Prompts ajusta la instrucción maestra (el prompt) durante la reunión.

Re-test Inmediato: El Auditor vuelve a probar los casos fallidos con el prompt ajustado.

Despliegue: Si el prompt mejora (resuelve el fallo sin crear uno nuevo), se despliega a producción. Sí, en el mismo día.

Las Nuevas Métricas de Éxito (Cómo Medir a KITT):

Tira tus “Story Points” a la basura. Empieza a medir esto:

Tasa de Adherencia al Objetivo (TAO): (Número de salidas correctas / Número total de salidas). Tu objetivo es llevar esto al 99%. Ejemplo: “El agente ahora clasifica el 99% de los reclamos correctamente”.

Tasa de Excepción (o Falla): El inverso del TAO. Tu objetivo es reducirla.

Tasa de Alucinación: (Número de veces que la IA inventa datos / Número total de salidas). Esta debe ser tu métrica de “defecto crítico”.

Tiempo de Resolución de Excepción: ¿Cuánto tiempo pasa desde que el Auditor reporta un fallo hasta que el Diseñador lo corrige? Mídelo en horas, no en días.

Cómo Empezar Mañana Mismo (Sin Pedir Permiso)

No necesitas disolver tu equipo de Scrum. Solo necesitas sacar el trabajo de IA de allí.

1. Nombra a tu “Michael” y tu “Devon”: Identifica a tu mejor experto de negocio (Auditor) y a la persona más hábil para “hablarle” a la IA (Diseñador).

2. Crea tu “Log de Excepciones”: Un simple canal de Teams o Slack llamado “Fallos_IA_Reclamos”.

3. Bloquea 30 minutos al día: Agenda la “Sesión de Refinamiento”.

Deja de tratar a la IA como un proyecto de construcción y empieza a tratarla como un aprendiz talentoso al que debes guiar. Deja de construir el auto y empieza a hablar con KITT.

¿Estás listo para el cambio?

El “caos” que sientes no es porque la IA sea difícil; es porque tus herramientas de gestión están obsoletas. La revolución de la IA no es solo tecnológica, es metodológica.

La pregunta que te dejo es: ¿Cuál es el primer proceso “probabilístico” que vas a sacar de tus Sprints y pasar a “Refinamiento Continuo”?

Cuéntamelo en los comentarios. Hablemos.

El Fin de Scrum para la IA: Por Qué Tu “Sprint” de Prompts Está Destinado a Fallar

¿Recuerdas “El Auto Fantástico”?

El Caos: Cuando Quieres que KITT esté “Terminado” para el Sprint Review

Por Qué Tu “Definition of Done” Es Inútil para la IA

El Nuevo Modelo: De “Sprints” a “Refinamiento Continuo”

Los Nuevos Roles del Equipo de IA (Adiós al “Dev” Tradicional)

Herramienta Práctica: El Playbook de “Refinamiento Continuo” (El Manual de Devon)

El Playbook de Refinamiento Continuo para Agentes de IA

Cómo Empezar Mañana Mismo (Sin Pedir Permiso)

¿Estás listo para el cambio?

Mariemily Silva

Únete a la conversación Cancel reply

¿Recuerdas “El Auto Fantástico”?

El Caos: Cuando Quieres que KITT esté “Terminado” para el Sprint Review

Por Qué Tu “Definition of Done” Es Inútil para la IA

El Nuevo Modelo: De “Sprints” a “Refinamiento Continuo”

Los Nuevos Roles del Equipo de IA (Adiós al “Dev” Tradicional)

Herramienta Práctica: El Playbook de “Refinamiento Continuo” (El Manual de Devon)

El Playbook de Refinamiento Continuo para Agentes de IA

Cómo Empezar Mañana Mismo (Sin Pedir Permiso)

¿Estás listo para el cambio?

Mariemily Silva

Únete a la conversación Cancel reply

Únete a La Central de Innovación.