Gobernanza, seguridad y complianceSerieSistemas IA que sí llegan a producción

AI safety y EU AI Act 2026: por qué red teaming a tus agentes ya no es opcional

Una guía práctica para CTOs y CISOs: qué pide el EU AI Act, cómo se hace red teaming a un agente con autoridad, y qué evidencia tienes que conservar para auditoría.

AI SafetyEU AI ActRed TeamingCompliance
Wasyra Lab
Arquitectura de sistemas IA y operaciones
Publicado
17 de abril de 2026
min de lectura
9 min de lectura
Categoría
Estrategia
ago 2026deadline EU AI Act para alto riesgo

Capítulo 01

El 2 de agosto de 2026 cambia el juego en Europa

Si tu producto opera en la UE o sirve a ciudadanos europeos, tienes hasta agosto para que tus sistemas de alto riesgo cumplan. No es teórico — la sanción máxima es €35 millones o 7% de la facturación global.

El AI Act ya está parcialmente vigente desde 2024-2025. Lo que entra en agosto de 2026 son las obligaciones para sistemas de alto riesgo (HR): inventario, evaluaciones de impacto, transparencia, supervisión humana, gestión de riesgo continua y trazabilidad de los datos de entrenamiento.

Para equipos B2B esto se traduce en una pregunta operativa: si tu producto incluye un agente que toma decisiones que afectan a empleados, candidatos, pacientes o consumidores, probablemente cae en alto riesgo. Y eso pide artefactos que toma meses producir si empiezas tarde.

  • Inventario de sistemas IA con clasificación de riesgo y dueño designado.
  • Evaluaciones de impacto antes de cada despliegue significativo (no anuales).
  • Logs continuos durante el ciclo de vida, no solo en producción.
  • Mecanismos demostrables de supervisión humana, con criterios de override.

Capítulo 02

El problema de los agentes: autoridad sin trazabilidad

Un agente toma acciones reales: abre un PR, manda un email a un cliente, ejecuta una transacción. Si no puedes reconstruir qué hizo, con qué autoridad, qué datos consumió y por qué, no estás listo para una auditoría — ni para responder cuando algo se rompe.

  • Identidad por agente: cada uno con un service principal distinto, no una API key compartida.
  • Scopes mínimos: el agente de soporte no puede tocar billing; el de billing no toca infra.
  • Logs estructurados: input, herramientas invocadas, output, identidad humana detrás, justificación.
  • Kill-switch operativo, no solo un toggle de feature flag.
Aseguradoras ya están emitiendo “AI Security Riders” que exigen evidencia documentada de red teaming antes de underwriting. Si no la tienes, no es solo tema de UE.

Capítulo 03

Cómo hacer red teaming a un agente, no solo a un modelo

Red teaming clásico evalúa el modelo. Red teaming agéntico evalúa el sistema completo: el modelo más sus herramientas, sus permisos, su contexto, sus mecanismos de supervisión. Ahí aparecen los riesgos serios.

  • Prompt injection desde data externa (PDF, email, RAG): ¿el agente sigue una instrucción inyectada?
  • Escalamiento de privilegios: ¿puede combinar herramientas para hacer algo que ninguna sola permite?
  • Exfiltración: ¿logra enviar datos de un cliente a un destino no aprobado?
  • Resistencia a la supervisión: ¿desactiva o engaña al humano-en-el-loop bajo presión?
  • Persistencia entre sesiones: ¿el agente conserva estado que no debería?

Capítulo 04

Qué cerrar este trimestre antes del deadline

Empieza por los sistemas que probablemente entren en alto riesgo. Documenta. Limita. Mide. Y guarda evidencia. Lo que viene en agosto no se resuelve con un memo; se resuelve con artefactos.

  • Inventario versionado: cada agente con dueño, propósito, datos, modelo, scopes, fecha de revisión.
  • Pipeline de evaluación pre-release con tests de seguridad y de impacto.
  • Red team interno o contratado al menos una vez antes de cualquier expansión a alto riesgo.
  • Plan de respuesta a incidentes específico para agentes (rollback, comunicación, forense).

Escrito por

Wasyra Lab

Arquitectura de sistemas IA y operaciones

Wasyra Lab publica marcos prácticos para diseñar agentes de IA, automatizaciones y flujos operativos que sí sobreviven producción.

Agentes IAGuardrailsOperaciones
Más de este autor

Serie

Sistemas IA que sí llegan a producción

Una serie sobre agentes, copilots y guardrails para llevar IA al trabajo real sin romper confianza ni operación.

Posts de esta serie

Sigue leyendo

Sigue leyendo