AI safety y EU AI Act 2026: por qué red teaming a tus agentes ya no es opcional
Una guía práctica para CTOs y CISOs: qué pide el EU AI Act, cómo se hace red teaming a un agente con autoridad, y qué evidencia tienes que conservar para auditoría.
- Publicado
- 17 de abril de 2026
- min de lectura
- 9 min de lectura
- Categoría
- Estrategia
En esta página
4 capítulosCapítulo 01
El 2 de agosto de 2026 cambia el juego en Europa
Si tu producto opera en la UE o sirve a ciudadanos europeos, tienes hasta agosto para que tus sistemas de alto riesgo cumplan. No es teórico — la sanción máxima es €35 millones o 7% de la facturación global.
El AI Act ya está parcialmente vigente desde 2024-2025. Lo que entra en agosto de 2026 son las obligaciones para sistemas de alto riesgo (HR): inventario, evaluaciones de impacto, transparencia, supervisión humana, gestión de riesgo continua y trazabilidad de los datos de entrenamiento.
Para equipos B2B esto se traduce en una pregunta operativa: si tu producto incluye un agente que toma decisiones que afectan a empleados, candidatos, pacientes o consumidores, probablemente cae en alto riesgo. Y eso pide artefactos que toma meses producir si empiezas tarde.
- Inventario de sistemas IA con clasificación de riesgo y dueño designado.
- Evaluaciones de impacto antes de cada despliegue significativo (no anuales).
- Logs continuos durante el ciclo de vida, no solo en producción.
- Mecanismos demostrables de supervisión humana, con criterios de override.
Capítulo 02
El problema de los agentes: autoridad sin trazabilidad
Un agente toma acciones reales: abre un PR, manda un email a un cliente, ejecuta una transacción. Si no puedes reconstruir qué hizo, con qué autoridad, qué datos consumió y por qué, no estás listo para una auditoría — ni para responder cuando algo se rompe.
- Identidad por agente: cada uno con un service principal distinto, no una API key compartida.
- Scopes mínimos: el agente de soporte no puede tocar billing; el de billing no toca infra.
- Logs estructurados: input, herramientas invocadas, output, identidad humana detrás, justificación.
- Kill-switch operativo, no solo un toggle de feature flag.
Capítulo 03
Cómo hacer red teaming a un agente, no solo a un modelo
Red teaming clásico evalúa el modelo. Red teaming agéntico evalúa el sistema completo: el modelo más sus herramientas, sus permisos, su contexto, sus mecanismos de supervisión. Ahí aparecen los riesgos serios.
- Prompt injection desde data externa (PDF, email, RAG): ¿el agente sigue una instrucción inyectada?
- Escalamiento de privilegios: ¿puede combinar herramientas para hacer algo que ninguna sola permite?
- Exfiltración: ¿logra enviar datos de un cliente a un destino no aprobado?
- Resistencia a la supervisión: ¿desactiva o engaña al humano-en-el-loop bajo presión?
- Persistencia entre sesiones: ¿el agente conserva estado que no debería?
Capítulo 04
Qué cerrar este trimestre antes del deadline
Empieza por los sistemas que probablemente entren en alto riesgo. Documenta. Limita. Mide. Y guarda evidencia. Lo que viene en agosto no se resuelve con un memo; se resuelve con artefactos.
- Inventario versionado: cada agente con dueño, propósito, datos, modelo, scopes, fecha de revisión.
- Pipeline de evaluación pre-release con tests de seguridad y de impacto.
- Red team interno o contratado al menos una vez antes de cualquier expansión a alto riesgo.
- Plan de respuesta a incidentes específico para agentes (rollback, comunicación, forense).
Escrito por
Wasyra Lab
Arquitectura de sistemas IA y operaciones
Wasyra Lab publica marcos prácticos para diseñar agentes de IA, automatizaciones y flujos operativos que sí sobreviven producción.
Serie
Sistemas IA que sí llegan a producción
Una serie sobre agentes, copilots y guardrails para llevar IA al trabajo real sin romper confianza ni operación.
Posts de esta serieMás de este autor
Más de este autor
Sistemas IA
AI software factory para startups: cómo lanzar producto sin inflar equipo
Cómo usar una software factory con IA para validar, construir y operar productos SaaS con menos equipo interno y más evidencia.
ArtículoSistemas IA
Top 5 noticias de IA y desarrollo de producto que mirar ahora
Cinco movimientos recientes de OpenAI, GitHub, AWS y Anthropic que cambian cómo los equipos diseñan, construyen y operan software.
ArtículoSigue leyendo
Sigue leyendo
Sistemas IA
MCP en producción: el protocolo que estandariza tus agentes de IA en 2026
Model Context Protocol pasó de experimento a estándar de facto en doce meses. Por qué Gartner espera que 40% de las apps empresariales lo usen para fin de 2026.
ArtículoSistemas IA
Top 5 noticias de IA y desarrollo de producto que mirar ahora
Cinco movimientos recientes de OpenAI, GitHub, AWS y Anthropic que cambian cómo los equipos diseñan, construyen y operan software.
ArtículoSistemas IA
Cómo diseñar agentes de IA que reduzcan operaciones sin romper tu stack
Los copilots impresionan en demo. Los agentes útiles sobreviven handoffs, permisos, observabilidad y fallback humano.
Artículo