Volver al Blog
Seguridad

Tu asistente de IA ya puede ejecutar acciones. ¿Hay algo vigilando lo que hace?

Corpilus Team9 de junio de 20265 min de lectura
Shieldagentes de IAMCPinyección de promptsOWASP
TL;DR

Los formularios, los prompts y las llamadas a herramientas de IA atacan todos después del inicio de sesión. Un agente de IA capaz de enviar o borrar necesita una barrera. Shield comprueba qué está pasando —y qué hace tu IA en tu nombre— antes de que se ejecute.

Hay una versión de esta conversación que suena a modelado de amenazas abstracto. Esta no es esa versión.

Si tu producto tiene un formulario de contacto, ahora mismo estás recibiendo spam, registros con correos desechables e intentos de credential stuffing. Si has desplegado un asistente de IA, ahora mismo lo están sondeando en busca de inyección de prompts y extracción del prompt de sistema. Y si le has dado herramientas MCP —enviar correos, escribir registros, consultar bases de datos—, la cuestión de qué tiene permitido hacer, y quién lo controla, no es teórica.

Tres problemas, un hilo común

El problema del formulario

Los bots ya no parecen bots. Los navegadores headless, la imitación de comportamiento y el credential stuffing distribuido por cuenta superan una verificación estándar de WAF y un CAPTCHA.

El problema de la IA

Un prompt bien elaborado puede extraer las instrucciones de tu sistema, redirigir el comportamiento del modelo o filtrar datos de partes anteriores de la ventana de contexto. OWASP lo cataloga como el riesgo número uno de los LLM.

El problema del agente

Cuando tu IA puede invocar herramientas —enviar, escribir, eliminar, programar—, un contexto comprometido o una instrucción inyectada no solo extrae información. Ejecuta acciones.

Todos ocurren después de la autenticación. El usuario o la sesión ya han sido verificados. La amenaza entra en la propia interacción.

No necesitas Shield para saber quiénes son tus usuarios. Lo necesitas para saber si lo que están haciendo —o lo que tu IA hace en su nombre— debería realmente estar permitido en este momento.

Qué cambia con Shield en funcionamiento

  • El abuso de formularios y el credential stuffing se detienen antes de llegar a la lógica de tu aplicación, no se limpian después.
  • Tu asistente de IA cuenta con una capa de protección por delante que tú controlas, sin tener que reconstruir el sistema subyacente.
  • Las acciones destructivas de los agentes requieren un control de aprobación. Nada irreversible se ejecuta porque a una IA se lo haya ordenado un prompt manipulado.
  • Cada decisión queda firmada y almacenada: un registro completo de qué se permitió, qué se bloqueó y por qué.

La mayoría de los equipos descubren que lo necesitaban después de que algo sale mal: una avalancha de spam por el formulario de contacto, un asistente al que convencen de revelar sus instrucciones, un agente que envió trescientos correos porque una llamada a una herramienta no tenía ningún control.

Shield se prepara para su lanzamiento. Regístrate para el acceso anticipado.

Enseñamos el porqué y el cómo, en directo, junto a nuestro socio experto Avenue78.

¿Listo para probar Corpilus?

Mantente al día

Recibe las últimas novedades sobre IA empresarial, privacidad de datos y productividad en tu bandeja de entrada.