Späť na blog
Bezpečnosť

Váš AI asistent už dokáže vykonávať akcie. Sleduje vôbec niekto, čo robí?

Corpilus Team9. júna 20265 min čítania
ShieldAI agentiMCPprompt injectionOWASP
TL;DR

Formuláre, prompty aj volania AI nástrojov útočia až po prihlásení. AI agent, ktorý dokáže odosielať alebo mazať, potrebuje bránu. Shield preveruje, čo sa deje — aj to, čo vaša AI robí vo vašom mene — skôr, než to vykoná.

Existuje verzia tohto rozhovoru, ktorá znie ako abstraktné modelovanie hrozieb. Toto nie je tá verzia.

Ak má váš produkt kontaktný formulár, práve teraz dostávate spam, registrácie cez jednorazové e-maily a pokusy o credential stuffing. Ak ste nasadili AI asistenta, práve teraz ho niekto skúša na prompt injection a vyťahovanie systémového promptu. A ak ste mu dali nástroje cez MCP — odosielanie e-mailov, zápis záznamov, dotazovanie databáz — otázka, čo všetko smie robiť a kto to kontroluje, nie je teoretická.

Tri problémy, jedna spoločná niť

Problém s formulárom

Boty už nevyzerajú ako boty. Headless prehliadače, napodobňovanie ľudského správania a distribuovaný credential stuffing rozložený na jednotlivé účty prejdú štandardnou kontrolou WAF aj cez CAPTCHA.

Problém s AI

Dobre zostavený prompt dokáže vytiahnuť vaše systémové inštrukcie, presmerovať správanie modelu alebo nechať uniknúť dáta z predchádzajúcej časti kontextového okna. OWASP toto uvádza ako riziko číslo jeden pre LLM.

Problém s agentom

Keď vaša AI dokáže volať nástroje — odoslať, zapísať, zmazať, naplánovať — kompromitovaný kontext alebo podstrčená inštrukcia už nielen vyťahuje informácie. Vykonáva akcie.

Všetky sa dejú až po overení. Používateľ alebo relácia už boli overené. Hrozba vstupuje v samotnej interakcii.

Shield nepotrebujete na to, aby ste vedeli, kto sú vaši používatelia. Potrebujete ho na to, aby ste vedeli, či to, čo robia — alebo čo robí vaša AI v ich mene — má byť práve teraz vôbec povolené.

Čo sa zmení, keď je Shield na mieste

  • Zneužitie formulárov a credential stuffing sú zastavené skôr, než sa dostanú k vašej aplikačnej logike — nie upratané dodatočne.
  • Váš AI asistent má pred sebou ochrannú vrstvu, ktorú máte pod kontrolou, bez prestavby základného systému.
  • Deštruktívne akcie agenta vyžadujú schvaľovaciu bránu. Nič nezvratné sa nevykoná len preto, že AI to nariadil zmanipulovaný prompt.
  • Každé rozhodnutie je podpísané a uložené — kompletný záznam o tom, čo bolo povolené, čo zablokované a prečo.

Väčšina tímov zistí, že to potrebovali, až keď sa niečo pokazí: záplava spamu cez kontaktný formulár, asistent prehovorený na to, aby prezradil svoje inštrukcie, agent, ktorý odoslal tristo e-mailov, pretože volanie nástroja nemalo schvaľovaciu bránu.

Shield sa pripravuje na spustenie. Predregistrujte sa pre skorý prístup.

Učíme prečo aj ako, naživo, s naším expertným partnerom Avenue78.

Pripravení vyskúšať Corpilus?

Zostaňte v obraze

Získajte najnovšie poznatky o firemnej AI, ochrane dát a produktivite priamo do vašej schránky.