Váš AI asistent už dokáže vykonávať akcie. Sleduje vôbec niekto, čo robí?

Existuje verzia tohto rozhovoru, ktorá znie ako abstraktné modelovanie hrozieb. Toto nie je tá verzia.

Ak má váš produkt kontaktný formulár, práve teraz dostávate spam, registrácie cez jednorazové e-maily a pokusy o credential stuffing. Ak ste nasadili AI asistenta, práve teraz ho niekto skúša na prompt injection a vyťahovanie systémového promptu. A ak ste mu dali nástroje cez MCP — odosielanie e-mailov, zápis záznamov, dotazovanie databáz — otázka, čo všetko smie robiť a kto to kontroluje, nie je teoretická.

Tri problémy, jedna spoločná niť

Problém s formulárom

Boty už nevyzerajú ako boty. Headless prehliadače, napodobňovanie ľudského správania a distribuovaný credential stuffing rozložený na jednotlivé účty prejdú štandardnou kontrolou WAF aj cez CAPTCHA.

Problém s AI

Dobre zostavený prompt dokáže vytiahnuť vaše systémové inštrukcie, presmerovať správanie modelu alebo nechať uniknúť dáta z predchádzajúcej časti kontextového okna. OWASP toto uvádza ako riziko číslo jeden pre LLM.

Problém s agentom

Keď vaša AI dokáže volať nástroje — odoslať, zapísať, zmazať, naplánovať — kompromitovaný kontext alebo podstrčená inštrukcia už nielen vyťahuje informácie. Vykonáva akcie.

Všetky sa dejú až po overení. Používateľ alebo relácia už boli overené. Hrozba vstupuje v samotnej interakcii.

Shield nepotrebujete na to, aby ste vedeli, kto sú vaši používatelia. Potrebujete ho na to, aby ste vedeli, či to, čo robia — alebo čo robí vaša AI v ich mene — má byť práve teraz vôbec povolené.

Čo sa zmení, keď je Shield na mieste

Zneužitie formulárov a credential stuffing sú zastavené skôr, než sa dostanú k vašej aplikačnej logike — nie upratané dodatočne.
Váš AI asistent má pred sebou ochrannú vrstvu, ktorú máte pod kontrolou, bez prestavby základného systému.
Deštruktívne akcie agenta vyžadujú schvaľovaciu bránu. Nič nezvratné sa nevykoná len preto, že AI to nariadil zmanipulovaný prompt.
Každé rozhodnutie je podpísané a uložené — kompletný záznam o tom, čo bolo povolené, čo zablokované a prečo.

Väčšina tímov zistí, že to potrebovali, až keď sa niečo pokazí: záplava spamu cez kontaktný formulár, asistent prehovorený na to, aby prezradil svoje inštrukcie, agent, ktorý odoslal tristo e-mailov, pretože volanie nástroja nemalo schvaľovaciu bránu.

Shield sa pripravuje na spustenie. Predregistrujte sa pre skorý prístup.

Učíme prečo aj ako, naživo, s naším expertným partnerom Avenue78.

Tri problémy, jedna spoločná niť

Problém s formulárom

Problém s AI

Problém s agentom

Čo sa zmení, keď je Shield na mieste

Súvisiace články

Práve teraz niekto z vášho tímu vkladá niečo do ChatGPT

Shield sme postavili preto, lebo autentifikácia nikdy nebola tým ťažkým problémom

Kill Switch: prečo vaša AI potrebuje núdzové tlačidlo

Zostaňte v obraze