Zpět na blog
Bezpečnost

Váš AI asistent teď umí provádět akce. Sleduje vůbec někdo, co dělá?

Corpilus Team9. června 20265 min čtení
ShieldAI agentiMCPprompt injectionOWASP

Existuje verze tohoto rozhovoru, která zní jako abstraktní modelování hrozeb. Tohle není ta verze.

Pokud má váš produkt kontaktní formulář, dostáváte spam, registrace přes jednorázové e-maily a pokusy o credential stuffing právě teď. Pokud jste nasadili AI asistenta, právě teď ho někdo zkouší na prompt injection a vytažení systémového promptu. A pokud jste mu dali nástroje přes MCP — odesílání e-mailů, zápis záznamů, dotazování databází — pak otázka, co vlastně smí dělat a kdo to kontroluje, není jen teoretická.

Tři problémy, jedna společná nit

Problém s formuláři

Boti už nevypadají jako boti. Headless prohlížeče, napodobování chování a distribuovaný credential stuffing rozložený po jednotlivých účtech projdou standardní kontrolou WAF i CAPTCHA.

Problém s AI

Dobře připravený prompt dokáže vytáhnout vaše systémové instrukce, přesměrovat chování modelu nebo odčerpat data z dřívější části kontextového okna. OWASP to uvádí jako riziko číslo jedna u LLM.

Problém s agenty

Když vaše AI dokáže volat nástroje — odeslat, zapsat, smazat, naplánovat — kompromitovaný kontext nebo podstrčená instrukce už nejen vytahuje informace. Provádí akce.

Všechny se odehrávají až po ověření. Uživatel nebo relace už byly verifikovány. Hrozba vstupuje až v samotné interakci.

Shield nepotřebujete k tomu, abyste věděli, kdo jsou vaši uživatelé. Potřebujete ho k tomu, abyste věděli, jestli to, co dělají — nebo co vaše AI dělá jejich jménem — má být právě teď vůbec povoleno.

Co se změní, když nasadíte Shield

  • Zneužívání formulářů a credential stuffing se zastaví dřív, než se dostanou k logice vaší aplikace — neuklízíte to až dodatečně.
  • Váš AI asistent má před sebou ochrannou vrstvu, kterou ovládáte vy, aniž byste museli přestavovat samotný systém.
  • Destruktivní akce agentů vyžadují schvalovací bránu. Nic nevratného se neprovede jen proto, že to AI nařídil zmanipulovaný prompt.
  • Každé rozhodnutí je podepsané a uložené — kompletní záznam o tom, co bylo povoleno, co zablokováno a proč.

Většina týmů zjistí, že to potřebovala, až když se něco pokazí: záplava spamu přes kontaktní formulář, asistent přemluvený k prozrazení svých instrukcí, agent, který rozeslal tři sta e-mailů, protože volání nástroje nemělo schvalovací bránu.

Shield se připravuje na spuštění. Předregistrujte se pro přednostní přístup.

Učíme proč i jak, naživo, s naším expertním partnerem Avenue78.

Připraveni vyzkoušet Corpilus?

Zůstaňte v obraze

Získejte nejnovější poznatky o firemní AI, ochraně dat a produktivitě přímo do vaší schránky.