INTRODUÇÃO
À medida que empresas como a OpenAI lançam navegadores com inteligência artificial, como o ChatGPT Atlas, um tipo específico de ataque cibernético emerge como uma ameaça persistente: a injeção de prompt. Este método, que manipula agentes de IA para seguir instruções maliciosas ocultas em páginas da web ou e-mails, está levantando dúvidas sobre a segurança operacional dessas ferramentas na internet aberta.
DESENVOLVIMENTO
Em um post de blog recente, a OpenAI admitiu que a injeção de prompt, semelhante a golpes e engenharia social na web, "é improvável que seja totalmente 'resolvida'". A empresa destacou que o "modo agente" no ChatGPT Atlas "expande a superfície de ameaça de segurança", um reconhecimento que veio após pesquisadores de segurança demonstrarem vulnerabilidades logo após o lançamento do navegador em outubro. Por exemplo, foi possível alterar o comportamento do navegador com algumas palavras em um Google Docs.
O desafio não é exclusivo da OpenAI. A Brave também alertou que a injeção indireta de prompt é um problema sistemático para navegadores com IA, incluindo o Comet da Perplexity. Além disso, o Centro Nacional de Segurança Cibernética do Reino Unido advertiu este mês que esses ataques contra aplicações de IA generativa "podem nunca ser totalmente mitigados", colocando sites em risco de violações de dados. A agência governamental britânica recomendou que profissionais de cibersegurança se concentrem em reduzir o risco e o impacto, em vez de tentar "parar" os ataques completamente.
CONCLUSÃO
Diante desse cenário, a OpenAI está adotando uma abordagem proativa, com um ciclo de resposta rápida para descobrir novas estratégias de ataque internamente antes que sejam exploradas publicamente. No entanto, a empresa classifica a injeção de prompt como "um desafio de segurança de IA de longo prazo", indicando que a batalha contra essa vulnerabilidade será contínua e exigirá defesas constantemente reforçadas para proteger os usuários na era dos navegadores impulsionados por inteligência artificial.

