/servicos · Pentest LLM e IA

Pentest de LLM e Features de IA

Auditoria de feature com LLM — prompt injection, prompt leak, jailbreak, custo aberto, drain de chave, RAG poisoning, hallucination com impacto.

90% manual · 10% automatizado
OSCP · CISSP · CRTO · GPEN
BR · PT · IT · ES · MA · US · AU
OWASP · MITRE · PTES · NIST

Por que agora

A dor real

Empresa adicionou chatbot com Claude/GPT em produção em 2 semanas. Não testou prompt injection, system prompt leak, drain de chave, abuse via PII. RAG conectado a banco interno vaza dado privilegiado. OWASP LLM Top 10 é o novo OWASP API.

Frameworks aplicáveis

OWASP LLM Top 10 2025NIST AI Risk Management FrameworkEU AI Act (alto risco)LGPD (decisão automatizada art. 20)

/superficie-de-ataque

Pentest LLM e IA

Cada engajamento é desenhado para o seu ambiente. Os pontos abaixo são parte do nosso playbook padrão neste setor — adaptamos o escopo final ao seu stack e contrato.

01

Prompt injection (LLM01)

Direct e indirect injection, system prompt override, jailbreak via roleplay/encoding.

02

Prompt leak (LLM07)

Extração do system prompt, vazamento de regra de negócio, leak de exemplo few-shot.

03

Sensitive Information Disclosure (LLM06)

Vazamento de PII, dado de outro tenant, dado de treinamento via memorização.

04

Supply chain & model poisoning (LLM03/LLM05)

Modelo pinned, fine-tune malicioso, RAG corpus contaminado.

05

Excessive agency (LLM08)

Agente com tool de write privilegiado, sem confirmação humana, ação destrutiva.

06

Custo, abuse e DoS (LLM10)

Drain de chave OpenAI/Anthropic, abuse de cota gratuita, regex DoS via prompt.

/metodologia

Pentest manual de verdade

Scanner automatizado encontra o que está documentado. Atacante real encontra o que não está. 90% do trabalho é manual — feito por especialistas com OSCP, CISSP, CRTO e GPEN.

01 · Reconhecimento

Mapa do alvo, OSINT, footprint, modelagem de ameaça específica do setor.

02 · Descoberta

Enumeração profunda, scan complementar, identificação manual de exposição.

03 · Exploração

Validação manual com PoC controlada, encadeamento de findings, escalação.

04 · Relatório

Executivo + técnico, replicação passo a passo, mapeado para regulação.

/por-que-confiar

Quem já confiou no nosso trabalho

Auditoria de features GenAI em SaaS B2B, fintech (KYC com vision LLM) e healthtech.

Caixa Econômica Federal
Banco BMG
iFood
ArcelorMittal
Multibanco
Polícia Federal
Fórmula 1
OpenFinance

Avaliação técnica reconhecida em ambientes regulados de alta criticidade — o pentest que encontra o que ninguém tinha encontrado antes.

DL

Douglas Lopes

Founder · CEO · intrus.io

/faq

FAQ — Pentest LLM e IA

Vocês cobrem agentes autônomos?

Sim. Agente com tools de write (banco, email, transação) é categoria mais perigosa. Auditamos confirmação humana, sandboxing, isolamento de tool.

Faixa de preço?

Feature LLM única (chatbot/assistant): R$ 12-30k. Plataforma com múltiplos LLMs e RAG: R$ 30-90k. Agente autônomo com tools: R$ 50-150k.

/contato

Cotar pentest LLM

Marque uma reunião confidencial. Em até 48h enviamos a proposta com escopo, prazo e valor.