/servicos · Pentest LLM e IA

Pentest de LLM e Features de IA

Auditoria de feature com LLM — prompt injection, prompt leak, jailbreak, custo aberto, drain de chave, RAG poisoning, hallucination com impacto.

Cotar pentest LLM Ver vetores

90% manual · 10% automatizado

OSCP · CISSP · CRTO · GPEN

BR · PT · IT · ES · MA · US · AU

OWASP · MITRE · PTES · NIST

Por que agora

A dor real

Empresa adicionou chatbot com Claude/GPT em produção em 2 semanas. Não testou prompt injection, system prompt leak, drain de chave, abuse via PII. RAG conectado a banco interno vaza dado privilegiado. OWASP LLM Top 10 é o novo OWASP API.

Frameworks aplicáveis

OWASP LLM Top 10 2025NIST AI Risk Management FrameworkEU AI Act (alto risco)LGPD (decisão automatizada art. 20)

/superficie-de-ataque

Pentest LLM e IA

Cada engajamento é desenhado para o seu ambiente. Os pontos abaixo são parte do nosso playbook padrão neste setor — adaptamos o escopo final ao seu stack e contrato.

Prompt injection (LLM01)

Direct e indirect injection, system prompt override, jailbreak via roleplay/encoding.

Prompt leak (LLM07)

Extração do system prompt, vazamento de regra de negócio, leak de exemplo few-shot.

Sensitive Information Disclosure (LLM06)

Vazamento de PII, dado de outro tenant, dado de treinamento via memorização.

Supply chain & model poisoning (LLM03/LLM05)

Modelo pinned, fine-tune malicioso, RAG corpus contaminado.

Excessive agency (LLM08)

Agente com tool de write privilegiado, sem confirmação humana, ação destrutiva.

Custo, abuse e DoS (LLM10)

Drain de chave OpenAI/Anthropic, abuse de cota gratuita, regex DoS via prompt.

/metodologia

Pentest manual de verdade

Scanner automatizado encontra o que está documentado. Atacante real encontra o que não está. 90% do trabalho é manual — feito por especialistas com OSCP, CISSP, CRTO e GPEN.

01 · Reconhecimento

Mapa do alvo, OSINT, footprint, modelagem de ameaça específica do setor.

02 · Descoberta

Enumeração profunda, scan complementar, identificação manual de exposição.

03 · Exploração

Validação manual com PoC controlada, encadeamento de findings, escalação.

04 · Relatório

Executivo + técnico, replicação passo a passo, mapeado para regulação.

/por-que-confiar

Quem já confiou no nosso trabalho

Auditoria de features GenAI em SaaS B2B, fintech (KYC com vision LLM) e healthtech.

Caixa Econômica Federal

Banco BMG

iFood

ArcelorMittal

Multibanco

Polícia Federal

Fórmula 1

OpenFinance

Avaliação técnica reconhecida em ambientes regulados de alta criticidade — o pentest que encontra o que ninguém tinha encontrado antes.

Douglas Lopes

Founder · CEO · intrus.io

/faq

FAQ — Pentest LLM e IA

Vocês cobrem agentes autônomos?

Sim. Agente com tools de write (banco, email, transação) é categoria mais perigosa. Auditamos confirmação humana, sandboxing, isolamento de tool.

Faixa de preço?

Feature LLM única (chatbot/assistant): R$ 12-30k. Plataforma com múltiplos LLMs e RAG: R$ 30-90k. Agente autônomo com tools: R$ 50-150k.

/contato

Cotar pentest LLM

Marque uma reunião confidencial. Em até 48h enviamos a proposta com escopo, prazo e valor.

Falar agora Ver outros setores

Outros setores que atendemos

/pentest-mobile

Pentest Mobile

/pentest-api

Pentest de API

/red-team

Red Team

/pentest-cloud-aws

Pentest AWS

/pentest-cloud-gcp

Pentest Google Cloud

/pentest-cloud-azure