// service / 03

AI Safety & Red Teaming

Wir testen Ihre KI-Implementierung, bevor es Angreifer tun.

// problem

Ihre KI-Lösung ist live — aber wer hat geprüft, ob sie auch unter Druck hält? Halluzinationen in Vertragsklauseln, Prompt-Injections aus eingehenden E-Mails, Datenleckage über vermeintlich harmlose Antworten, Jailbreaks, die interne System-Prompts offenlegen. Die typischen LLM-Schwachstellen sind selten in Standard-Penetrationstests abgedeckt — und Ihre Compliance-Abteilung ahnt das.

// unsere lösung

Wir bieten technische Audits und strukturiertes Red Teaming für bestehende KI-Implementierungen an. Wir testen Ihre Guardrails, Prompt-Schutzschichten, RAG-Filter und Tool-Berechtigungen systematisch gegen die OWASP Top 10 für LLMs, anerkannte Jailbreak-Suiten und unternehmensspezifische Bedrohungsszenarien. Sie bekommen einen Bericht, der Schwachstellen priorisiert nach Ausnutzbarkeit und Geschäftsrisiko — und eine Liste konkreter Fixes.

// tech-stack

Test-FrameworksGarak, PyRIT, Promptfoo, Inspect AI, eigene szenariobasierte Test-Suiten.
Threat-ModelOWASP LLM Top 10, MITRE ATLAS, branchenspezifische Bedrohungsszenarien.
Prompt-HardeningSystem-Prompt-Verstärkung, Konstitutionelle Prompts, Output-Validatoren, Pre/Post-Filter.
Datenleckage-TestsPII-Extraktion, Modell-Inversions-Angriffe, Membership-Inference.
ReportingSchwachstellen-Register, CVSS-ähnliches Scoring, Remediation-Roadmap, Re-Test-Zyklus.

// zielgruppe

Unternehmen mit produktiven KI-Anwendungen (Kundenchatbots, interne Copiloten, Document-Processing-Pipelines), Banken und Versicherungen mit BaFin/MaRisk-Anforderungen, Krankenhäuser und Pharma mit FDA/EMA-relevanten KI-Komponenten, Behörden mit BSI-Anforderungen.

// use-cases

Penetrationstest eines Kundenchatbots inklusive Prompt-Injection über CRM-Tickets.
Audit eines internen RAG-Systems auf Datenleckage zwischen Mandanten.
Compliance-Bericht für eine KI-gestützte Kreditprüfung gemäß EU AI Act.
Quartalsweises Re-Testing nach Modell- oder Prompt-Updates.

// outcome

Einen technischen Audit-Bericht, ein Schwachstellen-Register mit priorisierten Fixes, gehärtete Guardrails und Prompts — und eine Test-Suite, die Ihr Team für Regressions-Tests bei künftigen Änderungen nutzen kann.

Klingt nach Ihrem Vorhaben?

Schreiben Sie uns zwei, drei Sätze. Wir antworten mit einem konkreten Vorschlag für ein Erstgespräch.

→ Erstgespräch vereinbaren