Course · 5 chapters
Adversariële AI
Ship LLM features that survive attack. Defend against prompt injection, context poisoning, and jailbreaks, then run an internal red-team program. 5 chapters, advanced, for engineers.
What you'll be able to do
- Defend LLM features against prompt injection
- Harden AI agents against data poisoning
- Automate jailbreak testing with DeepTeam
- Run proven attack algorithms like PAIR
- Turn attack discovery into cheap CI gates
- Run an internal AI red-team program
What's inside
- 1Adversarial AI: Start hier
Een oriëntatie door het vierdelige Adversarial AI-skillpad — verdediger → dreigingsoppervlak → aanval → programma — van je eerste patch tegen prompt-injectie tot het draaien van een interne red-teampraktijk die de aanvallen van 2026 doorstaat.
- 2Grondbeginselen van verdediging tegen prompt injection
Waarom prompt injection bestaat, hoe aanvallers het misbruiken en de gelaagde verdediging die elke LLM-functie nodig heeft voordat je hem live zet.
- 3Contextvergiftiging en indirecte injectie
Breng het aanvalsoppervlak van het agent-tijdperk in kaart en verdedig het — RAG-vergiftiging, payloads verstopt in documenten, geheugenvergiftiging en gekaapte tool-output die verdedigingen tegen directe injectie niet bereiken.
- 4Geautomatiseerde jailbreak-tooling
Attacker-LRM's, BYO-attacker-patronen, het DeepTeam / PyRIT / Mindgard-trio, en de geautomatiseerde algoritmen (PAIR, TAP, GCG) die red-teaming transformeren van een eenpersoonsbezigheid naar een doorlopend programma.
- 5AI Red Teaming & Adversarial Evaluation
Voer een red-team-programma uit voor productie-AI — taxonomie, de finding-lifecycle, runtime-monitoring, regressiediscipline en het interne playbook.
Frequently asked questions
- What will I learn in this adversarial AI course?
- You learn to defend and attack LLM-powered systems: patching prompt injection with defense-in-depth, blocking context poisoning and indirect injection across RAG and agents, running automated jailbreak tooling, and operating an internal AI red-team program. The path spans five chapters across the defender, threat-surface, offense, and program stages.
- Who is this AI security path for?
- It is built for engineers shipping production LLM features and the security teams that test them. The level is advanced, so it assumes you already work with LLM apps, agents, or RAG pipelines.
- Do I need coding experience or prior AI security knowledge?
- Yes. This is an advanced engineering path, so you should be comfortable building LLM features and reading code. It uses offensive tools like PyRIT, DeepTeam, and Mindgard, so familiarity with running Python tooling helps.
- How long does the Adversarial AI course take and is there a certificate?
- The path runs about 100 minutes across five chapters, including a short orientation chapter. You earn a completion certificate once you finish every chapter.
- Is this course free?
- No. Adversarial AI is a paid path included with AI Academy by Anthropos. It covers prompt injection defense, context poisoning, automated jailbreak tooling, and AI red teaming.
Earn a certificate
Complete all chapters to receive your certificate of completion.