Säkerhet · Definition
Vad är Prompt injection?
Attack där skadlig input manipulerar en AI-agents beteende.
Prompt injection lurar en LLM att ignorera sina instruktioner via manipulerad input - direkt eller indirekt via dokument den läser. Kräver guardrails och red-teaming.