AI · Definition
Vad är Evals?
Systematiska tester av AI-kvalitet mot definierade dataset.
Evals är till AI vad enhetstester är till kod - de mäter om modellen blivit bättre eller sämre. Utan evals är AI-utveckling gissningar. Verktyg: Ragas, Promptfoo, Langfuse.