Hoppa till innehåll

AI · Definition

Vad är Evals?

Systematiska tester av AI-kvalitet mot definierade dataset.

Evals är till AI vad enhetstester är till kod - de mäter om modellen blivit bättre eller sämre. Utan evals är AI-utveckling gissningar. Verktyg: Ragas, Promptfoo, Langfuse.