AI
AI-QA och eval-pipelines
Utan evals kan ni inte säga om er AI blivit bättre eller sämre. Vi bygger eval-pipelines som ger pålitlig signal.
AI
Utan evals kan ni inte säga om er AI blivit bättre eller sämre. Vi bygger eval-pipelines som ger pålitlig signal.
Eval-datasets curation
Promptfoo / Ragas / Langfuse
Automated regression i CI
A/B-tester mellan modellversioner
Utan evals kan ni inte säga om er AI blivit bättre eller sämre. Vi bygger eval-pipelines (Promptfoo/Ragas/Langfuse), eval-datasets, automated regression i CI och A/B mellan modellversioner.
Passar när
Passar inte när
Minimum 100 fall för meningsfull signal. 1000+ för konfidens på små regressions. Vi hjälper bygga rätt set.
AI
AI-konsult i Sverige
Senior AI-konsult med fokus på leverans - från första pilot till produktion. Leverantörsoberoende: Claude, GPT, Azure OpenAI, Vercel AI SDK.
Läs ämnetSäkerhet
AI-revision
Tredjepartsrevision av AI-system. Bias, säkerhet, performance, dokumentation och compliance.
Läs ämnetAI
RAG-implementation för svenska företag
Retrieval-Augmented Generation byggt för svenska företag - vector store, embeddings, hybrid-sök och evaluation pipeline.
Läs ämnetNästa steg
Ett kostnadsfritt 30-minuters samtal - vi går igenom situationen och vad ett nästa steg kan se ut.