KUNDCASE · SaaS

Dataplattform för svenskt SaaS-bolag - 30+ källor till en BigQuery-sanning

Ett illustrativt case baserat på verkligt arbete: hur en spridd datalandskap med kalkylblad, manuella exporter och ostrukturerade scrapes konsoliderades till en BigQuery-baserad pipeline som driver dagliga affärsbeslut.

30+

datakällor anslutna

12 v

från start till första produktionsversion

< 1 h

uppdateringsintervall för kritiska tabeller

Utgångsläge

Fyra konkreta problem som drev fram beslutet att bygga en riktig dataplattform.

Spritt datalandskap

30+ källor - CRM-exporter, kalkylblad, externa API:er, manuella scrapes - utan gemensam mall. Ingen kunde svara på samma fråga med samma svar två gånger.

Manuella rapporter

Veckorapporterna byggdes i Excel av en person som tog 4-6 timmar varje måndag. Vid förändring i källsystem föll rapporten ofta isönder.

Beslut utan datastöd

Affärsbeslut fattades på magkänsla och en parallel-Excel - för att den centrala datan kom för sent eller motsade sig själv.

Tidigare PoC som stannat

Ett internt försök hade levererat en halvfärdig pipeline. Den fungerade dagar då allt stämde, men hade ingen övervakning och inga tester.

Genomförande

Sex tekniska beslut som tillsammans utgör plattformens grund.

Lagermodellering: raw → staging → marts

Råa data till raw_-dataset oförändrade. Staging-modeller normaliserar källors typer och namn. Mart-modeller bygger affärsentiteter som blir grunden för rapportering.

Ingestion: rätt verktyg per källa

Managed connectors för standard-SaaS-källor. Egen Cloud Run-pipeline för udda källor och kostnadsoptimering. Scheduled queries för enklare interna flöden.

dbt för transformations + tester

Allt SQL i versionshanterade dbt-modeller. Tester på primärnycklar, foreign keys, affärsregler och datafreshness. CI körs vid varje PR.

BI som folk faktiskt använder

Looker Studio för ledningsrapporter, Connected Sheets för ekonomi och sälj, direkt SQL-åtkomst för analysteam. Inget tvingande semantiskt lager där det inte behövdes.

Övervakning och larm

Freshness-tester, pipeline-fel och kostnadslarm i samma observability-stack. Stale data eller skenande nota märks innan en rapport visar fel.

Kostnadskontroll från dag ett

Partitionering, clustering, maximum_bytes_billed per query och budget alerts. On-demand-prissättning räcker långt när tabellerna är ordentligt designade.

Stack

Google Cloud PlatformBigQuerydbtCloud RunPub/SubLooker StudioConnected SheetsManaged connectorsTerraformGitHub Actions

Resultat

Vad förändrades efter tolv veckor.

Veckorapport från 6 h → 15 min

Manuell sammanställning ersatt av automatiserad dashboard som körs på data man faktiskt litar på.

Beslut i timme, inte vecka

Affärsdata uppdateras inom en timme för kritiska tabeller. Magkänsla har ersatts av siffror som finns när de behövs.

Skalbar plattform

Att lägga till källa 31 tar ungefär två dagar - inte två månader. Strukturen håller även när källantalet växer.

Fakta om uppdraget

Bransch

SaaS

Tidslinje

12 veckor

Format

Solo-leverans + intern produktägare

Kund

Anonymiserat - svensk SaaS-leverantör

Detta case är anonymiserat - siffror och tekniska val är representativa men inte exakta. Den underliggande arkitekturen och arbetsmodellen är dock direkt återanvändbar för liknande uppdrag.

Bygga eller modernisera er dataplattform?

Tjänsten Dataplattform täcker hela vägen - genomlysning, ingestion, modellering, BI och förvaltning. För djupare bakgrund i metoden, se guiden BigQuery-dataplattform från noll.

Läs om tjänsten