Dataplattform för svenskt SaaS-bolag - 30+ källor till en BigQuery-sanning
Ett illustrativt case baserat på verkligt arbete: hur en spridd datalandskap med kalkylblad, manuella exporter och ostrukturerade scrapes konsoliderades till en BigQuery-baserad pipeline som driver dagliga affärsbeslut.
30+
datakällor anslutna
12 v
från start till första produktionsversion
< 1 h
uppdateringsintervall för kritiska tabeller
Utgångsläge
Fyra konkreta problem som drev fram beslutet att bygga en riktig dataplattform.
Spritt datalandskap
30+ källor - CRM-exporter, kalkylblad, externa API:er, manuella scrapes - utan gemensam mall. Ingen kunde svara på samma fråga med samma svar två gånger.
Manuella rapporter
Veckorapporterna byggdes i Excel av en person som tog 4-6 timmar varje måndag. Vid förändring i källsystem föll rapporten ofta isönder.
Beslut utan datastöd
Affärsbeslut fattades på magkänsla och en parallel-Excel - för att den centrala datan kom för sent eller motsade sig själv.
Tidigare PoC som stannat
Ett internt försök hade levererat en halvfärdig pipeline. Den fungerade dagar då allt stämde, men hade ingen övervakning och inga tester.
Genomförande
Sex tekniska beslut som tillsammans utgör plattformens grund.
Lagermodellering: raw → staging → marts
Råa data till raw_-dataset oförändrade. Staging-modeller normaliserar källors typer och namn. Mart-modeller bygger affärsentiteter som blir grunden för rapportering.
Ingestion: rätt verktyg per källa
Managed connectors för standard-SaaS-källor. Egen Cloud Run-pipeline för udda källor och kostnadsoptimering. Scheduled queries för enklare interna flöden.
dbt för transformations + tester
Allt SQL i versionshanterade dbt-modeller. Tester på primärnycklar, foreign keys, affärsregler och datafreshness. CI körs vid varje PR.
BI som folk faktiskt använder
Looker Studio för ledningsrapporter, Connected Sheets för ekonomi och sälj, direkt SQL-åtkomst för analysteam. Inget tvingande semantiskt lager där det inte behövdes.
Övervakning och larm
Freshness-tester, pipeline-fel och kostnadslarm i samma observability-stack. Stale data eller skenande nota märks innan en rapport visar fel.
Kostnadskontroll från dag ett
Partitionering, clustering, maximum_bytes_billed per query och budget alerts. On-demand-prissättning räcker långt när tabellerna är ordentligt designade.
Stack
Resultat
Vad förändrades efter tolv veckor.
Veckorapport från 6 h → 15 min
Manuell sammanställning ersatt av automatiserad dashboard som körs på data man faktiskt litar på.
Beslut i timme, inte vecka
Affärsdata uppdateras inom en timme för kritiska tabeller. Magkänsla har ersatts av siffror som finns när de behövs.
Skalbar plattform
Att lägga till källa 31 tar ungefär två dagar - inte två månader. Strukturen håller även när källantalet växer.
Fakta om uppdraget
Bransch
SaaS
Tidslinje
12 veckor
Format
Solo-leverans + intern produktägare
Kund
Anonymiserat - svensk SaaS-leverantör
Detta case är anonymiserat - siffror och tekniska val är representativa men inte exakta. Den underliggande arkitekturen och arbetsmodellen är dock direkt återanvändbar för liknande uppdrag.
Bygga eller modernisera er dataplattform?
Tjänsten Dataplattform täcker hela vägen - genomlysning, ingestion, modellering, BI och förvaltning. För djupare bakgrund i metoden, se guiden BigQuery-dataplattform från noll.
Läs om tjänsten