To datawarehouse or not to datawarehouse?

Bij de implementatie van BI-tools en Power BI-dashboards komt vaak de vraag ter sprake of een datawarehouse nodig is.

In deze REDtalk geven we uitleg over wat een datawarehouse is en welke keuzes REDview BI maakt voor de eigen REDboards en overige BI-oplossingen.

 
Meer weten over de ontwikkeling naar een datagedreven organisatie?

Plan nu een afspraak in

Wat is een datawarehouse?

Een datawarehouse is een integrale database waar je relevante, gestructureerde data uit verschillende bronnen op onderwerp gerangschikt kan terugvinden, combineren en analyseren.

In de meeste smalle definitie is een datawarehouse een kopie van de transactionele data, waardoor de operationele systemen wordt ontlast. In een BI-tool als Power BI volgen de vervolgstappen: het transformeren van de data (het ETL-proces), het stermodel , de metingen en de visuals.

DIt kunnen we dit als volgt schematisch weergeven.

Een datawarehouse in de meest smalle definitie.

Voordelen van een datawarehouse

Een datawarehouse kan de volgende voordelen bieden (bron: De intelligente datagedreven organisatie – Daan van Beek):

  • Verbeteren van de integratie van data
  • Creëren van een versie van de waarheid
  • Verlagen van de responsetijd
  • Flexibeler en sneller rapporteren
  • Opbouwen van historie
  • Verhogen van de datakwaliteit
  • Ontlasten van operationele systemen
  • Verhogen van de herkenbaarheid
  • Verbeteren van de vindbaarheid

Voor 2 van deze punten is een datawarehouse een must: het verbeteren van de integratie van data (uit meerdere bronnen) en het opbouwen van historie. In dat geval zullen het ETL-proces, stermodel en metingen ingericht worden in het datawarehouse. Hiermee kan bijvoorbeeld één definitie van ‘klant’ worden gegeven, ook als deze uit verschillende systemen komt. 

Dit kunnen we als volgt weergeven:

Een datawarehouse volgens de brede definitie.

REDview BI en datawarehouses

Welke keuzes maakt REDview BI als het gaat om datawarehouses?

REDview BI kijkt per project naar de wensen van de klant, op korte en lange termijn, om te zien of een datawarehouse nodig is. We zetten de volgende opties in:

  1. Geen datawarehouse bij een enkele databron.
  2. Smal datawarehouse, met hierin het ETL-proces voor snelheid en eenduidigheid.
  3. Gefaseerde opbouw van een datawarehouse, met cloudoplossingen zoals Azure Data Factory.

Bij iedere keuze houden we rekening met de schaalbaarheid van de oplossing. Er zijn voldoende technische mogelijkheden om een klein datawarehouse stap voor stap uit te breiden.

Meer weten over de ontwikkeling naar een datagedreven organisatie?