Welche Daten gehören in ein Datawarehouse?
Alles?!
Die Antwort auf die Frage ist „Nein“ 😉
Daten sollten einen Zweck im DWH haben. Jede Anbindung und Verwaltung kostet Ressourcen (Zeit, Geld, Rechenleistung, Entwicklungskapazität, Betriebsaufwand, …).
Nur um „alles“ im DWH zu haben, würde den Ressourcenaufwand in die Höhe schiessen lassen (ohne einen direkten Nutzen zu generieren). Ein Abwägung was dringend und wichtig ist, sollte bei jeder Quelle/Auswertung/Usecase vorgenommen werden.
Ein paar dieser Gründe/Argumente werden nachfolgend aufgezählt. Dabei ist, je nach Kontext des Unternehmens, die Priorisierung sehr individuell zu sehen.
„Regeln“
Wie bei vielem, liefert die nachfolgende Auflistung einen Vorschlag und soll Denkanstöße liefern.
Hinweis
Zu bedenken ist auch, je mehr Daten im Warehouse sind, desto mehr muss auf die Governance geachtet werden (Security, Housekeeping, Performance, …)
In weiteren Teilen der Artikelserie wird auch auf diese Punkte und weitere eingegangen um Ideen vorzuschlagen.