/ Data Warehouse, ETL und Reporting
01Über mehr als ein Jahrzehnt habe ich Data-Warehouse- und ETL-Strecken in produktivem Betrieb verantwortet, von der ersten Quellenanalyse bis zum täglichen Refresh, der nicht ausfallen darf. Mit allem was dazu gehört: Datenqualitäts-Monitoring, Konsistenzprüfungen über mehrere Quellsysteme, Konsolidierungs-Logik für mehrere Mandanten. Power BI und Cognos als Endpunkte, sobald das Datenmodell sauber ist. Was ich dabei gelernt habe: achtzig Prozent der Reporting-Probleme sind keine SQL-Probleme, sondern Datenmodell-Probleme. Wer die Schicht ignoriert, baut sich für jeden neuen KPI eine neue Ausnahme.
SQL-Tuning auf MySQL, PostgreSQL und DB2 ist tägliches Werkzeug, nicht akademisches Wissen. Window-Functions statt Self-Joins, Common Table Expressions für Lesbarkeit, Execution-Plan-Analyse vor jeder Index-Entscheidung. Materialized Views und Partitionierung bei großen Aggregaten. Reproduzierbare Pipelines mit Validierungs-Schicht, sodass eine kaputte Quelle laut bricht statt still Müll zu liefern. Audit-Trail bei jedem Refresh als Standard, nicht als nachträgliche Idee.
