top of page

Verwendungsszenario: Erweiterte Datenaufbereitung

Hi, ich bin Marcus und in diesem Blogartikel werfen wir einen detaillierten Blick auf das Power BI-Verwendungsszenario für erweiterte Datenaufbereitung. Im Gegensatz zur Self-Service-Datenaufbereitung steht hier die Mehrschichtigkeit im Vordergrund. Begleiten Sie mich in die Microsoft-Dokumentation und entdecken wir das entsprechende Szenario-Diagramm.



Einführung in die erweiterte Datenaufbereitung

Bei der erweiterten Datenaufbereitung geht es darum, Daten in mehreren Schichten zu transformieren und zu verarbeiten. Dies erfordert oft den Einsatz von Premium-Kapazitäten oder Fabric-Kapazitäten in Power BI, die erweiterte Funktionalitäten in Power Query Online ermöglichen.


Power BI Verwendungsszenariodiagramm Erweiterte Datenaufbereitung

Schrittweise Datenverarbeitung

1. Staging

Der Prozess beginnt mit einem Dataflow-Creator, der sich am Power BI Service anmeldet und Power Query Online verwendet. Die erste Schicht der Datenverarbeitung ist das sogenannte Staging. Hier werden die Daten aus den Quellen geladen und innerhalb des Dataflows gespeichert. Ziel ist es, die Daten von der ursprünglichen Quelle zu entkoppeln und eine gleichbleibende Datenbasis zu schaffen, die in unserem Arbeitsbereich als CSV-Dateien vorliegt.


2. Transformation

In der nächsten Schicht erfolgt die eigentliche Datentransformation. Hier kommen Premium-Entitäten wie Linked Tables und Computed Tables zum Einsatz:

  • Linked Tables: Diese Tabellen sind in einem Dataflow verfügbar, wurden aber in einem anderen Dataflow erstellt. Dadurch wird ein Doppelladen vermieden.

  • Computed Tables: Diese Tabellen werden auf Basis von bereits vorhandenen Tabellen innerhalb eines Dataflows berechnet.

Die Transformation findet innerhalb des Power BI Service statt und erfordert erhebliche Rechenleistung, die über Premium- oder Fabric-Kapazitäten bereitgestellt wird.


3. Finalisierung

In der letzten Schicht werden die transformierten Daten für die endgültige Nutzung vorbereitet. Diese finale Datenaufbereitung sorgt dafür, dass die Daten für verschiedene Ziele optimiert sind. Die Daten werden in verschiedenen Ziel-Arbeitsbereichen bereitgestellt und weiter verfeinert.


Integration mit Azure

Neben der Speicherung innerhalb des Power BI Service können die Daten auch auf Azure Data Lake Storage Gen2 abgelegt werden. Dies ermöglicht den Zugriff auf die Daten von außerhalb und deren Nutzung in weiteren Prozessen, wie beispielsweise Data Science Projekten mit Spark Notebooks.


Nutzung der Dataflows

Die fertigen Dataflows werden schließlich für Berichtskonsumenten und Modellersteller innerhalb des Power BI Desktops geladen. Hier entsteht ein Datenmodell, auf dem Berichte aufgebaut werden können. Diese erweiterte Datenverarbeitung ermöglicht einen robusten Ladeprozess, der durch die Premium-Kapazitäten unterstützt wird und keine umfangreiche IT-Infrastruktur erfordert.


Fazit

Die erweiterte Datenaufbereitung mit Power BI bietet eine mächtige und flexible Lösung für die Datenverarbeitung in mehreren Schichten. Mit den erweiterten Funktionalitäten von Power Query Online und der Unterstützung durch Premium-Kapazitäten können selbst komplexe Datenaufbereitungsprozesse effizient und benutzerfreundlich gestaltet werden.

Ich hoffe, dieser Blogartikel hat Ihnen einen guten Eindruck davon vermittelt, was mit Power BI im Rahmen der Datenaufbereitung möglich ist. Wenn Sie Fragen haben, hinterlassen Sie sie gerne in den Kommentaren. Bis zum nächsten Mal!

1 Ansicht0 Kommentare

Aktuelle Beiträge

Alle ansehen

Comentários

Avaliado com 0 de 5 estrelas.
Ainda sem avaliações

Adicione uma avaliação
bottom of page