Analiza danych z wykorzystaniem PowerBI
03.08.2022 | Tomasz Bartuś
Wstęp
Możliwość sprawnego agregowania, filtrowania, grupowania oraz wizualizowania danych pozwala na wykorzystanie potencjału, który w nich jest ukryty. Zwykle celem tych działań jest poznanie samych danych oraz zależności, które są w nich niewidoczne. Dlatego organizacje oczekują od narzędzi analitycznych zastąpienia mozolnej pracy z pojedynczymi zbiorami danych, elastycznością i swobodą w analizie i wizualizacji wielu źródeł danych. Rozwiązaniem tego wyzwania może być wykorzystanie narzędzia Power BI oferującego szeroki wachlarz funkcjonalności i wizualizacji, wśród których na uwagę zasługują:
- animacja wizualizacji danych za pomocą wykresu punktowego,
- klasteryzacja danych,
- wizualizacja drzewa dekompozycji.
Animacja wizualizacji danych za pomocą wykresu punktowego
Każda z wizualizacji typu „Wykres” pozwala na pokazanie danych w formie obrazu. Wśród wykresów w Power BI, które mogą być użyte do zwizualizowania wartości trzech miar, warto wykorzystać wykres punktowy (wykres bąblowy). Poza tym, że wykres punktowy statycznie pokazuje wartości, to dodatkowo posiada on specjalną oś „Play”, która pomaga opowiedzieć historię kryjącą się w danych. Na przykład w osi odtwarzania można ustawić pole daty (patrz grafika) lub kategorię produktu, kanał komunikacji. Dzięki temu wykres punktowy rozpocznie animowanie wartości miar na wykresie wyświetlając je dla poszczególnych dat (np. lat, kwartałów, miesięcy). Umożliwi to porównanie ze sobą danych w każdym punkcie czasu, a uruchomiona animacja pokaże zachodzącą zmianę wartości w czasie.
Rysunek 1. Wykres punktowy statyczny (dane zagregowane za cały okres) vs wykres punktowy z animacją (dane zagregowane dla konkretnej daty) w Power BI Desktop
Źródło: Opracowanie własne w PowerBI Desktop
Klasteryzacja danych i jej zastosowanie
Klasteryzacja jest jednym z algorytmów uczenia maszynowego, którego zadaniem jest wyszukanie wzorców w danych, poprzez dzielenie ich na grupy zwane klastrami. Klastry te są tworzone w taki sposób, że punkty w obrębie klastra są do siebie podobne i mogą tworzyć spójny klaster. Jednak ich atrybuty są różne. Takie grupowanie jest przydatne do eksploracji danych, identyfikowania anomalii w danych i tworzenia przewidywań (predykcji danych). W przypadku PowerBI Desktop klasteryzacja tworzy nową kolumnę zawierającą skończoną liczbę klastrów. Obserwując kolumnę utworzoną przez klasteryzację danych, można lepiej zrozumieć, w jaki sposób rekordy w zbiorze danych są ze sobą powiązane, są do siebie podobne oraz jakie są między nimi różnice. Klasteryzacja jest powszechnie stosowana między innymi w segmentacji rynku (segmentacja sprzedaży produktów, segmentacja klientów).
Na poniższej grafice pokazano sprzedaż produktów (cena, sztuki oraz transakcji) do konkretnych klientów bez podziału na segmenty. Natomiast druga grafika prezentuje takie samo zestawienie sprzedaży do klientów, jednak dodano do wykresu klasteryzację. Pozwoliło to na podzielenie klientów na grupy (klastry) cechujące się podobnymi wartościami sprzedaży. Podział ten umożliwia prześledzenie przynależności poszczególnych klientów do klastrów i na tej podstawie dalsze analizowanie danych w ramach konkretnego klastra.
Rysunek 2. Wizualizacja danych bez klasteryzacji vs wizualizacja danych z przeprowadzoną klasteryzacją z wykorzystaniem wizualizacji Wykres punktowy w Power BI Desktop
Źródło: Opracowanie własne w PowerBI Desktop
Wizualizacja drzewa dekompozycji
Wizualizacja drzewa dekompozycji w Power BI umożliwia prezentację danych w wielu wymiarach bazując na filtrowaniu oraz automatycznej agregacji danych (patrz grafika). Daje to użytkownikowi raportu możliwość drążenia danych poprzez zmienianie poziomów szczegółowości danych zgodnie z potrzebami. Użytkownik raportu na jednej wizualizacji możne przeprowadzić analizę od ogółu do szczegółu, zachowując wgląd do poszczególnych poziomów wcześniej zdefiniowanych wymiarów. Określone wymiary drzewa dekompozycji można analizować w dowolnej kolejności, badając ich udział w sumie danego zjawiska. Responsywność wizualizacji, umożliwia filtrowanie pozostałych wizualizacji na raporcie, przez co użytkownik będzie miał zawsze wgląd tylko w ten obszar danych, który w danym momencie go interesuje.
Rysunek 3. Agregacja i wizualizacja danych za pomocą wizualizacji Drzewo dekompozycji w Power BI Desktop
Źródło: Opracowanie własne w PowerBI Desktop
Podsumowanie
Podsumowując warto podkreślić, że narzędzia Business Intelligence w tym Power BI zawierają liczne wizualizacje umożliwiające poznanie danych zgodnie z potrzebami biznesowymi organizacji. Ponieważ bodziec obrazkowy jest szybciej i łatwiej przyswajany przez odbiorcę analiz dlatego w pracy z Power BI wato sięgać po wymienione wyżej wizualizacje. Funkcjonalności te pozwalają organizacjom lepiej poznać dane i wykorzystywać ich potencjał w prowadzonych działaniach.