Analiza danych z wykorzystaniem PowerBI

03.08.2022 | Tomasz Bartuś

Wstęp

 

Możliwość sprawnego agregowania, filtrowania, grupowania oraz wizualizowania danych pozwala na wykorzystanie potencjału, który w nich jest ukryty. Zwykle celem tych działań jest poznanie samych danych oraz zależności, które są w nich niewidoczne. Dlatego organizacje oczekują od narzędzi analitycznych zastąpienia mozolnej pracy z pojedynczymi zbiorami danych, elastycznością i swobodą w analizie i wizualizacji wielu źródeł danych. Rozwiązaniem tego wyzwania może być wykorzystanie narzędzia Power BI oferującego szeroki wachlarz funkcjonalności i wizualizacji, wśród których na uwagę zasługują:

  • animacja wizualizacji danych za pomocą wykresu punktowego,
  • klasteryzacja danych,
  • wizualizacja drzewa dekompozycji.

 

Animacja wizualizacji danych za pomocą wykresu punktowego

 

Każda z wizualizacji typu „Wykres” pozwala na pokazanie danych w formie obrazu. Wśród wykresów w Power BI, które mogą być użyte do zwizualizowania wartości trzech miar, warto wykorzystać wykres punktowy (wykres bąblowy). Poza tym, że wykres punktowy statycznie pokazuje wartości, to dodatkowo posiada on specjalną oś „Play”, która pomaga opowiedzieć historię kryjącą się w danych. Na przykład w osi odtwarzania można ustawić pole daty (patrz grafika) lub kategorię produktu, kanał komunikacji. Dzięki temu wykres punktowy rozpocznie animowanie wartości miar na wykresie wyświetlając je dla poszczególnych dat (np. lat, kwartałów, miesięcy). Umożliwi to porównanie ze sobą danych w każdym punkcie czasu, a uruchomiona animacja pokaże zachodzącą zmianę wartości w czasie.

 

Rysunek 1. Wykres punktowy statyczny (dane zagregowane za cały okres) vs wykres punktowy z animacją (dane zagregowane dla konkretnej daty) w Power BI Desktop

Źródło: Opracowanie własne w PowerBI Desktop

 

Klasteryzacja danych i jej zastosowanie

 

Klasteryzacja jest jednym z algorytmów uczenia maszynowego, którego zadaniem jest wyszukanie wzorców w danych, poprzez dzielenie ich na grupy zwane klastrami. Klastry te są tworzone w taki sposób, że punkty w obrębie klastra są do siebie podobne i mogą tworzyć spójny klaster.  Jednak ich atrybuty są różne. Takie grupowanie jest przydatne do eksploracji danych, identyfikowania anomalii w danych i tworzenia przewidywań (predykcji danych). W przypadku PowerBI Desktop klasteryzacja tworzy nową kolumnę zawierającą skończoną liczbę klastrów. Obserwując kolumnę utworzoną przez klasteryzację danych, można lepiej zrozumieć, w jaki sposób rekordy w zbiorze danych są ze sobą powiązane, są do siebie podobne oraz jakie są między nimi różnice. Klasteryzacja jest powszechnie stosowana między innymi w segmentacji rynku (segmentacja sprzedaży produktów, segmentacja klientów).

Na poniższej grafice pokazano sprzedaż produktów (cena, sztuki oraz transakcji) do konkretnych klientów bez podziału na segmenty. Natomiast druga grafika prezentuje takie samo zestawienie sprzedaży do klientów, jednak dodano do wykresu klasteryzację. Pozwoliło to na podzielenie klientów na grupy (klastry) cechujące się podobnymi wartościami sprzedaży. Podział ten umożliwia prześledzenie przynależności poszczególnych klientów do klastrów i na tej podstawie dalsze analizowanie danych w ramach konkretnego klastra.

 

Rysunek 2. Wizualizacja danych bez klasteryzacji vs wizualizacja danych z przeprowadzoną klasteryzacją z wykorzystaniem wizualizacji Wykres punktowy w Power BI Desktop

Źródło: Opracowanie własne w PowerBI Desktop

 

Wizualizacja drzewa dekompozycji

 

Wizualizacja drzewa dekompozycji w Power BI umożliwia prezentację danych w wielu wymiarach bazując na filtrowaniu oraz automatycznej agregacji danych (patrz grafika). Daje to użytkownikowi raportu możliwość drążenia danych poprzez zmienianie poziomów szczegółowości danych zgodnie z potrzebami. Użytkownik raportu na jednej wizualizacji możne przeprowadzić analizę od ogółu do szczegółu, zachowując wgląd do poszczególnych poziomów wcześniej zdefiniowanych wymiarów. Określone wymiary drzewa dekompozycji można analizować w dowolnej kolejności, badając ich udział w sumie danego zjawiska. Responsywność wizualizacji, umożliwia filtrowanie pozostałych wizualizacji na raporcie, przez co użytkownik będzie miał zawsze wgląd tylko w ten obszar danych, który w danym momencie go interesuje.

 

Rysunek 3. Agregacja i wizualizacja danych za pomocą wizualizacji Drzewo dekompozycji w Power BI Desktop

Źródło: Opracowanie własne w PowerBI Desktop

 

Podsumowanie

 

Podsumowując warto podkreślić, że narzędzia Business Intelligence w tym Power BI zawierają liczne wizualizacje umożliwiające poznanie danych zgodnie z potrzebami biznesowymi organizacji. Ponieważ bodziec obrazkowy jest szybciej i łatwiej przyswajany przez odbiorcę analiz dlatego w pracy z Power BI wato sięgać po wymienione wyżej wizualizacje. Funkcjonalności te pozwalają organizacjom  lepiej poznać dane i wykorzystywać ich potencjał w prowadzonych działaniach.