Wykresy w Excelu a Data Mining

Czy jest możliwy Data Mining w Excelu (krótka definicja: pozyskiwanie wiedzy z danych, odnajdywanie odpowiedzi na interesujące nas pytania)? Oczywiście, że jest! My zajmiemy się bardzo prostym sposobem na Data Mining w Excelu – wykorzystamy wykresy Excela, które nie tylko pozwolą nam szybko przeanalizować dane, ale też od razu przedstawić wynik graficznie.

Najszybsze efekty uzyskamy dzięki wykresom wprowadzonym w Excelu 2016 (Pareto, histogram, wodospadowy, „Promyk słońca” (Sunburst) itp.).

Większość z nich da się stworzyć, również we wcześniejszych wersjach Excela, ale jest to bardziej skomplikowane. To skomplikowanie jest przynajmniej wynagradzane przez większą kontrolę nad wykresami. Sposoby na stworzenie omawianych poniżej wykresów przed Excelem 2016 znajdziesz w załączonym pliku.

Wykres Pareto

Mamy proste dane sprzedażowe (specjalnie nieposortowane) zabawek (Rysunek 1).

Zaznaczamy je, wybieramy wykres Pareto (karta Wstawianie - Wykres statystyczny - Pareto) i już mamy gotowy wynik (Rysunek 2).

Excel posortował za nas dane na wykresie (od największej sprzedaży do najmniejszej) i dodatkowo dołożył linię pokazującą procentowo sprzedaż skumulowaną (drugi punkt linii jest na wysokości około 30% – oznacza to, że samochody i roboty wygenerowały razem 30% naszej sprzedaży).

To wszystko uzyskaliśmy od razu. Nie musieliśmy wykonywać dodatkowych obliczeń – wystarczyła tylko informacja o sprzedaży poszczególnych produktów. Ale tak jak wspomniałem, szybkość efektu jest kosztem kontroli. Na tym wykresie nie uda ci się np. dołożyć etykiet danych do linii czy ustawić pionowo etykiet danych dla kolumn.

Podobne elementy możemy dołożyć/ustawić, jeśli tworzylibyśmy analogiczny wykres ręcznie, ale musielibyśmy wykonać dodatkową pracę. Po pierwsze, musielibyśmy uporządkować sprzedaż malejąco, a dodatkowo sami obliczyć procent skumulowany. Więcej pracy, ale za to większa kontrola (Rysunek 3).

Być może kiedyś Microsoft dopracuje wykresy dodane w Excelu 2016, żebyśmy mogli mieć nad nimi większą kontrolę. Na razie jeśli chcemy mieć wynik szybko i prosto, robimy to kosztem kontroli.

Wykres histogramu

Podobnym graficznie do wykresu Pareto jest wykres histogramu, czyli taki wykres, który mówi nam, ile osób jest w danym przedziale wiekowym, ile jest punktów na egzaminie czy jaka jest wysokość zarobków.

Stwórzmy sobie wykres histogramu po wieku osób zarabiających (Rysunek 4).

Jedno kliknięcie i gotowe. Excel wyznaczył za nas przedziały, policzył, ile osób znajduje się w poszczególnych przedziałach wiekowych, ale tym razem już musimy dokonać modyfikacji, bo przedziały stworzone przez Excela mają miejsca po przecinku (dodatkowo przecinek rozdziela dolną i górną wartość przedziału, co sprawia, że przedziały są jeszcze mniej czytelne).

Dlatego zaznaczamy przedziały (klikamy na nie myszką) i naciskamy Ctrl + 1. W podręcznym menu możemy przestawić automatyczne wyznaczanie przedziałów na konkretną szerokość przedziału (Rysunek 5) lub liczbę przedziałów. Po takiej zmianie wykres prezentuje się zdecydowanie lepiej (Rysunek 5).

Wykorzystałeś swój limit bezpłatnych treści

Pozostałe 71% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.

Kilka wariantów prenumeraty Pokaż opcje
Dwutygodniowy dostęp bez zobowiązań Wybieram

Abonament już od 100 zł miesięcznie

Dwutygodniowy dostęp bez zobowiązań

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

WYBIERAM

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.