Wyliczanie ARPU w KNIME

Niniejszy artykuł stanowi kontynuację tematyki zapoznania czytelników z funkcjonalnościami oprogramowania KNIME. Tym razem przedstawione zostanie praktyczne wykorzystanie tej platformy analitycznej na prostym przykładzie wyliczania ARPU – KPI popularnego w zarządzaniu finansami.

KNIME – nie taki Data Mining straszny

W artykułach Karola Maruszy zawartych w poprzednich numerach czytelnicy mieli możliwość zapoznania się z platformą analityczną KNIME (Knime Analytics Platform).

Jest to coraz częściej wybierane przez analityków danych oprogramowanie do zaawansowanego przetwarzania danych, ich analizy i automatyzacji procesów. Lista funkcjonalności KNIME jest ogromna i cały czas rozwijana. KNIME jest intuicyjny w obsłudze, ma przyjazny interfejs, potrafi wykonać złożone operacje na danych, zapewnia integrację z innymi narzędziami analizy i przetwarzania danych, takimi jak R czy JAVA. Nie bez znaczenia jest również fakt, że KNIME w wersji desktopowej jest narzędziem darmowym. W efekcie wokół KNIME utworzyła się spora społeczność, która zbudowała forum z rozwiązaniami wielu bardziej złożonych zastosowań. 

https://www.knime.com/knime-community

Zalety KNIME docenił również Gartner w swoim Magic Quadrant. Poniższy wykres pokazuje wiodące na początku 2017 r. narzędzia Data Mining. KNIME i RapidMiner (również darmowe i popularne narzędzie) są w grupie liderów i wizjonerów oprogramowania bezpośrednio obok takich potęg jak SAS i IMB (chodzi tu głównie o zakupione w 2009 r. przez IBM oprogramowanie SPSS Modeler i SPSS Statistics).

KNIME z powodzeniem może zastąpić czy też wzbogacić w pracy Excela i jestem przekonany, że oferuje więcej. Tyle na temat propagowania KNIME, teraz przejdźmy do jego zastosowania w praktyce.

ARPU

W niniejszym artykule przedstawię bardzo proste zastosowanie KNIME na przykładzie wyliczenia ARPU na fikcyjnych danych. Na początek zdefiniujmy sobie ten termin. Definicję przytoczę za finansopedia.forsal.pl.

ARPU (ang. Average revenue per user lub average revenue per unit) – wskaźnik opisujący średni miesięczny przychód firmy w przeliczeniu na jednego abonenta. Jest to wskaźnik najczęściej używany do porównywania skuteczności firm w branży telekomunikacyjnej. Jest on jednak także stosowany w branżach pokrewnych, np. w sieciach telewizji kablowej. Źródło: http://finansopedia.forsal.pl/encyklopedia/finanse/hasla/911564,arpu.html

Zatem wszędzie tam, gdzie przychody z klientów oparte są na jakiejś formie abonamentu, ARPU znajdzie swoje zastosowanie. W swojej praktyce wyliczałem ARPU nie tylko miesięczne. W zależności od celów analizy i struktury danych możemy zmodyfikować powyższą definicję do skali roku lub w drugą stronę, np. dnia.

ARPU pojawiło się w mojej pracy jako silne oczekiwanie decydentów, jeśli chodzi o cykliczne raportowanie. Jest to bardzo prosty wskaźnik pokazujący przeciętną wartość klientów. Stałe monitorowanie ARPU daje możliwość sprawdzania, na ile założone plany przychodowe w połączeniu ze strukturą klientów są realizowane.

ARPU nie pokaże nam szczegółów zmian zachodzących w portfelach usług naszych klientów, nie jest segmentacją, nie wyjaśnia przyczyn zmian. Jest natomiast niewątpliwie wdzięcznym KPI do pokazywania w raportach zarządczych – szczególnie jeśli rośnie.

Czas uruchomić KNIME

Interfejs był już omawiany w poprzednich artykułach, więc pozwolę sobie od razu przejść do budowy strumienia1.

Przechodzimy zatem do Menu/File/New i w oknie dialogowym wybieramy New Knime Workflow.

W następnym kroku możemy nasz nowy workflow nazwać arpu i zapisać go w domyślnej lokalizacji2. Nasz nowy workflow zobaczymy w oknie Knime Explorer w lewym górnym rogu interfejsu. Dwukrotne kliknięcie na plik otworzy nam pustą przestrzeń głównego okna budowania strumienia.

Import danych

Nie ma analizy bez danych, więc musimy zacząć od ich zaczytania. KNIME pozwala na pracę z danymi z bardzo różnorodnych źródeł. Możemy oczywiście otwierać pliki płaskie, takie jak xlsx, csv, txt, pdf. Możemy łączyć się z relacyjnymi bazami danych
i nawet zlecać im wykonywanie operacji. Paleta źródeł danych jest jednak dużo szersza i cały czas rozwijana. Dzisiaj wykorzystamy klasykę klasyki, czyli CSV READER.

Na rysunku numer 4 – okna Knime Explorer jest okno Node Repository, gdzie zgromadzone są wszystkie tzw. węzły (nodes), których używamy do budowy strumienia.

Są one pogrupowane, czyli np. węzły dostępu do plików płaskich znajdziemy w katalogu IO. Dla potrzeb artykułu będziemy jednak korzystać z dostępnej w oknie przeglądarki. Dzięki niej, znając nazwę danego węzła lub jej część, szybko go zlokalizujemy. Wpisujemy zatem csv.

Przeglądarka znalazła wszystkie węzły mające w nazwie csv. Wybieramy CSV Reader i klikamy go dwukrotnie. W efekcie pojawi się na środku pustego workflow. Łapiąc węzeł lewym przyciskiem myszy i zatrzymując się na obramowaniu, możemy węzeł umieścić w dowolnym miejscu pustego obszaru roboczego. Słuszną koncepcją będzie tu umieszczenie węzła źródła danych blisko lewej krawędzi.

Warto tu na marginesie zwrócić uwagę na różnice w stosunku do Excela. W KNIME, jak i innych narzędziach Data Mining, co do zasady nie ingeruje się w źródło danych. Dane możemy w dowolny sposób przekształcać, ale nie wykonujemy na nich operacji znanych z Excela.

Następnie klikamy dwukrotnie na umieszczony w obszarze roboczym węzeł i wprowadzamy ustawienia importu danych
(Rysunek 5)

W oknie dialogowym należy przede wszystkim wprowadzić ścieżkę lokalizacji pliku. Nasza baza jest separowana średnikiem, więc trzeba w oknie Column Delimiter zmienić domyślny przecinek na średnik. Warto również odznaczyć check box Has Row
Header, gdyż w danych nie ma identyfikatora wierszy. Klikamy OK.

W podstawowych ikonach pod Menu znajdziemy zielony przycisk startu, który należy teraz uruchomić, aby wprowadzić dane do analizy.

W efekcie nasz węzeł wykonał się i czerwona dotąd kropka pod ikoną zmieniła się na zieloną (Rysunek 6).

Wykorzystałeś swój limit bezpłatnych treści

Pozostałe 57% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.

Kilka wariantów prenumeraty Pokaż opcje
Dwutygodniowy dostęp bez zobowiązań Wybieram

Abonament już od 100 zł miesięcznie

Dwutygodniowy dostęp bez zobowiązań

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

WYBIERAM

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.