Nie znam SQL i co teraz? Zainstaluję KNIME!

Czy analityk powinien znać SQL, aby dobrze analizować dane u źródła? Nie musi. Z pewnością jest to pomocne, ale wystarczy opanować podstawową logikę tworzenia zapytań oraz zainstalować niezawodną aplikację KNIME, aby poradzić sobie bez znajomości tego języka.

INFO_23_27.jpg

Możliwość skorzystania z informacji pobranych bezpośrednio z bazy danych to dla każdego analityka nie lada gratka. Ma się wtedy pewność, że dane, które przyjmujemy do analizy, nie są w żaden sposób przetworzone, więc możemy korzystać z nich tak, jak sobie tylko wymarzymy. Jest tylko jeden drobiazg – jako analitycy niekoniecznie potrafimy samodzielnie pozyskiwać i przetwarzać dane z baz danych. Wolimy dostać jakiś plik z danymi, aby „poznęcać się” nad nimi w Excelu. Jednak w takim przypadku jesteśmy uzależnieni od innych osób, które dostarczają nam dane – od tych, które przygotowały moduły eksportujące zestawienia, od programistów. I od tego, czy zestawią nam właściwe dane w pożądany sposób.

Pamiętam, jak pewnego razu przyszedłem do programisty z prośbą o wyciągnięcie dla mnie pewnych danych z bazy. On spojrzał na mnie zmęczony, ponieważ to była moja kolejna wizyta u niego tego dnia. Po czym westchnął i powiedział, że w sumie mógłbym się nauczyć SQL. Tak też zrobiłem i już po dwóch dniach potrafiłem konstruować proste zapytania. Z czasem nabrałem w tym biegłości, ale gdybym dziś potrzebował sięgnąć bezpośrednio do bazy, użyłbym KNIME.

I tym podejściem chcę się dzisiaj podzielić. KNIME bowiem pozwala na pobranie i przetworzenie danych bezpośrednio z bazy, bez konieczności formułowania zapytań czy nawet znajomości ich składni. Oczywiście – taka wiedza nie zawadzi, ale w poniższych przykładach odnajdzie się nawet zupełny laik.

Zanim jednak rzucimy się w wir konstruowania zapytań w KNIME, szybkie przypomnienie, czym właściwie jest ta aplikacja. KNIME to darmowe narzędzie służące do przetwarzania danych, wykorzystywane zarówno w biznesie, jak i w badaniach naukowych. Jedną z jego głównych zalet jest to, że cały proces przetwarzania informacji ma postać graficzną, tak zwany workflow. Z kolei poszczególne punkty w tym schemacie to węzły, z angielskiego node. Tworzenie procesu odbywa się za pomocą klikania i przeciągania. Zainteresowanych możliwościami KNIME i szczegółami pracy w nim odsyłam do poprzednich numerów „Informacji Zarządczej”, gdzie opisałem podstawowe zagadnienia związane z tą aplikacją.

Wszystko, czego potrzebujemy do rozpoczęcia prac, to zainstalowany KNIME – można go pobrać za darmo ze strony aplikacji – oraz dane logowania do bazy danych. Jeśli w naszej bazie występuje więcej niż jedna tabela i są między nimi jakieś relacje, powinniśmy je również poznać. Jednak znajomość własnych danych to akurat podstawa pracy analityka.

Zaczynamy od wybrania węzła, który będzie łączył się bezpośrednio z naszą bazą. W bocznym oknie Node Repository wybieramy grupę Database, a w niej podgrupę Connector i to właśnie w niej będziemy szukać odpowiedniego węzła. Najprościej jest wybrać uniwersalny, nazywający się Database Connector – ale oczywiście możemy skorzystać z pewnej liczby węzłów sprofilowanych pod określone typy baz danych.

Przeciągamy wybrany węzeł do obszaru roboczego i klikamy go dwukrotnie. Na Rysunku 1 prezentuję, jak wygląda to w przypadku podłączania się do bazy MySQL za pomocą węzła Database Connector. W rozwijanym polu Database driver wybieramy rodzaj sterownika JDBC, dzięki któremu aplikacja Java może połączyć się z bazą danych. Jeśli korzystamy z węzła przeznaczonego dla określonego typu bazy danych, ten sterownik jest już domyślnie wybrany. Następnie w polu Database URL wpisujemy adres naszej bazy – jak widać, łącznie z jej portem (zamazałem szczegóły dotyczące nazwy bazy i dostawcy hostingu). Jako formę autoryzacji wpisujemy nazwę użytkownika oraz hasło – i gotowe.

Wykorzystałeś swój limit bezpłatnych treści

Pozostałe 70% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, albo wybierz plan abonamentowy.

Wybierz abonament już od 100 zł miesięcznie Pokaż abonament
Dwutygodniowy dostęp bez zobowiązań Wybieram

Abonament już od 100 zł miesięcznie

Dwutygodniowy dostęp bez zobowiązań

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

WYBIERAM

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM