Scalanie rozmyte w Power Query

Scalanie w Power Query jest narzędziem, które pozwala w bardzo sprytny sposób połączyć ze sobą dwie lub więcej tabel. Scalanie działa podobnie jak funkcja WYSZUKAJ.PIONOWO() w Excelu, można też powiedzieć, że jest odpowiednikiem komendy JOIN w języku SQL. Krótko mówiąc, chodzi o to, aby jednemu rekordowi z jednej tabeli przyporządkować odpowiedni rekord z innej tabeli na podstawie pewnych wspólnych wartości.

info_28_17.jpg

Dla przykładu – w jednej tabeli możemy mieć dane dotyczące klientów (m.in.: identyfikator klienta, nazwę, siedzibę, datę podpisania umowy itd.), a w drugiej będziemy mieć dane dotyczące wystawionych faktur (zawierające m.in. identyfikator klienta, numer faktury oraz jej wartość). Na podstawie tych danych chcielibyśmy zrobić raport, który pokaże, jaka była łączna wartość sprzedaży w podziale na miejscowości lub kraje będące siedzibami klientów.

Musimy zatem przyporządkować do każdej faktury siedzibę klienta. Zamiast wykorzystywać funkcję WYSZUKAJ.PIONOWO() można do tego użyć scalania. To rozwiązanie będzie mieć ogromną zaletę – jeżeli będziemy chcieli dopasowywać rekordy po więcej niż jednej wartości, to przy scalaniu nie będzie z tym najmniejszego problemu. WYSZUKAJ.PIONOWO() już na to nam nie pozwoli (nie mówiąc o takim ograniczeniu, że szukana wartość musi być w pierwszej kolumnie od lewej w tabeli bazowej).

Sprawa jednak nieco się skomplikuje, jeżeli okaże się, że dane znajdujące się w dwóch tabelach niezupełnie do siebie pasują. Może to wynikać chociażby z popełnionych błędów literowych. Wtedy właśnie przyda się nam scalanie rozmyte.

Przykładowe dane

Trzymając się powyższego przykładu z klientami i wystawionymi fakturami, przyjmijmy, że tabela z klientami wygląda tak, jak pokazuje to Rysunek 1. Załóżmy także, że numerem identyfikacyjnym dla klienta jest jego nazwa.

Natomiast tabela z fakturami wygląda tak, jak pokazuje to Rysunek 2.

Na Rysunku 2 widać, że nazwy klientów są wielokrotnie wpisane z różnymi błędami (m.in. brakuje niektórych liter lub jest ich zbyt dużo, pojawiają się niepotrzebne spacje – przed pierwszym bądź za ostatnim słowem albo pomiędzy słowami). Te wszystkie błędy powodują, że „zwykłe” scalanie nie będzie w stanie dopasować do siebie rekordów, jeśli brać jako klucz kolumnę z nazwą klienta.

Wykorzystałeś swój limit bezpłatnych treści

Pozostałe 71% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.

Kilka wariantów prenumeraty Pokaż opcje
Dwutygodniowy dostęp bez zobowiązań Wybieram

Abonament już od 100 zł miesięcznie

Dwutygodniowy dostęp bez zobowiązań

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

WYBIERAM

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.