W świecie, który generuje i zużywa 2,5 tryliona bajtów danych dziennie, organizacje są zobowiązane do poszukiwania nowych metod przekształcania i łączenia danych w celu uzyskania optymalnej wydajności. Jedną z takich metod łączenia danych jest Mieszanie danych w Tableau .
Ponieważ służy to tak ważnemu celowi w cyklu danych dowolnej organizacji, w większości przypadków jest to bardzo istotny moduł . Na tym blogu omówimy następujące pojęcia:
- Dlaczego potrzebujesz mieszania danych w Tableau?
- Co to jest mieszanie danych w Tableau?
- Czym się różni od łączenia danych?
- Kiedy zastąpić łączenie mieszaniem?
- Łączenie danych w Tableau
- Ograniczenia mieszania danych w Tableau
Dlaczego potrzebujesz mieszania danych w Tableau?
Załóżmy, że jesteś Tabela deweloperów kto ma dane transakcyjne przechowywane w Salesforce i dane przydziałów przechowywane w programie Access. Dane, które chcesz połączyć, są przechowywane w różnych bazach danych, a stopień szczegółowości danych przechwyconych w każdej tabeli jest różny w dwóch źródłach danych, więc mieszanie danych jest najlepszym sposobem połączenia tych danych.
tablica sort c ++
Łączenie danych jest przydatne w następujących warunkach:
Chcesz połączyć dane z różnych baz danych, które nie są obsługiwane przez sprzężenia między bazami danych.
Łączenia między bazami danych nie obsługują połączeń z kostkami (na przykład Oracle Essbase) ani z niektórymi połączeniami tylko do wyodrębniania (na przykład Google Analytics). W takim przypadku skonfiguruj poszczególne źródła danych dla danych, które chcesz analizować, a następnie użyj mieszania danych, aby połączyć źródła danych w jednym arkuszu.
Dane mają różne poziomy szczegółowości.
Czasami jeden zestaw danych przechwytuje dane przy użyciu różnych poziomy szczegółowości tj. większa lub mniejsza szczegółowość niż w przypadku innego zbioru danych.
Na przykład załóżmy, że analizujesz dane transakcyjne i dane dotyczące przydziałów. Dane transakcyjne mogą obejmować wszystkie transakcje. Jednak dane kwot mogą agregować transakcje na poziomie kwartału. Ponieważ wartości transakcyjne są rejestrowane na różnych poziomach szczegółowości w każdym zestawie danych, do łączenia danych należy używać mieszania danych.
Co to jest mieszanie danych w Tableau?
Mieszanie danych to bardzo potężna funkcja w Deska . Jest używany, gdy istnieją powiązane dane w wielu źródłach danych, które chcesz analizować razem w jednym widoku. Jest to metoda łączenia danych, która uzupełnia tabelę danych z jednego źródła danych o kolumny danych z innego źródła danych.
Zwykle używa się złączeń do wykonywania tego rodzaju łączenia danych, ale czasami, w zależności od czynników, takich jak typ danych i ich szczegółowość, lepiej jest użyć mieszania danych.
Czym to się różni od łączenia danych?
Mieszanie danych symuluje tradycyjne łączenie lewe. Główna różnica między nimi to kiedy łączenie jest wykonywane w odniesieniu do agregacji.
Lewe połączenie
Kiedy używasz łączenia lewostronnego do łączenia danych, zapytanie jest wysyłane do bazy danych, w której jest wykonywane łączenie. Użycie lewego sprzężenia zwraca wszystkie wiersze z lewej tabeli i wszystkie wiersze z prawej tabeli, które mają odpowiednie dopasowanie wierszy w lewej tabeli. Wyniki łączenia są następnie wysyłane z powrotem do Tableau i agregowane przez Tableau.
Na przykład załóżmy, że masz następujące tabele. Jeśli wspólne kolumny to Identyfikator użytkownika , lewe sprzężenie pobiera wszystkie dane z lewej tabeli, jak również wszystkie dane z prawej tabeli, ponieważ każdy wiersz ma odpowiadający mu wiersz w lewej tabeli.
Mieszanie danych
Gdy używasz mieszania danych do łączenia danych, do bazy danych wysyłane jest zapytanie dla każdego źródła danych używanego w arkuszu. Wyniki zapytań, w tym zagregowane dane, są odsyłane i łączone przez Tableau. Widok wykorzystuje wszystkie wiersze z podstawowego źródła danych, lewej tabeli i zagregowane wiersze z pomocniczego źródła danych, prawej tabeli, na podstawie wymiaru pól łączących.
jak używać charata w java
Możesz zmienić pole łączące lub dodać więcej pól łączących, aby uwzględnić różne lub dodatkowe wiersze danych z dodatkowego źródła danych w mieszaniu, zmieniając zagregowane wartości.
Na przykład załóżmy, że masz następujące tabele. Jeśli pola łączące to Identyfikator użytkownika w obu tabelach mieszanie danych pobiera wszystkie dane z lewej tabeli i uzupełnia lewą tabelę danymi z prawej tabeli. W takim przypadku nie wszystkie wartości mogą być częścią tabeli wynikowej z następujących powodów:
- Wiersz w lewej tabeli nie ma odpowiedniego dopasowania wiersza w prawej tabeli, na co wskazuje wartość null.
- W wierszach prawej tabeli znajduje się wiele odpowiadających im wartości, co wskazuje gwiazdka (*).
Załóżmy, że masz te same tabele co powyżej, ale pomocnicze źródło danych zawiera nowe pole o nazwie Cele . Ponownie, jeśli pole łączące to Identyfikator użytkownika , mieszanie danych pobiera wszystkie dane z lewej tabeli i uzupełnia je danymi z prawej tabeli. W takim przypadku zobaczysz tę samą wartość null i gwiazdki w poprzednim przykładzie oprócz następujących:
- Ponieważ Cele jest miarą, zobaczysz wartości wierszy dlaCelepole zagregowane przed połączeniem danych z prawej tabeli z danymi z lewej tabeli.
- Podobnie jak w poprzednim przykładzie, wiersz w lewej tabeli nie ma odpowiedniego wiersza dla Cele pole, na co wskazuje druga wartość null.
Kiedy zastąpić łączenie Mieszanie
1. Dane wymagają wyczyszczenia.
Jeśli tabele nie pasują do siebie poprawnie po połączeniu, skonfiguruj źródła danych dla każdej tabeli, dokonaj wszelkich niezbędnych dostosowań (to znaczy zmień nazwy kolumn, zmień typy danych kolumn, utwórz grupy, użyj obliczeń itp.) następnie użyj mieszania danych, aby połączyć dane.
2. Połączenia powodują zduplikowanie danych.
Powielone dane po połączeniu to symptom danych na różnych poziomach szczegółowości. Jeśli zauważysz zduplikowane dane, zamiast tworzyć połączenie, użyj mieszania danych, aby zmieszać się ze wspólnym wymiarem.
3. Masz dużo danych.
Zwykle łączenia są zalecane do łączenia danych z tej samej bazy danych. Łączenia są obsługiwane przez bazę danych, co umożliwia łączenie w celu wykorzystania niektórych natywnych możliwości bazy danych. Jeśli jednak pracujesz z dużymi zbiorami danych, łączenia mogą obciążyć bazę danych i znacząco wpłynąć na wydajność. W takim przypadku może pomóc mieszanie danych. Ponieważ Tableau obsługuje łączenie danych po ich zagregowaniu, jest mniej danych do połączenia. Zwykle wydajność poprawia się, gdy jest mniej danych do połączenia.
Łączenie danych w Tableau
Możesz użyć mieszania danych, jeśli masz dane w oddzielnych źródłach danych, które chcesz analizować razem na jednym arkuszu. Tableau ma dwa wbudowane źródła danych o nazwach Sample-superstore i Przykładowy łańcuch do kawy.mdb który zostanie użyty do zilustrowania mieszania danych.
Krok 1: Połącz się ze swoimi danymi i skonfiguruj źródła danych
- Połącz się z zestawem danych i skonfiguruj źródło danych na stronie źródła danych. Iwbudowane źródło danych Przykładowy łańcuch do kawy.mdb ,który jest plikiem bazy danych MS Access, zostanie użyty do zilustrowania mieszania danych.
- Iść do Dane > Nowe źródło danych, połącz się z drugim zestawem danych.W tym przykładzie zastosowano Próbka - Superstore źródło danych. Tkura skonfigurowała źródło danych.
- Kliknij kartę arkusza, aby rozpocząć tworzenie widoku.
Krok 2: Wyznacz główne źródło danych
co to jest przestrzeń nazw w C ++
- Przeciągnij co najmniej jedno pole z podstawowego źródła danych do widoku, aby wyznaczyć je jako podstawowe źródło danych. w Dane kliknij źródło danych, które chcesz wyznaczyć jako podstawowe źródło danych. W tym przykładzie Przykładowy łańcuch kawowy jest zaznaczone.
- Poniższy zrzut ekranu przedstawia różne tabele i sprzężenia dostępne w pliku.
Krok 3: Wyznacz pomocnicze źródło danych
- Pola używane w widoku ze źródeł danych, które nie są głównym źródłem danych lub aktywnymi łączami, automatycznie wyznaczają kolejne źródła danych jako pomocnicze źródło danych. W tym przypadku Sample Superstore.
Krok 4: Połącz dane
- Teraz możesz zintegrować dane z obu źródeł w oparciu o wspólny wymiar ( Stan , w tym przypadku). Zwróć uwagę, że mały obraz łącza pojawia się obok wymiaru - Stan. Wskazuje to na wspólny wymiar między dwoma źródłami danych.
- Załóżmy, że tworzysz wykres słupkowy z Wskaźnik zysku w półce kolumnowej i Stan na półce rzędowej wykres pokazuje, jak zmienia się wskaźnik zysku dla każdego stanu zarówno w hipermarketach, jak i w sieciach kawiarni.
Ograniczenia mieszania danych w Tableau
- Istnieją pewne ograniczenia dotyczące mieszania danych dotyczące agregatów nieaddytywnych, takich jak MEDIANA , i RAWSQLAGG .
- Mieszanie danych ogranicza szybkość zapytań przy dużej szczegółowości.
- Podczas próby sortowania według pola obliczeniowego, które korzysta z mieszanych danych, pole obliczeniowe nie jest wyświetlane na liście rozwijanej Pole w oknie dialogowym Sortowanie.
- Źródła danych kostki mogą być używane tylko jako podstawowe źródło danych do mieszania danych w Tableau. Nie można ich używać jako pomocniczych źródeł danych.
Mam nadzieję, że teraz wszyscy macie dobry pomysł Mieszanie danych w Tableau z tego bloga. Masz ochotę na więcej wiedzy? Nie martw się, ten film pozwoli Ci lepiej zrozumieć koncepcję.