Rodzina kolumn
Rodzina kolumn jest podobna do tabeli w RDBMS lub systemie zarządzania relacyjnymi bazami danych i jest logicznym podziałem, który łączy podobne dane. Zasadniczo w podobnych danych zwykle przechowujesz dane dotyczące podobnych tematów.
Na przykład dane zamówienia są przechowywane w jednej rodzinie kolumn, więc możesz mieć identyfikator zamówienia jako klucz wiersza, a także różne kolumny, takie jak rodzaj produktu, który został przywieziony jako część tego zamówienia, aby były przechowywane w określonej rodzinie zamówień . Aby podać pewne przykłady, rodzina kolumn użytkownika składa się z identyfikatora użytkownika jako klucza. Dlatego można wybrać identyfikator, a kolumny mogą brzmieć „name = Kunal”. Wartości kolumn to Kunal i Bangalore. Istnieje druga rodzina kolumn nazywana rodziną kolumn Cricketer, która umożliwia przechowywanie statystyk krykieta w jednej rodzinie kolumn. Na przykład możesz mieć Sachin Tendulkar w jednej kolumnie, a liczbę stuleci w innej. Dlatego może istnieć dowolna liczba kolumn.
Jobtracker i Tasktracker w Hadoop
Rodzaje kolumn
Rodzina kolumn to nic innego jak tabela, która jest analogiczna do tabeli w świecie RDBMS. Są na to pewne typy, a mianowicie
Rodzina kolumn statycznych - Rodzina kolumn statycznych to miejsce, w którym definiowane są nazwy i typy danych. Dlatego podczas tworzenia rodziny kolumn dostępna jest opcja nazwania nazwy kolumny i typów danych. Nazywa się to statycznym, ponieważ kolumny pozostają statyczne, a liczba dostępnych kolumn będzie znana.
Dynamiczna rodzina słupów - Z drugiej strony dynamiczna rodzina kolumn nie definiuje nazw kolumn z góry, a Cassandra ma możliwość używania dowolnej aplikacji i nazw kolumn do przechowywania danych. Tak dynamiczny pomaga w pewnym sensie, ponieważ w danych nieustrukturyzowanych w większości przypadków dynamiczna rodzina kolumn pomaga w zadbaniu o nowe pola, które mogły zostać dodane później.
Jeśli masz statyczną rodzinę kolumn i chcesz dodać dynamiczną rodzinę kolumn w swoim kodzie podczas wczytywania danych, możesz ją w dowolnym momencie dodać do statycznej rodziny kolumn. Cassandra daje swobodę wyboru nazw kolumn.
Różnica w stosunku do RDBMS
Rodzina kolumn Cassandra nie zawiera schematów i jest bardzo skalowalna. Rodzina kolumn Cassandra ma dwa atrybuty - nazwę i komparator. Więc kiedy masz rodzinę kolumn Cassandra, nadanie jej nazwy staje się obowiązkowe, a komparator jest w zasadzie typem danych dla nazw kolumn. Jeśli nie określisz komparatora, przyjmie on, że jest to jakiś domyślny komparator.
Cassandra ma również kolumnę super rodzin kolumn. Wewnętrznie użyje super kolumny. Jest to logiczne grupowanie i kolejny poziom grupowania kolumn. Dlatego w rodzinie kolumn użytkowników możesz mieć dwie super kolumny, w których możemy przechowywać dane osobowe użytkowników i informacje o produktach.
Kolumny
Kolumna to najmniejszy przyrost danych w Cassandrze. Składa się z 3 elementów:
program do odwrócenia liczby w java
- Nazwa
- Wartość
- Znak czasu - Używany w rozwiązywaniu konfliktów i nie można edytować znacznika czasu. To wewnętrzny mechanizm sprawdzający, kiedy te dane lub kolumna zostały zaktualizowane.
- Wygasające kolumny - Datę wygaśnięcia można podać w kolumnie, aby wiedzieć, że kolumna wygaśnie.
- Kolumny licznikowe - Kolumny liczników to nic innego jak utrzymywanie kolumn, dzięki czemu można zwiększać i zmniejszać te kolumny liczników.
Super kolumny
Super Columns to grupowanie wszystkich kolumn łącznie w zależności od potrzeb biznesowych i logicznego grupowania. Dodaje kolejny poziom zagnieżdżenia do struktury rodziny zwykłych kolumn. Obejmują strukturę rodziny super kolumn.
Podstawowym przypadkiem super kolumn jest denormalizacja wielu wierszy z innych rodzin kolumn do jednego wiersza, co umożliwia pobieranie danych widoku zmaterializowanego.
Przypadków użycia
Ograniczenia super kolumn
Jednym z ograniczeń jest to, że wszystkie podkolumny z rodziny superkolumn muszą zostać zdeserializowane, aby odczytać pojedynczą rodzinę kolumn. Kolejnym ograniczeniem jest to, że nie możemy tworzyć indeksów pomocniczych w kolumnach podrzędnych w super kolumnie.
Kolumna Typy danych
Na powyższym obrazku są różne typy danych. Typ danych dla wartości kolumny to walidator. A komparator to typ danych dla kolumny. Nazwa i adres staną się nazwą kolumny. Możesz więc mieć datę w przypadku nazw kolumn. Możesz również mieć dane szeregów czasowych, podając datę jako nazwę kolumny.
Wydziwianie
Mogą być szerokie rzędy i kilka rzędów. Dostępne mogą być miliony kolumn i wierszy.
Wąskie wiersze mają niewielką liczbę kolumn z możliwością posiadania tylko ograniczonej liczby wierszy.
Klucz złożony
Składa się z co najmniej jednego pola klucza podstawowego. Załóżmy, że nazwa miasta jest ustawiona jako klucz wiersza, może być miasto o nazwie w dwóch różnych stanach, więc będziesz musiał wspomnieć, które miasto i który stan. Oznacza to po prostu, że należy podać klucz. Zamiast prostego klucza kolumny jednego typu, można zagregować kilka wartości zwanych także składnikami kilku typów, aby utworzyć jeden unikatowy klucz kolumny.
Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.
Powiązane posty:
pytania do wywiadu z naukowcem ds. danych w Google
Wprowadzenie do zniczów w Cassandrze