WPROWADZENIE DO RODZINY KOLUMN Z CASSANDRĄ I EDUREKA.CO

Rodzina kolumn

Rodzina kolumn jest podobna do tabeli w RDBMS lub systemie zarządzania relacyjnymi bazami danych i jest logicznym podziałem, który łączy podobne dane. Zasadniczo w podobnych danych zwykle przechowujesz dane dotyczące podobnych tematów.

Na przykład dane zamówienia są przechowywane w jednej rodzinie kolumn, więc możesz mieć identyfikator zamówienia jako klucz wiersza, a także różne kolumny, takie jak rodzaj produktu, który został przywieziony jako część tego zamówienia, aby były przechowywane w określonej rodzinie zamówień . Aby podać pewne przykłady, rodzina kolumn użytkownika składa się z identyfikatora użytkownika jako klucza. Dlatego można wybrać identyfikator, a kolumny mogą brzmieć „name = Kunal”. Wartości kolumn to Kunal i Bangalore. Istnieje druga rodzina kolumn nazywana rodziną kolumn Cricketer, która umożliwia przechowywanie statystyk krykieta w jednej rodzinie kolumn. Na przykład możesz mieć Sachin Tendulkar w jednej kolumnie, a liczbę stuleci w innej. Dlatego może istnieć dowolna liczba kolumn.

Jobtracker i Tasktracker w Hadoop

Rodzaje kolumn

Rodzina kolumn to nic innego jak tabela, która jest analogiczna do tabeli w świecie RDBMS. Są na to pewne typy, a mianowicie

Rodzina kolumn statycznych - Rodzina kolumn statycznych to miejsce, w którym definiowane są nazwy i typy danych. Dlatego podczas tworzenia rodziny kolumn dostępna jest opcja nazwania nazwy kolumny i typów danych. Nazywa się to statycznym, ponieważ kolumny pozostają statyczne, a liczba dostępnych kolumn będzie znana.

Dynamiczna rodzina słupów - Z drugiej strony dynamiczna rodzina kolumn nie definiuje nazw kolumn z góry, a Cassandra ma możliwość używania dowolnej aplikacji i nazw kolumn do przechowywania danych. Tak dynamiczny pomaga w pewnym sensie, ponieważ w danych nieustrukturyzowanych w większości przypadków dynamiczna rodzina kolumn pomaga w zadbaniu o nowe pola, które mogły zostać dodane później.

Jeśli masz statyczną rodzinę kolumn i chcesz dodać dynamiczną rodzinę kolumn w swoim kodzie podczas wczytywania danych, możesz ją w dowolnym momencie dodać do statycznej rodziny kolumn. Cassandra daje swobodę wyboru nazw kolumn.

Różnica w stosunku do RDBMS

Rodzina kolumn Cassandra nie zawiera schematów i jest bardzo skalowalna. Rodzina kolumn Cassandra ma dwa atrybuty - nazwę i komparator. Więc kiedy masz rodzinę kolumn Cassandra, nadanie jej nazwy staje się obowiązkowe, a komparator jest w zasadzie typem danych dla nazw kolumn. Jeśli nie określisz komparatora, przyjmie on, że jest to jakiś domyślny komparator.

Cassandra ma również kolumnę super rodzin kolumn. Wewnętrznie użyje super kolumny. Jest to logiczne grupowanie i kolejny poziom grupowania kolumn. Dlatego w rodzinie kolumn użytkowników możesz mieć dwie super kolumny, w których możemy przechowywać dane osobowe użytkowników i informacje o produktach.

Kolumny

Kolumna to najmniejszy przyrost danych w Cassandrze. Składa się z 3 elementów:

program do odwrócenia liczby w java

Nazwa
Wartość
Znak czasu - Używany w rozwiązywaniu konfliktów i nie można edytować znacznika czasu. To wewnętrzny mechanizm sprawdzający, kiedy te dane lub kolumna zostały zaktualizowane.
Wygasające kolumny - Datę wygaśnięcia można podać w kolumnie, aby wiedzieć, że kolumna wygaśnie.
Kolumny licznikowe - Kolumny liczników to nic innego jak utrzymywanie kolumn, dzięki czemu można zwiększać i zmniejszać te kolumny liczników.

Super kolumny

Super Columns to grupowanie wszystkich kolumn łącznie w zależności od potrzeb biznesowych i logicznego grupowania. Dodaje kolejny poziom zagnieżdżenia do struktury rodziny zwykłych kolumn. Obejmują strukturę rodziny super kolumn.

Podstawowym przypadkiem super kolumn jest denormalizacja wielu wierszy z innych rodzin kolumn do jednego wiersza, co umożliwia pobieranie danych widoku zmaterializowanego.

Przypadków użycia

Ograniczenia super kolumn

Jednym z ograniczeń jest to, że wszystkie podkolumny z rodziny superkolumn muszą zostać zdeserializowane, aby odczytać pojedynczą rodzinę kolumn. Kolejnym ograniczeniem jest to, że nie możemy tworzyć indeksów pomocniczych w kolumnach podrzędnych w super kolumnie.

Kolumna Typy danych

Typy danych kolumn

Na powyższym obrazku są różne typy danych. Typ danych dla wartości kolumny to walidator. A komparator to typ danych dla kolumny. Nazwa i adres staną się nazwą kolumny. Możesz więc mieć datę w przypadku nazw kolumn. Możesz również mieć dane szeregów czasowych, podając datę jako nazwę kolumny.

Wydziwianie

Mogą być szerokie rzędy i kilka rzędów. Dostępne mogą być miliony kolumn i wierszy.

Wąskie wiersze mają niewielką liczbę kolumn z możliwością posiadania tylko ograniczonej liczby wierszy.

Klucz złożony

Składa się z co najmniej jednego pola klucza podstawowego. Załóżmy, że nazwa miasta jest ustawiona jako klucz wiersza, może być miasto o nazwie w dwóch różnych stanach, więc będziesz musiał wspomnieć, które miasto i który stan. Oznacza to po prostu, że należy podać klucz. Zamiast prostego klucza kolumny jednego typu, można zagregować kilka wartości zwanych także składnikami kilku typów, aby utworzyć jeden unikatowy klucz kolumny.

Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.

Powiązane posty:

pytania do wywiadu z naukowcem ds. danych w Google

Wprowadzenie do zniczów w Cassandrze

Wprowadzenie do rodziny kolumn z Cassandrą

Ten blog podkreśla znaczenie rodziny kolumn z Cassandrą

Rodzina kolumn

Rodzaje kolumn

Różnica w stosunku do RDBMS

Kolumny

Super kolumny

Przypadków użycia

Ograniczenia super kolumn

Kolumna Typy danych

Wydziwianie

Klucz złożony

Kategorie

Popular Articles

Pliki cookie JavaScript - jak tworzyć, odczytywać i usuwać pliki cookie?

Jak zaimplementować sortowanie bąbelkowe w języku C z kodem

Co to jest klonowanie w Javie i jego typach?

Jak szczegółowo wdrożyć kompozycję Java?

Jak zaimplementować wskaźniki w C ++?

Polecenia HDFS: Polecenia powłoki Hadoop do zarządzania HDFS

Wprowadzenie do Spark z Pythonem - PySpark dla początkujących

Wszystko, co musisz wiedzieć, aby zaimplementować animacje w CSS

Omówienie architektury pamięci masowej HBase

Jak najlepiej wykorzystać znacznik DIV HTML?

Samouczek dotyczący Scrapy: Jak stworzyć robota internetowego za pomocą Scrapy?

Co to jest zmienna JavaScript i jak ją zadeklarować?