SQL dla nauki o danych: kompleksowe rozwiązanie dla początkujących



Ten wpis na blogu dotyczący SQL for Data Science pomoże ci zrozumieć, jak SQL może być używany do przechowywania, uzyskiwania dostępu i pobierania danych w celu przeprowadzenia analizy danych.

Od czasu, gdy Data Science zajęła pierwsze miejsce w kategorii najbardziej obiecujących zawodów tej epoki, wszyscy staramy się dołączyć do wyścigu . Ten wpis na blogu dotyczący SQL for Data Science pomoże ci zrozumieć, jak SQL może być używany do przechowywania, uzyskiwania dostępu i pobierania danych w celu przeprowadzenia analizy danych.

Oto lista tematów, które będą omówione na tym blogu:





    1. Dlaczego język SQL jest potrzebny do nauki o danych?
    2. Co to jest SQL?
    3. Podstawy SQL
    4. Instalowanie MySQL
    5. Praktyczny

Dlaczego język SQL jest potrzebny do nauki o danych?

Czy wiesz, że każdego dnia generujemy ponad 2,5 tryliona bajtów danych? To tempo generowania danych jest przyczyną popularności zaawansowanych technologii, takich jak Data Science , , i tak dalej.

Wyprowadzanie przydatnych spostrzeżeń z danych jest określane jako nauka o danych. Nauka o danych obejmuje wyodrębnianie, przetwarzanie i analizowanie ton danych. Obecnie potrzebujemy które mogą służyć do przechowywania i zarządzania tak ogromną ilością danych.



Co to jest nauka o danych - Edureka

To jest gdzie SQL wkracza.

SQL może być używany do przechowywania, uzyskiwania dostępu i wyodrębniania ogromnych ilości danych w celu płynniejszego przeprowadzenia całego procesu Data Science.



argumenty wiersza poleceń w przykładowym kodzie Java

Co to jest SQL?

SQL co oznacza Structured Query Language, to język zapytań służący do zarządzania relacyjnymi bazami danych.

Ale czym właściwie jest relacyjna baza danych?

Relacyjna baza danych to grupa dobrze zdefiniowanych tabel, z których można uzyskać dostęp do danych, edytować je, aktualizować itd. Bez konieczności zmiany tabel bazy danych. SQL to standard (API) dla relacyjnych baz danych.

Wracając do SQL, programowanie SQL może być używane do wykonywania wielu działań na danych, takich jak zapytania, wstawianie, aktualizowanie, usuwanie rekordów bazy danych. Przykłady relacyjnych baz danych korzystających z SQL to baza danych MySQL, Oracle itp.

Aby dowiedzieć się więcej o SQL, możesz przejść przez następujące blogi:

  1. Zrozumienie typów danych SQL - wszystko, co musisz wiedzieć o typach danych SQL
  2. TWORZENIE TABELI w SQL - wszystko, co musisz wiedzieć o tworzeniu tabel w SQL

Zanim zaczniemy prezentację na temat SQL, zapoznajmy się z podstawowymi poleceniami SQL.

Podstawy SQL

SQL udostępnia zestaw prostych poleceń do modyfikowania tabel danych, przejdźmy przez niektóre z podstawowych poleceń SQL:

  • UTWÓRZ BAZĘ DANYCH - tworzy nową bazę danych
  • UTWÓRZ TABELĘ - tworzy nową tabelę
  • WŁÓŻ W - wstawia nowe dane do bazy danych
  • WYBIERZ - wyodrębnia dane z bazy danych
  • AKTUALIZACJA - aktualizuje dane w bazie danych
  • USUNĄĆ - usuwa dane z bazy danych
  • ZMIEŃ BAZĘ DANYCH - modyfikuje bazę danych
  • ALTER TABELA - modyfikuje tabelę
  • DROP TABLE - usuwa tabelę
  • UTWÓRZ INDEKS - tworzy indeks do wyszukiwania elementu
  • DROP INDEX - usuwa indeks

Aby lepiej zrozumieć SQL, zainstalujmy MySQL i zobaczmy, jak możesz bawić się danymi.

Instalowanie MySQL

Instalacja MySQL jest prostym zadaniem. Tutaj jest przewodnik krok po kroku który pomoże ci zainstalować MySQL w twoim systemie.

Po zakończeniu instalacji MySQL, postępuj zgodnie z poniższą sekcją, aby uzyskać proste demo, które pokaże, jak wstawiać, manipulować i modyfikować dane.

SQL dla nauki o danych - Demo MySQL

W tej demonstracji zobaczymy, jak tworzyć bazy danych i je przetwarzać. To jest demonstracja dla początkujących, która pomoże Ci rozpocząć analizę danych w języku SQL.

Więc zacznijmy!

Krok 1: Utwórz bazę danych SQL

Baza danych SQL to magazyn danych, w którym dane mogą być przechowywane w ustrukturyzowanym formacie. Teraz stwórzmy bazę danych przy użyciu MySQL :

UTWÓRZ BAZĘ DANYCH edureka UŻYJ edureka

W powyższym kodzie znajdują się dwie komendy SQL:

Uwaga : Polecenia SQL są definiowane dużymi literami, a średnik jest używany do zakończenia polecenia SQL.

  1. CREATE DATABASE: To polecenie tworzy bazę danych o nazwie „edureka”

  2. UŻYJ: To polecenie służy do aktywacji bazy danych. Tutaj aktywujemy bazę danych „edureka”.

Krok 2: Utwórz tabelę z wymaganymi funkcjami danych

Tworzenie tabeli jest tak proste, jak tworzenie bazy danych. Musisz tylko zdefiniować zmienne lub cechy tabeli z ich odpowiednimi typami danych. Zobaczmy, jak można to zrobić:

CREATE TABLE toys (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

W powyższym fragmencie kodu występują następujące rzeczy:

  1. Użyj polecenia „UTWÓRZ TABELĘ”, aby utworzyć tabelę o nazwie zabawki.
  2. Tabela zabawek zawiera 4 funkcje, a mianowicie TID (identyfikator transakcji), nazwę przedmiotu, cenę i ilość.
  3. Każda zmienna jest zdefiniowana za pomocą odpowiednich typów danych.
  4. Zmienna TID jest zadeklarowana jako klucz podstawowy. Klucz podstawowy zasadniczo oznacza zmienną, która może przechowywać unikalną wartość.

Możesz dodatkowo sprawdzić szczegóły zdefiniowanej tabeli za pomocą następującego polecenia:

OPISZ zabawki

Krok 3: Wstawianie danych do tabeli

Teraz, gdy utworzyliśmy tabelę, wypełnijmy ją pewnymi wartościami. Wcześniej na tym blogu wspomniałem, jak można dodać dane do tabeli za pomocą jednego polecenia, czyli WSTAWIĆ DO.

Zobaczmy, jak to się robi:

INSERT INTO toys VALUES (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO toys VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO toys VALUES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)

W powyższym fragmencie kodu po prostu wstawiliśmy 6 obserwacji do naszej tabeli „zabawki” za pomocą polecenia INSERT INTO. Dla każdej obserwacji, w nawiasach, podałem wartość każdej zmiennej lub funkcji, która została zdefiniowana podczas tworzenia tabeli.

Zmienna TID jest ustawiona na NULL, ponieważ automatycznie zwiększa się od 1.

Teraz wyświetlmy wszystkie dane obecne w naszej tabeli. Można to zrobić za pomocą poniższego polecenia:

WYBIERZ * Z zabawek


Krok 4: Zmodyfikuj wpisy danych

Powiedzmy, że zdecydowałeś się podnieść cenę G.I. Joe, ponieważ przyciąga wielu klientów. Jak zaktualizowałbyś cenę zmiennej w bazie danych?

To proste, po prostu użyj poniższego polecenia:

AKTUALIZUJ ZESTAW zabawek Cena = 350 GDZIE TID = 6

Polecenie UPDATE umożliwia modyfikowanie dowolnych wartości / zmiennych przechowywanych w tabeli. Parametr SET umożliwia wybranie określonej funkcji, a parametr WHERE służy do identyfikacji zmiennej / wartości, którą chcesz zmienić. W powyższym poleceniu zaktualizowałem cenę wpisu danych, którego TID wynosi 6 (G.I. Joe).

Zobaczmy teraz zaktualizowaną tabelę:

WYBIERZ * Z zabawek

Możesz również zmodyfikować to, co chcesz wyświetlić, odwołując się do kolumn, które chcesz wyświetlić. Na przykład poniższe polecenie wyświetli tylko nazwę zabawki i jej odpowiednią cenę:

WYBIERZ Nazwa_pozycji, Cena Z zabawek

Krok 5: Pobieranie danych

Po wstawieniu danych i zmodyfikowaniu ich nadszedł więc czas na wyodrębnienie i pobranie danych zgodnie z wymaganiami biznesowymi. W tym miejscu można pobrać dane do dalszej analizy i modelowania danych.

Zauważ, że jest to prosty przykład ułatwiający rozpoczęcie pracy z SQL, jednak w rzeczywistych scenariuszach dane są znacznie bardziej skomplikowane i mają duży rozmiar. Mimo to polecenia SQL pozostają takie same, co sprawia, że ​​SQL jest tak prosty i zrozumiały. Może przetwarzać złożone zestawy danych za pomocą zestawu prostych poleceń SQL.

Teraz pobierzmy dane z kilkoma modyfikacjami. Zapoznaj się z poniższym kodem i spróbuj zrozumieć, co robi, nie patrząc na dane wyjściowe:

WYBIERZ * Z zabawek LIMIT 2

Zgadłeś! Wyświetla pierwsze dwie obserwacje obecne w mojej tabeli.

Spróbujmy czegoś bardziej interesującego.

WYBIERZ * Z zabawek ZAMÓW WEDŁUG CENY ASC

Jak pokazano na rysunku, wartości są ułożone w kolejności rosnącej zmiennej ceny. Jeśli chcesz poszukać trzech najczęściej kupowanych przedmiotów, co byś zrobił?

To naprawdę proste!

WYBIERZ * Z zabawek KOLEJNOŚĆ WEDŁUG ILOŚCI DESC LIMIT 3

Spróbujmy jeszcze jednego.

WYBIERZ * Z zabawek GDZIE Cena> 400 ZAMÓW WEDŁUG CENY ASC


To zapytanie wyodrębnia szczegóły zabawek, których cena przekracza 400, i układa dane wyjściowe w porządku rosnącym według ceny.

W ten sposób możesz przetwarzać dane za pomocą SQL. Teraz, gdy znasz już podstawy SQL for Data Science, jestem pewien, że chcesz dowiedzieć się więcej. Oto kilka blogów, od których możesz zacząć:

  1. Co to jest nauka o danych? Przewodnik dla początkujących po nauce o danych
  2. Samouczek MySQL - przewodnik dla początkujących do nauki MySQL

Jeśli chcesz zapisać się na pełny kurs sztucznej inteligencji i uczenia maszynowego, Edureka ma specjalnie wyselekcjonowany kurs to sprawi, że będziesz biegły w technikach, takich jak uczenie się nadzorowane, uczenie się bez nadzoru i przetwarzanie języka naturalnego. Obejmuje szkolenia dotyczące najnowszych osiągnięć i podejść technicznych w dziedzinie sztucznej inteligencji i uczenia maszynowego, takich jak uczenie głębokie, modele graficzne i uczenie się ze wzmocnieniem.