Samouczek SSIS dla początkujących: dlaczego, co i jak?



SSIS to platforma do integracji danych i aplikacji przepływu pracy. W tym samouczku dotyczącym usług SSIS opisano, dlaczego, co i jak działają usługi SQL Server Integration Services.

Usługi SQL Server Integration Services (SSIS) stanowią integralną część oprogramowania Microsoft SQL Server Database. Dzięki różnym funkcjom zarządzanie danymi jest o wiele łatwiejsze. W tym samouczku zagłębimy się w SSIS na poziomie koncepcyjnym, w następującej kolejności:

Zacznijmy.





Co to jest integracja danych?

Integracja danych to proces, w którym heterogeniczne dane są pobierane i łączone w zintegrowaną formę i strukturę. Na przykład w dzisiejszych czasach każda firma musi przetwarzać duże zbiory danych z różnych źródeł. Dane te muszą być przetwarzane, aby zapewnić wnikliwe informacje do podejmowania decyzji biznesowych. Zatem prostym rozwiązaniem byłaby integracja danych. Zasadniczo zintegruje wszystkie Twoje dane obecne w różnych bazach danych i połączy je na tej samej platformie.

Oto kilka sposobów osiągnięcia integracji danych:



Integracja danych - samouczek SSIS - Edureka

Teraz, gdy zrozumiałeś integrację danych, zobaczmy, dlaczego jest używany SSIS. SSIS oznacza Usługi integracji programu SQL Server .

Dlaczego SSIS?



  • Dane można ładować równolegle do wielu różnych miejsc docelowych
  • SSIS eliminuje potrzebę zagorzałych programistów
  • Ścisła integracja z innymi produktami firmy Microsoft
  • Usługi SSIS są tańsze niż większość innych narzędzi ETL
  • SIS zapewnia GUI do łatwego przekształcania danych
  • Włącz BI w proces transformacji danych
  • Solidna obsługa błędów i zdarzeń

Przechodząc dalej w tym samouczku dotyczącym SSIS, zobaczmy, co to dokładnie jest i jak działa.

Co to jest SSIS?

SQL Server Integration Services (SSIS) to składnik oprogramowania bazy danych Microsoft SQL Server, który może być używany do wykonywania szerokiego zakresu zadań związanych z integracją i transformacją danych.

  • Integracja danych: Łączy dane znajdujące się w różnych źródłach i zapewnia użytkownikom jednolity widok tych danych
  • Przepływ pracy: Może być również używany do automatyzacji obsługi baz danych SQL Server i aktualizacji wielowymiarowych danych analitycznych

Funkcje SSIS

Niektóre funkcje korzystania z usług SSIS to:

  • Transformacje zorganizowane i wyszukiwania
  • Ścisła integracja z innymi rodzinami Microsoft SQL
  • Zapewnia bogate środowiska Studio
  • Zapewnia wiele funkcji integracji danych dla lepszych przekształceń
  • Szybka łączność danych

Możesz obejrzeć poniższy film, który obejmuje wszystkie podstawy, w tym koncepcje hurtowni danych, które są używane do ekstrakcji, transformacji i ładowania danych (ETL). Jest idealny zarówno dla początkujących, jak i profesjonalistów, którzy chcą odświeżyć podstawy MSBI.

Przechodząc dalej w samouczku dotyczącym SSIS, zobaczmy, jak to dokładnie działa.

Jak działa SSIS?

SSIS składa się z trzech głównych komponentów, a mianowicie:

  • Dane operacyjne
  • Proces ETL
  • Hurtownia danych

Te zadania związane z transformacją danych i tworzeniem przepływu pracy są wykonywane za pomocą „Pakietu SSIS”, który zostanie omówiony w dalszej części tego bloga. Idąc dalej z samouczkiem dotyczącym SSIS, najpierw przyjrzyjmy się szczegółowo każdemu z tych składników:

Dane operacyjne

Operacyjna składnica danych (ODS) to baza danych przeznaczona do integracji danych z wielu źródeł w celu wykonania dodatkowych operacji na danych. Jest to miejsce, w którym większość danych używanych w bieżącej operacji jest przechowywana, zanim zostaną przeniesione do hurtowni danych w celu długoterminowego przechowywania lub archiwizacji.

Proces ETL

ETL to proces wyodrębniania, przekształcania i ładowania danych. Wyodrębnij, przekształć i załaduj (ETL) to proces wyodrębniania danych z różnych źródeł, przekształcania tych danych w celu spełnienia wymagań, a następnie ładowania do docelowej hurtowni danych. ETL zapewnia kompleksowe rozwiązanie dla wszystkich tych problemów.

  • Wyciąg
  • Przekształcać
  • Załaduj

Wyciąg: Ekstrakcja to proces wyodrębniania danych z różnych jednorodnych lub heterogenicznych źródeł danych w oparciu o różne punkty weryfikacji.

Transformacja: Podczas transformacji analizowane są całe dane i stosowane są na nich różne funkcje w celu załadowania danych do docelowej bazy danych w czystym i ogólnym formacie.

Załaduj: Ładowanie to proces ładowania przetworzonych danych do docelowego repozytorium danych przy użyciu minimalnych zasobów.


Magazyn danych

  • Hurtownia danych przechwytuje dane z różnych źródeł w celu ich przydatnej analizy i dostępu.
  • Magazyn danych to duży zbiór zgromadzonych danych, który służy do gromadzenia i zarządzania danymi z różnych źródeł w celu udzielenia odpowiedzi na pytania biznesowe. Dlatego pomaga w podejmowaniu decyzji.

Wymagania dotyczące usług integracji programu SQL Server

Aby pracować z SSIS, musisz zainstalować następujące elementy:

  • SQL Server
  • Narzędzia danych programu SQL Server

Przyjrzyjmy się procesowi instalacji.

Instalacja programu SQL Server

Wejdź na stronę: https://www.microsoft.com/en-au/sql-server/sql-server-downloads zainstalować SQL Server. Możesz zainstalować najnowszą lub poprzednią wersję, zgodnie z własnym wyborem.

Istnieją więc różne wersje SQL Server, a mianowicie:

    • Bezpłatna wersja próbna: Otrzymujesz 180-dniową bezpłatną wersję próbną programu SQL Server 2017 w systemie Windows.
    • Wersja deweloperska: Jest to w pełni funkcjonalna bezpłatna edycja, licencjonowana do użytku jako programistyczna i testowa baza danych w środowisku nieprodukcyjnym.
    • Edycja ekspresowa: Express to bezpłatna edycja SQL Server, idealna do programowania i produkcji dla komputerów stacjonarnych, aplikacji internetowych i małych aplikacji serwerowych.

W następnej kolejności zobaczmy, jak zainstalować narzędzia do obsługi danych.

Narzędzia danych programu SQL Server

Wejdź na stronę: https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-ver15 i zapoznaj się z różnymi wydaniami dostarczonymi przez firmę Microsoft. Zobacz poniższy zrzut ekranu z najnowszą wersją SSDT wraz z linkiem do pobrania.

W tym samouczku zainstaluję wersję 15.9.1. Więc zacznijmy.

Krok 1: Po otwarciu pliku .exe zostaniesz poproszony o ponowne uruchomienie systemu przed instalacją.

Krok 2: Po ponownym uruchomieniu systemu wszystko jest gotowe. Wystarczy kliknąć przycisk „Dalej” i postępować zgodnie z instrukcjami wyświetlanymi na ekranie.

przesyłać pliki do instancji ec2 linux

Krok 3: Wyświetli wymagane narzędzia i funkcje, takie jak baza danych SQL Server, SSAS, SSRS i SSIS. Upewnij się, że zaznaczyłeś je wszystkie i kliknij przycisk „zainstaluj”. Zobacz poniższy zrzut ekranu dla tego samego.

Następnie w samouczku SSIS omówimy pakiet SSIS i sposób jego utworzenia przy użyciu powyższych narzędzi.

Co to jest pakiet SSIS?

Pakiet jest podstawowym blokiem, w którym można kontynuować i kodować w usługach SSIS. Teraz „kod” nie odnosi się do żadnego języka programowania, jest to programowanie, które wykonujesz. Więc zasadniczo twój rozwój odbywa się wewnątrz pakietu. Jak omówiono powyżej, SSIS jest niezbędne dla ETL, a pakiet SSIS wykona proces ETL. Dlatego jest to obiekt, który implementuje funkcjonalność Integration Services do wyodrębniać, przekształcać i ładować dane . Pakiet składa się z:

  • Znajomości
  • Elementy sterujące przepływem
  • Elementy przepływu danych

To wszystko w tym samouczku dotyczącym SSIS. Mam nadzieję, że podobało Ci się to czytanie.

To prowadzi nas do końca tego bloga. Mam nadzieję, że spodobał Ci się ten blog z samouczkiem dotyczącym usługi Power BI. To był pierwszy blog z serii Power BI. Po tym samouczku dotyczącym usługi Power BI pojawi się mój następny blog, który będzie koncentrował się na pulpitach nawigacyjnych usługi Power BI. Przeczytaj to również.

Jeśli chcesz nauczyć się SSIS i zbudować karierę w wizualizacji danych lub BI, sprawdź nasze który obejmuje szkolenie na żywo prowadzone przez instruktora i rzeczywiste doświadczenie projektowe. To szkolenie pomoże ci dogłębnie zrozumieć MSBI i pomoże ci osiągnąć mistrzostwo w tym temacie.

Masz do nas pytanie? Wspomnij o tym w sekcji komentarzy „Samouczka SSIS”, a my skontaktujemy się z Tobą.