Oracle na HDFS przy użyciu Sqoop



Z Oracle do HDFS przy użyciu Sqoop - zapoznaj się z instrukcjami dotyczącymi Oracle na HDFS przy użyciu Sqoop.

1. Pobierz wersję Oracle Expresss Edition z poniższego łącza i rozpakuj ją.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. Po wypakowaniu znajdziesz plik wykonywalny Oracle XE Edition, jak na poniższym obrazku.

3. Kliknij dwukrotnie OracleXEUniv, aby zainstalować bazę danych Oracle w swoim systemie i kliknij Uruchom.



4. Kliknij Dalej

5. Zaakceptuj umowę licencyjną i kliknij Dalej.

6. Domyślnie oracle przyjmie system jako nazwę bazy danych. Wprowadźmy hasło

dla tej bazy danych.

Wpisz hasło -> system

Potwierdź hasło -> system

Kliknij Następny:

7. Kliknij Instaluj

8. Kliknij Zakończ

9. Zmodyfikujmy plik sqlnet.ora obecny w folderze

C: oraclexepporacleproduct.2.0serverNETWORKADMIN

Po jej otwarciu znajdziesz poniższą zawartość.

Edytuj go tak, jak na poniższym zrzucie ekranu

10. Zacznijmy od wiersza poleceń SQL Oracle.

Przejdź do menu Start -> Wszystkie programy -> Oracle Database 10g Express Edition ->

Uruchom wiersz poleceń SQL i kliknij go dwukrotnie.

11. Otrzymasz Cli fo Oracle Database.

12. Połączmy się z bazą danych Oracle.

Nazwa użytkownika: system

Hasło: system

Otrzymasz wiadomość połączoną pomyślnie.

13. Stwórzmy prostą tabelę.

Komenda:

utwórz tabelę emp (numer identyfikacyjny)

14. Wstawmy do niego jakieś wartości za pomocą polecenia Wstaw.

Komenda:

wstaw do wartości emp (2)

15. Sprawdźmy, czy dane zostały wstawione do tabeli za pomocą polecenia Wybierz.

Komenda:

wybierz * z emp

16. Zatwierdźmy dane.

Komenda:

popełnić

17. Aby zaimportować dane z Oracle Database do Sqoop, musimy dodać rozszerzenie

Oracle Connector (ojdbc6_g.jar).

Możesz pobrać słoik z poniższego linku.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18.Otwórz Cloudera cdh3 i przenieś łącznik Oracle do Cloudera cdh3 (na pulpit) za pomocą FileZilla.

Skorzystaj z poniższego łącza, aby dowiedzieć się, jak przenieść plik z systemu Windows do cloudera cdh3 vm.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19. Gdy łącznik Oracle znajdzie się w Cloudera Cdh3 Desktop, przenieś go do folderu lib w

sqoop, wykonując poniższe polecenie:

Komenda:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

20. Zmień katalog na Sqoop, wykonując poniższe polecenie:

Komenda:

data w przykładzie sql

cd / usr / lib / sqoop /

21. Otwórz wiersz polecenia (CMD) w systemie Windows i sprawdź plik Adres IPv4

wykonując

poniższe polecenie:

Komenda:

ipconfig

22. Zaimportuj dane z tabeli emp znajdującej się w bazie danych Oracle do plików hdfs, wykonując poniższe czynności

Komenda:

Wymagane przedmioty do polecenia:

Adres IPv4 - Twój adres IPv4. W moim przypadku jest to 192.168.46.1

Nazwa bazy danych - system

Nazwa tabeli - emp

Nazwa użytkownika - system

Hasło - system

Katalog wyjściowy - może to być dowolny. Użyłem sqoopoutput1

Komenda:

sudo bin / sqoop import –connect jdbc: oracle: thin: system /

system@192.168.46.1: 1521: pojazd

–Username system -P –table system.emp –columns „ID” –target-dir /

sqoopoutput1 -m 1

23. Po pomyślnym wykonaniu polecenia otrzymasz wiadomość

że odzyskane rekordy, jak na poniższym obrazku.

24. Otwórz przeglądarkę i przejdź do poniższego adresu URL:

URL: http: // localhost: 50070 / dfshealth.jsp

Kliknij Przeglądaj system plików

25. Kliknij katalog sqoopoutput1

26. Kliknij plik part-m-00000:

27. poniżej znajdują się dane zaimportowane z bazy danych Oracle:

Gratulacje! Pomyślnie zaimportowałeś dane z Oracle Database

do HDFS przy użyciu Sqoop ..!