Wraz z postępem w uczeniu maszynowym wybrał wielką drogę. Uważa się, że Deep Learning jest najbardziej zaawansowaną technologią stworzoną do rozwiązywania złożonych problemów, które wykorzystują ogromne zbiory danych. Ten blog o tym, czym są sieci neuronowe, zapozna Cię z podstawowymi koncepcjami sieci neuronowych oraz w jaki sposób mogą one rozwiązać złożone problemy oparte na danych.
Aby uzyskać dogłębną wiedzę na temat sztucznej inteligencji i głębokiego uczenia się, możesz zapisać się na żywo by Edureka z całodobowym wsparciem i dożywotnim dostępem.
Oto lista tematów, które zostaną w tym poruszone Blog:
- Co to jest sieć neuronowa?
- Co to jest uczenie głębokie?
- Różnica między AI, ML i DL
- Potrzeba głębokiego uczenia się
- Przykład zastosowania uczenia głębokiego
- Jak działają sieci neuronowe?
- Sieć neuronowa wyjaśniona na przykładzie
Prosta definicja sieci neuronowej
Modelowany zgodnie z ludzkim mózgiem, a Sieć neuronowa została zbudowana w celu naśladowania funkcji ludzkiego mózgu . Ludzki mózg jest siecią neuronową złożoną z wielu neuronów, podobnie sztuczna sieć neuronowa (ANN) składa się z wielu perceptronów (wyjaśnione później).
Sieć neuronowa składa się z trzech ważnych warstw:
- Warstwa wejściowa: Jak sama nazwa wskazuje, ta warstwa akceptuje wszystkie dane wejściowe dostarczone przez programistę.
- Ukryta warstwa: Pomiędzy warstwą wejściową a wyjściową znajduje się zestaw warstw zwanych warstwami ukrytymi. W tej warstwie wykonywane są obliczenia, których wynikiem jest wynik.
- Warstwa wyjściowa: Wejścia przechodzą przez serię transformacji przez warstwę ukrytą, co ostatecznie daje wynik, który jest przez nią dostarczany warstwa.
Zanim przejdziemy do szczegółów działania sieci neuronowej, przyjrzyjmy się, czym jest Deep Learning.
Co to jest uczenie głębokie?
Deep Learning to zaawansowana dziedzina uczenia maszynowego, która wykorzystuje koncepcje sieci neuronowych do rozwiązywania wysoce obliczeniowych przypadków użycia, które obejmują analizę danych wielowymiarowych. Automatyzuje proces wyodrębniania cech, zapewniając minimalną interwencję człowieka.
Czym właściwie jest Deep Learning?
Głębokie uczenie jest zaawansowane poddziedzina uczenia maszynowego wykorzystująca algorytmy inspirowane strukturą i funkcją mózgu, zwana sztucznymi sieciami neuronowymi.
Różnica między AI, ML i DL (sztuczna inteligencja a uczenie maszynowe vs uczenie głębokie)
Ludzie często tak myślą , , i Głęboka nauka są takie same, ponieważ mają wspólne zastosowania. Na przykład Siri to aplikacja AI, uczenia maszynowego i uczenia głębokiego.
Jak więc te technologie są ze sobą powiązane?
- Sztuczna inteligencja to nauka o zmuszaniu maszyn do naśladowania zachowania ludzi.
- Nauczanie maszynowe to podzbiór sztucznej inteligencji (AI), który koncentruje się na skłonieniu maszyn do podejmowania decyzji poprzez dostarczanie im danych.
- Głęboka nauka jest podzbiorem uczenia maszynowego, które wykorzystuje koncepcję sieci neuronowych do rozwiązywania złożonych problemów.
Podsumowując AI, Machine Learning i Deep Learning to połączone ze sobą dziedziny. Uczenie maszynowe i uczenie głębokie wspomaga sztuczną inteligencję, udostępniając zestaw algorytmów i sieci neuronowych do rozwiązania problemy związane z danymi.
Teraz, gdy znasz już podstawy, zastanówmy się, co spowodowało potrzebę głębokiego uczenia się.
Potrzeba głębokiego uczenia się: ograniczenia tradycyjnych algorytmów i technik uczenia maszynowego
Uczenie maszynowe było wielkim przełomem w świecie techniki, doprowadziło do automatyzacji monotonnych i czasochłonnych zadań, pomogło w rozwiązywaniu złożonych problemów i podejmowaniu mądrzejszych decyzji. Jednak uczenie maszynowe miało kilka wad, które doprowadziły do pojawienia się uczenia głębokiego.
Oto kilka ograniczeń uczenia maszynowego:
- Nie można przetworzyć danych wielowymiarowych: Uczenie maszynowe może przetwarzać tylko niewielkie wymiary danych, które zawierają niewielki zestaw zmiennych. Jeśli chcesz przeanalizować dane zawierające setki zmiennych, nie możesz użyć uczenia maszynowego.
- Inżynieria funkcji jest ręczna: Rozważ przypadek użycia, w którym masz 100 predyktorów i musisz zawęzić tylko te znaczące. Aby to zrobić, musisz ręcznie przestudiować relacje między każdą ze zmiennych i dowiedzieć się, które z nich są ważne w przewidywaniu wyniku. To zadanie jest niezwykle żmudne i czasochłonne dla programisty.
- Nie jest to idealne rozwiązanie do wykrywania obiektów i przetwarzania obrazu: Ponieważ wykrywanie obiektów wymaga danych wielowymiarowych, uczenie maszynowe nie może być używane do przetwarzania zestawów danych obrazu, jest idealne tylko dla zestawów danych z ograniczoną liczbą funkcji.
Zanim przejdziemy do głębi Sieci neuronowe, rozważmy przykład użycia w świecie rzeczywistym, w którym zaimplementowano głębokie uczenie się.
jak zainstalować ide Eclipse
Przypadek / aplikacje uczenia głębokiego
Czy wiesz, że PayPal przetwarza ponad 235 miliardów dolarów płatności z czterech miliardów transakcji przez ponad 170 milionów klientów? Wykorzystuje tę ogromną ilość danych, aby zidentyfikować możliwe nieuczciwe działania, między innymi.
Za pomocą algorytmów Deep Learning firma PayPal wydobywała dane z historii zakupów swoich klientów, a także przeglądała wzorce prawdopodobnego oszustwa przechowywane w jego bazach danych, aby przewidzieć, czy dana transakcja jest oszukańcza, czy nie.
Firma korzysta z technologii Deep Learning i Machine Learning od około 10 lat. Początkowo zespół monitorujący oszustwa korzystał z prostych, liniowych modeli. Jednak z biegiem lat firma przeszła na bardziej zaawansowaną technologię uczenia maszynowego o nazwie Deep Learning.
Ke Wang, kierownik ds. Ryzyka oszustw i Data Scientist w PayPal, zacytował:
„To, co cieszy nas z bardziej nowoczesnego, zaawansowanego uczenia maszynowego, to jego zdolność do zużywania znacznie większej ilości danych, obsługi warstw i warstw abstrakcji oraz możliwość 'zobaczenia' rzeczy, których prostsza technologia nie byłaby w stanie zobaczyć, nawet ludzie mogliby nie móc widzieć ”.
Prosty model liniowy może pochłaniać około 20 zmiennych. Jednak dzięki technologii Deep Learning można uruchomić tysiące punktów danych. Dlatego wdrażając Technologia Deep Learning, PayPal może wreszcie przeanalizować miliony transakcji, aby zidentyfikować wszelkie oszustwa czynność.
Przejdźmy teraz w głąb sieci neuronowych i zrozummy, jak one działają.
Jak działa sieć neuronowa?
Aby zrozumieć sieci neuronowe, musimy je rozbić i zrozumieć najbardziej podstawową jednostkę sieci neuronowej, czyli perceptron.
Co to jest perceptron?
Perceptron to jednowarstwowa sieć neuronowa używana do klasyfikowania danych liniowych. Posiada 4 ważne komponenty:
- Wejścia
- Wagi i odchylenie
- Funkcja sumowania
- Aktywacja lub transformacja Funkcja
Podstawowa logika Perceptronu jest następująca:
Wejścia (x) otrzymane z warstwy wejściowej są mnożone przez przypisane im wagi w. Pomnożone wartości są następnie dodawane w celu utworzenia sumy ważonej. Suma ważona wejść i ich odpowiednich wag jest następnie stosowana do odpowiedniej funkcji aktywacji. Funkcja aktywacji mapuje wejście do odpowiedniego wyjścia.
Wagi i odchylenia w uczeniu głębokim
Dlaczego musimy przypisywać wagi do każdego wejścia?
Po wprowadzeniu zmiennej wejściowej do sieci, jako wagę tego wejścia przypisywana jest losowo wybrana wartość. Waga każdego punktu danych wejściowych wskazuje, jak ważne są te dane wejściowe w przewidywaniu wyniku.
Natomiast parametr bias pozwala na takie dobranie krzywej funkcji aktywacji, aby uzyskać precyzyjne wyjście.
Funkcja sumowania
Po przypisaniu wagi wejściom, brany jest iloczyn odpowiedniego wkładu i wagi. Dodanie wszystkich tych produktów daje nam sumę ważoną. Odbywa się to za pomocą funkcji sumowania.
Funkcja aktywacji
Głównym celem funkcji aktywacji jest odwzorowanie sumy ważonej na wyjściu. Funkcje aktywacji, takie jak tanh, ReLU, sigmoid i tak dalej, są przykładami funkcji transformacji.
Aby dowiedzieć się więcej o funkcjach perceptronów, możesz przejść przez to Blog.
Zanim podsumuj tego bloga, weźmy prosty przykład, aby zrozumieć, jak działa sieć neuronowa.
Sieci neuronowe wyjaśnione na przykładzie
Rozważ scenariusz, w którym chcesz zbudować sztuczną sieć neuronową (ANN), która klasyfikuje obrazy na dwie klasy:
- Klasa A: Zawiera obrazy zdrowych liści
- Klasa B: Zawiera obrazy chorych liści
Jak więc stworzyć sieć neuronową, która klasyfikuje liście do roślin chorych i zdrowych?
jak ustawić ścieżkę dla java
Proces zawsze zaczyna się od przetworzenia i przekształcenia danych wejściowych w taki sposób, aby można je było łatwo przetworzyć. W naszym przypadku każdy obraz liścia zostanie podzielony na piksele w zależności od rozmiaru obrazu.
Na przykład, jeśli obraz składa się z 30 na 30 pikseli, całkowita liczba pikseli wyniesie 900. Te piksele są reprezentowane jako matryce, które są następnie wprowadzane do warstwy wejściowej sieci neuronowej.
Podobnie jak nasze mózgi mają neurony, które pomagają w budowaniu i łączeniu myśli, SSN ma perceptrony, które przyjmują dane wejściowe i przetwarzają je, przekazując je z warstwy wejściowej do ukrytej, a na końcu do warstwy wyjściowej.
Gdy dane wejściowe są przekazywane z warstwy wejściowej do warstwy ukrytej, każdemu wejściu przypisywana jest początkowa losowa waga. Wejścia są następnie mnożone przez odpowiadające im wagi, a ich suma jest wysyłana jako dane wejściowe do następnej ukrytej warstwy.
W tym przypadku każdemu perceptronowi przypisana jest wartość liczbowa zwana odchyleniem, która jest powiązana z wagą każdego wejścia. Ponadto każdy perceptron przechodzi przez aktywację lub funkcję transformacji, która określa, czy dany perceptron zostanie aktywowany, czy nie.
Aktywowany perceptron służy do przesyłania danych do następnej warstwy. W ten sposób dane są propagowane (propagacja do przodu) przez sieć neuronową, aż perceptrony dotrą do warstwy wyjściowej.
W warstwie wyjściowej wyprowadzane jest prawdopodobieństwo, które decyduje, czy dane należą do klasy A, czy klasy B.
Brzmi prosto, prawda? Cóż, koncepcja sieci neuronowych opiera się wyłącznie na funkcjonowaniu ludzkiego mózgu. Wymagana jest dogłębna znajomość różnych pojęć i algorytmów matematycznych. Oto lista blogów, od których możesz zacząć:
- Co to jest uczenie głębokie? Pierwsze kroki z głębokim uczeniem się
- Deep Learning with Python: Przewodnik dla początkujących po Deep Learning
Jeśli uważasz, że ten blog jest odpowiedni, sprawdź autorstwa Edureka, zaufanej firmy zajmującej się edukacją online, z siecią ponad 250 000 zadowolonych uczniów rozsianych po całym świecie. Szkolenie Edureka Deep Learning with TensorFlow Certification Training pomaga uczniom stać się ekspertami w zakresie szkolenia i optymalizacji podstawowych i konwolucyjnych sieci neuronowych z wykorzystaniem projektów i zadań w czasie rzeczywistym, wraz z takimi koncepcjami, jak funkcja SoftMax, Auto-encoder Neural Networks, Restricted Boltzmann Machine (RBM).