Jakie są wymagania wstępne dotyczące uczenia maszynowego?



Ten blog na temat wymagań wstępnych uczenia maszynowego pomoże Ci zrozumieć podstawowe pojęcia, które musisz znać, zanim zaczniesz korzystać z uczenia maszynowego.

Uczenie maszynowe to niewątpliwie najbardziej pożądana technologia tamtych czasów! Jeśli jesteś początkującym i zaczynasz korzystać z uczenia maszynowego, ważne jest, aby znać wymagania wstępne uczenia maszynowego. Ten blog pomoże Ci zrozumieć różne koncepcje, które musisz znać, zanim zaczniesz korzystać z uczenia maszynowego.

Aby uzyskać dogłębną wiedzę na temat sztucznej inteligencji i uczenia maszynowego, możesz zarejestrować się na żywo by Edureka z całodobowym wsparciem i dożywotnim dostępem.





Oto lista tematów omówione na tym blogu:

  1. Wymagania wstępne dotyczące uczenia maszynowego
  2. Zrozumienie uczenia maszynowego za pomocą przypadku użycia

Wymagania wstępne dotyczące uczenia maszynowego

Na początekUczenie maszynowe musisz znać następujące pojęcia:



  1. Statystyka
  2. Algebra liniowa
  3. Rachunek różniczkowy
  4. Prawdopodobieństwo
  5. Języki programowania

Statystyka

Statystyki zawierają narzędzia, których można użyć do uzyskania pewnych wyników na podstawie danych. Istnieją statystyki opisowe, które służą do przekształcania surowych danych w niektóre ważne informacje. Ponadto do uzyskania ważnych informacji z próbki danych można użyć statystyk inferencyjnych, zamiast korzystać z pełnego zestawu danych.

Nauczyć się więcej o Statystyki można przeglądać w następujących blogach:

Algebra liniowa

Oferty algebry liniowejz wektorami, macierzami i przekształceniami liniowymi. Jest to bardzo ważne w uczeniu maszynowym, ponieważ można go używać do przekształcania i wykonywania operacji na zbiorze danych.



Rachunek różniczkowy

Analiza matematyczna jest ważną dziedziną matematyki i odgrywa integralną rolę w wielu algorytmach uczenia maszynowego. Zestaw danych posiadający wiele funkcji toużywane do budowania modeli uczenia maszynowego, ponieważ funkcje są wielowymiarowymi rachunek różniczkowy odgrywa ważną rolę w tworzeniu modelu uczenia maszynowego. Integracje i zróżnicowania są koniecznością.

Prawdopodobieństwo

Prawdopodobieństwo pomaga przewidzieć prawdopodobieństwo wystąpienia zdarzeń, pomaga nam zrozumieć, że sytuacja może się powtórzyć lub nie. W przypadku uczenia maszynowego prawdopodobieństwo to Fundacja.

Mathematics

Aby dowiedzieć się więcej o prawdopodobieństwie, możesz przejść przez to Blog.

Język programowania

Aby zaimplementować cały proces uczenia maszynowego, niezbędna jest znajomość języków programowania, takich jak R i Python. Python i R zapewniają wbudowane biblioteki, które bardzo ułatwiają wdrażanie algorytmów uczenia maszynowego.

Oprócz podstawowej wiedzy programistycznej ważne jest również, aby wiedzieć, jak wyodrębniać, przetwarzać i analizować dane. To jedna z najważniejszych umiejętności potrzebnych do uczenia maszynowego.

Aby dowiedzieć się więcej o programowaniu języków do uczenia maszynowego, możesz przeglądać następujące blogi:

konwersja liczb dwójkowych na dziesiętne w java
  1. Najlepsze biblioteki Pythona do nauki o danych i uczenia maszynowego

Przykład zastosowania uczenia maszynowego

Uczenie maszynowe polega na stworzeniu algorytmu, który może uczyć się na podstawie danych, aby przewidzieć, na przykład, jakie rodzaje obiektów znajdują się na obrazie lub silnik rekomendacji, najlepszą kombinację leków na daną chorobę lub filtrowanie spamu.

Uczenie maszynowe opiera się na matematycznych wymaganiach wstępnych, a jeśli wiesz, dlaczego matematyka jest używana w uczeniu maszynowym, będzie to zabawne. Musisz znać matematykę stojącą za funkcjami, których będziesz używać oraz który model jest odpowiedni dla danych i dlaczego.

Zacznijmy więc od interesującego problemu przewidywania cen domów, mając zbiór danych zawierający historię różnych cech i cen. Na razie rozważymy powierzchnię mieszkalną w stopach kwadratowych i ceny.

Teraz mamy zestaw danych zawierający dwie kolumny, jak pokazano poniżej:

Musi istnieć jakaś korelacja między tymi dwiema zmiennymi, aby dowiedzieć się, że będziemy musieli zbudować model, który może przewidzieć cenę domów, jak możemy to zrobić?

Pokażmy te dane na wykresie i zobaczmy, jak to wygląda:

Tutaj oś X to cena za metr kwadratowy powierzchni mieszkalnej, a oś Y to cena domu. Jeśli wykreślimy wszystkie punkty danych, otrzymamy wykres punktowy, który można przedstawić za pomocą linii, jak pokazano na powyższym rysunku, a jeśli wprowadzimy jakieś dane, wówczas przewidywany jest wynik. W idealnym przypadku musimy znaleźć linię, która będzie przecinała maksymalne punkty danych.

Tutaj próbujemy utworzyć linię, która jest określana jako:

Y = mX + c

Ta metoda przewidywania liniowej zależności między wartością docelową (zmienną zależną) a zmienną predykcyjną (zmienną niezależną) jest określana jako regresja liniowa. Pozwala nam badać i podsumowywać relacje między dwiema zmiennymi.

  • X = zmienna niezależna
  • Y = zmienna zależna
  • c = punkt przecięcia z osią y
  • m = nachylenie linii

Jeśli weźmiemy pod uwagę równanie, mamy wartości X, które jest zmienną niezależną, więc wszystko, co musimy zrobić, to obliczyć wartości m i c, aby przewidzieć wartość Y.

czy konstruktor może być prywatny

Jak więc znajdujemy te zmienne?

Aby znaleźć te zmienne, możemy wypróbować kilka wartości i spróbować znaleźć linię, która przecina maksymalną liczbę punktów danych. Ale jak możemy znaleźć najlepiej dopasowaną żyłkę?

Aby więc znaleźć najlepiej dopasowaną linię, możemy użyć funkcji błędu najmniejszych kwadratów, która znajdzie błąd między wartością rzeczywistą y a wartością przewidywaną y`.

Funkcję błędu najmniejszych kwadratów można przedstawić za pomocą następującego równania:

Za pomocą tej funkcji możemy znaleźć błąd dla każdego przewidywanego punktu danych, porównując go z rzeczywistą wartością punktu danych. Następnie podsumowujesz wszystkie te błędy i wyrównaj je, aby znaleźć odchylenie w przewidywaniu.

Jeśli dodamy trzecią oś do naszego wykresu zawierającego wszystkie możliwe wartości błędów i wykreślimy ją w przestrzeni trójwymiarowej, będzie ona wyglądać następująco:

Na powyższym obrazku idealne wartości znajdowałyby się w dolnej czarnej części, która będzie przewidywać ceny zbliżone do rzeczywistego punktu danych. Następnym krokiem jest znalezienie najlepszych możliwych wartości mi c. Można to zrobić za pomocą techniki optymalizacji zwanej zejściem gradientowym.

Zejście gradientowe to metoda iteracyjna, w której zaczynamy od zainicjowania pewnego zestawu wartości dla naszych zmiennych i powoli je poprawiamy, minimalizując błąd między wartością rzeczywistą a wartością przewidywaną.

Jeśli uważamy, że ceny mieszkania tak naprawdę nie zależą tylko od ceny za metr kwadratowy, jest wiele czynników, takich jak liczba sypialni, łazienek itp. Jeśli weźmiemy pod uwagę również te cechy, to równanie będzie wyglądać jakoś lubię to

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Jest to regresja wieloliniowa, należąca do algebry liniowej, tutaj możemy użyć macierzy o rozmiarze mxn, gdzie m to cechy, a n to punkty danych.

Rozważmy inną sytuację, w której możemy wykorzystać prawdopodobieństwo znalezienia stanu domu w celu sklasyfikowania domu na podstawie tego, czy jest w dobrym, czy w złym stanie. W tym celu, aby działać, będziemy musieli użyć techniki zwanej regresją logistyczną, która działa na prawdopodobieństwo zdarzeń reprezentowanych przez funkcję sigmoidalną.

W tym artykule omówiliśmy wymagania wstępne uczenia maszynowego i ich zastosowanie w uczeniu maszynowym. Zasadniczo składa się ze statystyki, rachunku różniczkowego, algebry liniowej i teorii prawdopodobieństwa. Calculus ma techniki wykorzystywane do optymalizacji, algebra liniowa ma algorytmy, które mogą działać na ogromnych zbiorach danych, z prawdopodobieństwem możemy przewidzieć prawdopodobieństwo wystąpienia zdarzeń, a statystyki pomagają nam wyciągać przydatne wnioski z próbki zbiorów danych.

Teraz, gdy znasz już wymagania wstępne dotyczące uczenia maszynowego, jestem pewien, że chcesz dowiedzieć się więcej. Oto kilka blogów, które pomogą Ci rozpocząć pracę z Data Science:

Jeśli chcesz zapisać się na pełny kurs sztucznej inteligencji i uczenia maszynowego, Edureka ma specjalnie wyselekcjonowany kurs to sprawi, że będziesz biegły w technikach, takich jak uczenie się nadzorowane, uczenie się bez nadzoru i przetwarzanie języka naturalnego. Obejmuje szkolenia dotyczące najnowszych osiągnięć i podejść technicznych w dziedzinie sztucznej inteligencji i uczenia maszynowego, takich jak uczenie głębokie, modele graficzne i uczenie się ze wzmocnieniem.