Nadzorowana nauka w Apache Mahout



Uczenie nadzorowane to technika uczenia maszynowego, w której funkcja jest wywnioskowana na podstawie oznaczonych przykładów danych szkoleniowych.

Uczenie nadzorowane to metoda, w której dane szkoleniowe obejmują zarówno dane wejściowe, jak i pożądane wyniki. Szkolenie systemu z przykładami nazywa się uczeniem nadzorowanym. Albo też szkolenie algorytmu z nauczycielem może być traktowane jako uczenie nadzorowane. Po przeszkoleniu algorytmu ze wszystkimi danymi próbnymi lub danymi oznaczonymi, które mają oba predyktory na zmiennej docelowej, można wytrenować algorytm i wykorzystać niewidoczny przykład do dalszej klasyfikacji.





Oto niektóre z ważnych cech nadzorowanego uczenia się w Mahout:

  • Budowa odpowiedniego zestawu treningowego, walidacyjnego i testowego (Bok) jest kluczowa.
  • Te metody są zwykle szybkie i dokładne.
  • Metody nadzorowanego uczenia się muszą mieć możliwość generalizowania.
  • Dają poprawne wyniki, gdy wprowadzane są nowe dane bez znajomości elementuprioricel.
  • W niektórych przypadkach prawidłowe wyniki (cele) są znane i podane w danych wejściowych do modelu podczas procesu uczenia się.

Przykład nadzorowanego uczenia się

W przypadku, gdy chcesz wytrenować misję i dostajesz dwie różne grupy obrazów wraz z oznaczonymi danymi, np. na powyższym obrazku jedna grupa ma wizerunki słonia, a druga lwa. Dane oznaczone etykietami oznaczają, że każdy zestaw danych ma wartość docelową. W powyższym przykładzie zbiór danych to obrazy słonia, a nadana mu etykieta, tj. „Słoń” jest wartością docelową zbioru danych. Taki zestaw danych z etykietami jest używany w procesie uczenia, dzięki czemu algorytm uczący może wykorzystać ten zestaw danych i zbudować model, który można następnie wykorzystać do sklasyfikowania niewidocznych przykładów bez oznaczonych danych lub zmiennej docelowej.



Określmy cechy, które pomagają zidentyfikować obiekt jako słonia lub lwa:

Funkcje możliwe - rozmiar, kolor, wzrost, rozmiar ucha, tułów, kieł

Można to nazwać zestawem funkcji, który będzie używany do celów szkoleniowych. Ten zestaw funkcji wpłynie na ostateczną zmienną docelową. Te zmienne są znane jako zmienne predykcyjne , ponieważ pomagają nam w określaniu ostateczna zmienna docelowa . Ostatnią zmienną można również nazwać etykietą. Ostatnia zmienna tutaj jest Elephant / Lion.



table-word

W tym przykładzie każdy z rekordów w kategorii, rozmiar, kolor, wzrost, rozmiar ucha, tułów i kieł jest zmienną predykcyjną, podczas gdy zmiennymi docelowymi są słoń i lew. Te zmienne można traktować odpowiednio jako przykłady szkoleniowe i zestawy danych szkoleniowych.

Tak więc uczenie nadzorowane to sposób, za pomocą którego trenujesz wraz z etykietami, w którym prosisz algorytm o wyodrębnienie z niego określonych cech i na tej podstawie, gdy zobaczysz niewidoczny przykład, algorytm będzie w stanie go sklasyfikować do odpowiedniej klasy.

Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.

co to jest wątek demona

Powiązane posty: