Różne techniki modelowania:
Każdy problem możemy podzielić na mniejsze procesy:
Klasyfikacja - to miejsce, w którym klasyfikujemy dane. Na przykład. choroby wszystkie choroby wykazują określone zachowanie i możemy je dalej klasyfikować.
jakie jest 6 sposobów użycia tego słowa kluczowego?
Na przykład: choroby obniżające odporność, choroby wywołujące ból głowy itp.
Regresja - polega na znalezieniu związku między wieloma zmiennymi.
Na przykład: jak waga człowieka jest powiązana z jego wzrostem.
AnomolyWykrycie - jest w zasadzie fluktuacją.
Na przykład: W przypadku wysokiego lub niskiego napięcia.
Inny przykład może obejmować regulowane zachowanie, które obejmuje jazdę po prawej lub lewej stronie w zależności od kraju. Ta anomolia to ktoś jadący z naprzeciwka.
Innym przykładem może być włamanie do sieci. Tutaj uwierzytelniony użytkownik loguje się w witrynie Twojej firmy, a jeśli zaloguje się ktoś nieuwierzytelniony, jest toAn0moly.
Znaczenie atrybutu - Zasadniczo daje wiele atrybutów, takich jak wzrost, waga, temperatura, bicie serca. Warto zauważyć, że wszystkie te atrybuty są ważne dla zadania.
różnica między C # i C ++
Na przykład: Ktoś próbuje przewidzieć, o której godzinie dana osoba dotrze do urzędu. Każdy atrybut odgrywa ważną rolę, ale nie wszystkie atrybuty są ważne.
Zasady stowarzyszenia - Mówiąc prościej, jest to analiza lub przewidywanie następnego zachowania, które obraca się wokół silnika rekomendacji.
Na przykład: Kupujący chleb może też kupić mleko. Jeśli przeanalizujemy poprzednie zachowania zakupowe, wszystkie pozycje w koszyku mają związek. W takim przypadku może istnieć prawdopodobieństwo, że kupujący chleb kupi również mleko.
Grupowanie - To jedna z najstarszych technik statystycznych. W rzeczywistości zawsze można modelować dowolny problem, czy to klasyfikację, czy grupowanie, co oznacza grupowanie podobnych podmiotów.
Na przykład:
1) Weź koszyk jabłek i pomarańczy, w którym oddzielimy jabłka od pomarańczy.
2) Ważnym przypadkiem użycia klastrów jest opieka zdrowotna. Prawie wszystkie statystyki i analizy rozpoczęły się od przypadków użycia opieki zdrowotnej. Aby zagłębić się w temat, istnieje pojęcie grupowania zwane kohortami (osoby z podobnymi chorobami), dzięki czemu można je badać niezależnie od obecnych klientów. Na przykład, jeśli 10 osób cierpi na gorączkę, a kolejne 10 na bóle głowy, znajdziemy ich wspólne cechy i wygenerujemy lekarstwo.
Ekstrakcja cech - W przypadku wyodrębniania cech dokładność, trafność i błąd są dość istotne. Innymi słowy, wyodrębnianie cech można nazwać rozpoznawaniem wzorców.
Na przykład:
W wyszukiwarce Google, gdy użytkownik wprowadza termin, pojawia się wyniki. Teraz ważne pytanie, które należy zadać, brzmi: skąd wiedział, która strona jest istotna, a która nie dotyczy tego terminu? Można temu odpowiedzieć poprzez wyodrębnianie cech i rozpoznawanie wzorców, gdzie dodaje się ważne funkcje. Powiedzmy, że podano zdjęcie, niektóre aparaty wykrywają twarze, podkreślają twarz, aby uzyskać piękne obrazy, które również wykorzystują rozpoznawanie funkcji.
Uczenie nadzorowane a uczenie się nienadzorowane
do) Kategoria prognozy - Techniki obejmują regresję, logistykę, sieci neuronowe i drzewa decyzyjne. Niektóre przykłady obejmują wykrywanie oszustw (gdzie komputer uczy się i przewiduje następne oszustwo na podstawie wcześniejszej historii oszustwa). W uczeniu się bez nadzoru nie można przewidywać na przykładach, ponieważ nie ma danych historycznych.
jak zamienić double w int java
b) Kategoria klasyfikacji - Na przykład, czy transakcja jest oszukańcza, czy nie, wchodzi do kategorii klasyfikacji. Tutaj bierzemy dane historyczne i klasyfikujemy je za pomocą drzew decyzyjnych lub w przypadku, gdy w ogóle nie bierzemy żadnych danych historycznych, wtedy bezpośrednio zaczynamy od danych i próbujemy samodzielnie wykorzystać funkcje. Na przykład, jeśli potrzebujemy znać pracowników, którzy prawdopodobnie odejdą z organizacji lub zostaną. W przypadku, gdy jest to nowa organizacja, w której nie możemy wykorzystać danych historycznych, zawsze możemy użyć klastrowania do ekstrakcji danych.
do) Kategoria eksploracji - To prosta metoda, polegająca na wymyśleniu, co oznacza big data. W uczeniu się bez nadzoru nazywa się to składnikami podstawowymi i grupowaniem.
re) Kategoria podobieństwa - tutaj zaangażowanych jest wiele elementów, takich jak sprzedaż krzyżowa / sprzedaż w górę, analiza koszyka rynkowego. W analizie koszyka nie ma nadzorowanego uczenia się, ponieważ nie ma danych historycznych. Więc bierzemy dane bezpośrednio i znajdujemy powiązania, sekwencjonowanie i analizę czynnikową.
Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.
Powiązane posty: