Techniki modelowania w analizie biznesowej z R.



Blog zawiera krótkie wprowadzenie do technik modelowania w analizie biznesowej z R.

Różne techniki modelowania:

Każdy problem możemy podzielić na mniejsze procesy:





Klasyfikacja - to miejsce, w którym klasyfikujemy dane. Na przykład. choroby wszystkie choroby wykazują określone zachowanie i możemy je dalej klasyfikować.

jakie jest 6 sposobów użycia tego słowa kluczowego?

Na przykład: choroby obniżające odporność, choroby wywołujące ból głowy itp.



Regresja - polega na znalezieniu związku między wieloma zmiennymi.

Na przykład: jak waga człowieka jest powiązana z jego wzrostem.

AnomolyWykrycie - jest w zasadzie fluktuacją.



Na przykład: W przypadku wysokiego lub niskiego napięcia.

Inny przykład może obejmować regulowane zachowanie, które obejmuje jazdę po prawej lub lewej stronie w zależności od kraju. Ta anomolia to ktoś jadący z naprzeciwka.

Innym przykładem może być włamanie do sieci. Tutaj uwierzytelniony użytkownik loguje się w witrynie Twojej firmy, a jeśli zaloguje się ktoś nieuwierzytelniony, jest toAn0moly.

Znaczenie atrybutu - Zasadniczo daje wiele atrybutów, takich jak wzrost, waga, temperatura, bicie serca. Warto zauważyć, że wszystkie te atrybuty są ważne dla zadania.

różnica między C # i C ++

Na przykład: Ktoś próbuje przewidzieć, o której godzinie dana osoba dotrze do urzędu. Każdy atrybut odgrywa ważną rolę, ale nie wszystkie atrybuty są ważne.

Zasady stowarzyszenia - Mówiąc prościej, jest to analiza lub przewidywanie następnego zachowania, które obraca się wokół silnika rekomendacji.

Na przykład: Kupujący chleb może też kupić mleko. Jeśli przeanalizujemy poprzednie zachowania zakupowe, wszystkie pozycje w koszyku mają związek. W takim przypadku może istnieć prawdopodobieństwo, że kupujący chleb kupi również mleko.

Grupowanie - To jedna z najstarszych technik statystycznych. W rzeczywistości zawsze można modelować dowolny problem, czy to klasyfikację, czy grupowanie, co oznacza grupowanie podobnych podmiotów.

Na przykład:

1) Weź koszyk jabłek i pomarańczy, w którym oddzielimy jabłka od pomarańczy.

2) Ważnym przypadkiem użycia klastrów jest opieka zdrowotna. Prawie wszystkie statystyki i analizy rozpoczęły się od przypadków użycia opieki zdrowotnej. Aby zagłębić się w temat, istnieje pojęcie grupowania zwane kohortami (osoby z podobnymi chorobami), dzięki czemu można je badać niezależnie od obecnych klientów. Na przykład, jeśli 10 osób cierpi na gorączkę, a kolejne 10 na bóle głowy, znajdziemy ich wspólne cechy i wygenerujemy lekarstwo.

Ekstrakcja cech - W przypadku wyodrębniania cech dokładność, trafność i błąd są dość istotne. Innymi słowy, wyodrębnianie cech można nazwać rozpoznawaniem wzorców.

Na przykład:

W wyszukiwarce Google, gdy użytkownik wprowadza termin, pojawia się wyniki. Teraz ważne pytanie, które należy zadać, brzmi: skąd wiedział, która strona jest istotna, a która nie dotyczy tego terminu? Można temu odpowiedzieć poprzez wyodrębnianie cech i rozpoznawanie wzorców, gdzie dodaje się ważne funkcje. Powiedzmy, że podano zdjęcie, niektóre aparaty wykrywają twarze, podkreślają twarz, aby uzyskać piękne obrazy, które również wykorzystują rozpoznawanie funkcji.

Uczenie nadzorowane a uczenie się nienadzorowane

do) Kategoria prognozy - Techniki obejmują regresję, logistykę, sieci neuronowe i drzewa decyzyjne. Niektóre przykłady obejmują wykrywanie oszustw (gdzie komputer uczy się i przewiduje następne oszustwo na podstawie wcześniejszej historii oszustwa). W uczeniu się bez nadzoru nie można przewidywać na przykładach, ponieważ nie ma danych historycznych.

jak zamienić double w int java

b) Kategoria klasyfikacji - Na przykład, czy transakcja jest oszukańcza, czy nie, wchodzi do kategorii klasyfikacji. Tutaj bierzemy dane historyczne i klasyfikujemy je za pomocą drzew decyzyjnych lub w przypadku, gdy w ogóle nie bierzemy żadnych danych historycznych, wtedy bezpośrednio zaczynamy od danych i próbujemy samodzielnie wykorzystać funkcje. Na przykład, jeśli potrzebujemy znać pracowników, którzy prawdopodobnie odejdą z organizacji lub zostaną. W przypadku, gdy jest to nowa organizacja, w której nie możemy wykorzystać danych historycznych, zawsze możemy użyć klastrowania do ekstrakcji danych.

do) Kategoria eksploracji - To prosta metoda, polegająca na wymyśleniu, co oznacza big data. W uczeniu się bez nadzoru nazywa się to składnikami podstawowymi i grupowaniem.

re) Kategoria podobieństwa - tutaj zaangażowanych jest wiele elementów, takich jak sprzedaż krzyżowa / sprzedaż w górę, analiza koszyka rynkowego. W analizie koszyka nie ma nadzorowanego uczenia się, ponieważ nie ma danych historycznych. Więc bierzemy dane bezpośrednio i znajdujemy powiązania, sekwencjonowanie i analizę czynnikową.

Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.

Powiązane posty: