FUZZY K-MEANS CLUSTERING W MAHOUT

Ten blog zawiera wprowadzenie do grupowania Fuzzy K-Means w Apache Mahout.

Rozmyte K-średnie to dokładnie ten sam algorytm co K-średnie, które są popularną prostą techniką grupowania. Jedyna różnica polega na tym, że zamiast przypisywać punkt wyłącznie do tylko jednego skupienia, może on powodować pewne niejasności lub nakładanie się między dwoma lub większą liczbą klastrów. Poniżej przedstawiono kluczowe punkty opisujące rozmyte wartości K:

W przeciwieństwie do K-średnich, które poszukują twardych klastrów, w których każdy z punktów należy do jednej grupy, Fuzzy K-Means poszukuje bardziej miękkich klastrów do nakładania się.
Pojedynczy punkt w miękkim klastrze może należeć do więcej niż jednego klastra o określonej wartości powinowactwa do każdego z punktów.
Powinowactwo jest proporcjonalne do odległości tego punktu od środka ciężkości gromady.
Podobnie jak K-Means, Fuzzy K-Means działa na obiektach, które mają zdefiniowaną miarę odległości i mogą być reprezentowane w n- wymiarowa przestrzeń wektorowa.

Fuzzy K-Means MapReduce Flow

Nie ma dużej różnicy między przepływem K-Means MapReduce a Fuzzy K-Means. Realizacja obu w Mahout jest podobna.

jak uzyskać długość tablicy w javascript

Poniżej znajdują się pliki podstawowe parametry do realizacji Fuzzy K-Means:

Do wprowadzenia potrzebny jest zestaw danych Vector.
Musi istnieć RandomSeedGenerator, aby zasiać początkowe klastry k.
W przypadku pomiaru odległości SquaredEuclideanDistanceMeasure jest wymagany.
Duża wartość progu zbieżności, np. –Cd 1,0, jeśli została użyta kwadratowa wartość miary odległości
Wartością maxIterations domyślną wartością jest -x 10.
Współczynnik normalizacji lub współczynnik nieostrości o wartości większej niż -m 1,0

Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.

framework hybrydowy w selenium webdriver

powiązane posty

sql server data typ danych

Nadzorowane uczenie się w Apache Mahout

Ten blog zawiera wprowadzenie do grupowania Fuzzy K-Means w Apache Mahout.

Fuzzy K-Means MapReduce Flow

Kategorie

Popular Articles

Zmiana kariery: od Java do Big Data / Hadoop

Hermetyzacja w Javie - jak opanować OOP za pomocą enkapsulacji?

Samouczek dotyczący serwera Tableau: wszystko, co musisz wiedzieć

Samouczek Google Cloud Platform: Pierwsze kroki z Google Cloud Platform

Projekty związane z tworzeniem stron internetowych: wiedza, jak tworzyć i projektować strony internetowe

Jaka jest przyszłość sztucznej inteligencji? Wiedzieć o zakresach i pomysłach

Jak najlepiej wykorzystać znacznik DIV HTML?

Polecenia Linuksa w DevOps: trzeba wiedzieć dla każdego DevOps Professional

Jenkins vs Bamboo - Bitwa o najlepsze narzędzia CI / CD

Jak zaimplementować sprite CSS w celu ulepszenia stron internetowych

Co to jest BlockingQueue w Javie i jak go zaimplementować?

Konsola AWS: szczegółowe informacje o interfejsie zarządzania AWS