Fuzzy K-Means Clustering w Mahout



Ten blog zawiera wprowadzenie do grupowania Fuzzy K-Means w Apache Mahout.

Rozmyte K-średnie to dokładnie ten sam algorytm co K-średnie, które są popularną prostą techniką grupowania. Jedyna różnica polega na tym, że zamiast przypisywać punkt wyłącznie do tylko jednego skupienia, może on powodować pewne niejasności lub nakładanie się między dwoma lub większą liczbą klastrów. Poniżej przedstawiono kluczowe punkty opisujące rozmyte wartości K:





  • W przeciwieństwie do K-średnich, które poszukują twardych klastrów, w których każdy z punktów należy do jednej grupy, Fuzzy K-Means poszukuje bardziej miękkich klastrów do nakładania się.
  • Pojedynczy punkt w miękkim klastrze może należeć do więcej niż jednego klastra o określonej wartości powinowactwa do każdego z punktów.
  • Powinowactwo jest proporcjonalne do odległości tego punktu od środka ciężkości gromady.
  • Podobnie jak K-Means, Fuzzy K-Means działa na obiektach, które mają zdefiniowaną miarę odległości i mogą być reprezentowane w n- wymiarowa przestrzeń wektorowa.

Fuzzy K-Means MapReduce Flow

Nie ma dużej różnicy między przepływem K-Means MapReduce a Fuzzy K-Means. Realizacja obu w Mahout jest podobna.

jak uzyskać długość tablicy w javascript

Poniżej znajdują się pliki podstawowe parametry do realizacji Fuzzy K-Means:



  • Do wprowadzenia potrzebny jest zestaw danych Vector.
  • Musi istnieć RandomSeedGenerator, aby zasiać początkowe klastry k.
  • W przypadku pomiaru odległości SquaredEuclideanDistanceMeasure jest wymagany.
  • Duża wartość progu zbieżności, np. –Cd 1,0, jeśli została użyta kwadratowa wartość miary odległości
  • Wartością maxIterations domyślną wartością jest -x 10.
  • Współczynnik normalizacji lub współczynnik nieostrości o wartości większej niż -m 1,0

Masz do nas pytanie? Wspomnij o nich w sekcji komentarzy, a my skontaktujemy się z Tobą.

framework hybrydowy w selenium webdriver

powiązane posty



sql server data typ danych

Nadzorowane uczenie się w Apache Mahout