do strony glownej wydziału  strona główna wydziału   English version | Adresy i telefony na wydziale
Działalność Naukowo Badawcza
O czasopiśmie

Rada Naukowa

Recenzenci

Redakcja

Aktualny numer

Numery archiwalne

Wymogi dla autorów

Procedura recenzowania

Prenumerata

Kontakt z redakcją

 
Prace i Materiały Wydziału Zarządzania
tytuł, stopień naukowy, pełne imię i nazwisko (Times, 12, pogrubio-ny, do lewej)

Kamila Najman

 

 

Analiza podobieństwa wyników grupowania uzyskanych
w oparciu o metodę k-średnich dla wybranych metod
ustalania optymalnej liczby skupień

 

 

Streszczenie

Jednym z podstawowych problemów, jaki pojawia się w analizie skupień jest ustalenie liczby grup, na jaką należy rozdzielić badane obiekty. Informacja ta bardzo często jest nieznana i musi być ustalona a priori. Jest to również jeden z fundamentalnych problemów pojawiających w momencie rozdzielania zbioru danych oraz często algorytmy grupowania wymagają zdefiniowania tego parametru. Jednym z proponowanych rozwiązań jest zastosowanie przyjętego zewnętrznego, w stosunku do zastosowanej metody grupowania, kryterium ustalania liczby skupień – wskaźników jakości grupowania. W literaturze tematu opisywanych jest wiele wskaźników pozwalających na uzyskiwanie informacji o podziale zbioru obiektów. W artykule przedstawiono 11 wskaźników jakości grupowani. Rezultaty przeprowadzonej analizy zademonstrowano w oparciu o algorytm k-średnich oraz proponowane wskaźniki jakości grupowania. Wydaje się, że proponowane wskaźniki mogą być przydanym narzędziem w uzyskiwaniu informacji i wiedzy o zbiorze danych. W literaturze tematu proponuje się również różne sposoby pomiaru zgodności wyników dwóch klasyfikacji. Spośród różnych metod klasyfikacji wykorzystywanych do analizowanego zbioru wybiera się te metody, które wykazują zbliżone wyniki. Porównuje się również podziały dwóch różnych zespołów cech uzyskanych za pomocą jednej metody klasyfikacji czy też informacje pochodzące z dwóch różnych okresów czasu. W powyższym artykule zaprezentowane zostały wybrane, najczęściej opisywane w literaturze mierniki służące do oceny podobieństwa wyników dwóch klasyfikacji, takie jak: miara Rand’a, skorygowana miara Rand’a, współczynnik Jaccard’a i indeks Fowkles’a i Mallows’a których własności weryfikowano na przygotowanych 15 zbiorach testowych.

 

 

Similarity analysis grouping results basis of algorithm k-means for selected methods determining the number of clusters (Summary)

Clustering is an unsupervised classification scheme where no a priori knowledge of data set is available. The prediction of correct number of clusters is a fundamental problem in classification problem. Many clustering algorithms require the definition of the number of clusters beforehand. To overcome this problem, various cluster validity indices have been proposed to assess the quality of a clustering partition. In the literature of clustering, a large number of cluster validity indices are there. In this article, a cluster validity indexes and its methodology were described, which can provide a measure of goodness of clustering on different partitions of a data set. Results were demonstrating basis of k-means algorithm. Cluster validity indexes may be an effective tool to discovery knowledge in data sets. The problem of measuring the correspondence between partitions of an object set has attracted substantial interest in the literature of classification. A possibility of comparison between different partitions for example by different classification methods, different combinations of characteristics, observations from different periods, of a given set, is considered. In this paper, there is presented well-known measures of classification partition, like Rand Statistic, Jaccard Coefficient, Fowlkes and Mallows index. The resulting between partitions were defined the following indices to measure the degree of similarity. Theoretical considerations are illustrated by the 15 numerical examples.

 

 


wstecz


  do strony glownej wydziału  strona główna UG Adresy i telefony na UG   Biblioteka główna UG   Pytania  
kontakt z webmasterem   kontakt z webmasterem
 
do strony głównej UG do strony głównej wydziału do strony głównej wydziału