Cluspack

From Wikili
Revision as of 18:56, 22 October 2008 by Wraff (talk | contribs)
Jump to: navigation, search
 Attention : Cluspack tourne sur Star3-8 et mais ne tourne plus sur Beaufort !!

Principe

Cluspack permet de lancer un clustering en k-means ou en mixture-models.

Voir le poster JOBIM 2005


Format d'entrée

Le fichier d'entrée doit être formaté de la façon suivante :

  • la première ligne indique le nombre des lignes et des colonnes.
  • les lignes suivantes sont de la forme
    • la première colonne des données peut contenir des identifiants
    • les autres colonnes de texte, annotation etc devront se trouver à la fin

Utilisation

En ligne de commande (avec tous les arguments) :

/biolo/cluspack/bin/cluspack myDataForClustering.txt -dt=coordinates -cm=mixturemodels -nbc=aic -wc -dt2

autres choix des parametres :
-cm=kMeans
number of clusters :
(mixturemodels :) -nbc=bic
(kMeans :) -nbc=dpc
density :
(kMeans :) -dt1

more options -dt=[coordinates|alignment|distances|similarities] (fd stands for data_type) -cm=[kmeans|ward|bionj|mixturemodels] (cm stands for clustering_method) -nbc=[secator|dpc|aic|bic|number] (nbc stands for method for computing the number of cluster and number is really a number like 4 etc.) [-dt1|-dt2][-standardization][-standardized_data][-wc] (dt1 stands for density1 and wc for write_coordinates) [-fd=number] (dt stands for filtering_distance) [-nbsim=nbsimulations] [-otfa=outputFile for alignment] [-oclu=outputFile for clustering]


pour utiliser le GUI cré par Adeline et Nicolas :

setcluspack
cluspackX


Il existe aussi une variante de clustering itérative en ligne de commande: (cet exemple lancera 10 fois un clustering kMeans)

/biolo/cluspack/cluspacksucc.tcl kmeans 10