Difference between revisions of "Cluspack"
Line 29: | Line 29: | ||
more options | more options | ||
− | -dt=[coordinates|alignment|distances|similarities] (fd stands for data_type) | + | -dt=[coordinates|alignment|distances|similarities] (fd stands for data_type)<br> |
− | -cm=[kmeans|ward|bionj|mixturemodels] (cm stands for clustering_method) | + | -cm=[kmeans|ward|bionj|mixturemodels] (cm stands for clustering_method)<br> |
− | -nbc=[secator|dpc|aic|bic|number] (nbc stands for method for computing the number of cluster and number is really a number like 4 etc.) | + | -nbc=[secator|dpc|aic|bic|number] (nbc stands for method for computing the number of cluster and number is really a number like 4 etc.)<br> |
− | [-dt1|-dt2][-standardization][-standardized_data][-wc] (dt1 stands for density1 and wc for write_coordinates) | + | [-dt1|-dt2][-standardization][-standardized_data][-wc] (dt1 stands for density1 and wc for write_coordinates)<br> |
− | [-fd=number] (dt stands for filtering_distance) | + | [-fd=number] (dt stands for filtering_distance)<br> |
− | [-nbsim=nbsimulations] | + | [-nbsim=nbsimulations]<br> |
− | [-otfa=outputFile for alignment] | + | [-otfa=outputFile for alignment]<br> |
− | [-oclu=outputFile for clustering] | + | [-oclu=outputFile for clustering]<br> |
Revision as of 17:57, 22 October 2008
Attention : Cluspack tourne sur Star3-8 et mais ne tourne plus sur Beaufort !!
Principe
Cluspack permet de lancer un clustering en k-means ou en mixture-models.
Voir le poster JOBIM 2005
Format d'entrée
Le fichier d'entrée doit être formaté de la façon suivante :
- la première ligne indique le nombre des lignes et des colonnes.
- les lignes suivantes sont de la forme
- la première colonne des données peut contenir des identifiants
- les autres colonnes de texte, annotation etc devront se trouver à la fin
Utilisation
En ligne de commande (avec tous les arguments) :
/biolo/cluspack/bin/cluspack myDataForClustering.txt -dt=coordinates -cm=mixturemodels -nbc=aic -wc -dt2
autres choix des parametres :
-cm=kMeans
number of clusters :
(mixturemodels :) -nbc=bic
(kMeans :) -nbc=dpc
density :
(kMeans :) -dt1
more options
-dt=[coordinates|alignment|distances|similarities] (fd stands for data_type)
-cm=[kmeans|ward|bionj|mixturemodels] (cm stands for clustering_method)
-nbc=[secator|dpc|aic|bic|number] (nbc stands for method for computing the number of cluster and number is really a number like 4 etc.)
[-dt1|-dt2][-standardization][-standardized_data][-wc] (dt1 stands for density1 and wc for write_coordinates)
[-fd=number] (dt stands for filtering_distance)
[-nbsim=nbsimulations]
[-otfa=outputFile for alignment]
[-oclu=outputFile for clustering]
pour utiliser le GUI cré par Adeline et Nicolas :
setcluspack
cluspackX
Il existe aussi une variante de clustering itérative en ligne de commande: (cet exemple lancera 10 fois un clustering kMeans)
/biolo/cluspack/cluspacksucc.tcl kmeans 10