Difference between revisions of "Cluspack"

From Wikili
Jump to: navigation, search
Line 1: Line 1:
 
   '''Attention''' : Cluspack tourne sur Star3-8 et mais ne tourne plus sur Beaufort !!
 
   '''Attention''' : Cluspack tourne sur Star3-8 et mais ne tourne plus sur Beaufort !!
  
 +
==Principe==
 
Cluspack permet de lancer un clustering en k-means ou en mixture-models.
 
Cluspack permet de lancer un clustering en k-means ou en mixture-models.
  
 
Voir le poster [http://pbil.univ-lyon1.fr/events/jobim2005/proceedings/P96Legrand.pdf JOBIM 2005]
 
Voir le poster [http://pbil.univ-lyon1.fr/events/jobim2005/proceedings/P96Legrand.pdf JOBIM 2005]
  
'''Input format''':
 
Des données doivent commencer avec une première ligne indiquant le nombre des lignes et des colonnes. <br>
 
La première colonne des données peut contenir des identifiants (et toutes autres colonne de texte, annotation etc devront se trouver à la fin)
 
  
'''Utilisation''' :
+
==Format d'entrée==
 +
Le fichier d'entrée doit être formaté de la façon suivante :
 +
* la première ligne indique le nombre des lignes et des colonnes.
 +
* les lignes suivantes sont de la forme
 +
** la première colonne des données peut contenir des identifiants
 +
** les autres colonnes de texte, annotation etc devront se trouver à la fin
 +
 
 +
==Utilisation==
  
 
En ligne de commande (avec tous les arguments) :  
 
En ligne de commande (avec tous les arguments) :  

Revision as of 21:22, 16 February 2008

 Attention : Cluspack tourne sur Star3-8 et mais ne tourne plus sur Beaufort !!

Principe

Cluspack permet de lancer un clustering en k-means ou en mixture-models.

Voir le poster JOBIM 2005


Format d'entrée

Le fichier d'entrée doit être formaté de la façon suivante :

  • la première ligne indique le nombre des lignes et des colonnes.
  • les lignes suivantes sont de la forme
    • la première colonne des données peut contenir des identifiants
    • les autres colonnes de texte, annotation etc devront se trouver à la fin

Utilisation

En ligne de commande (avec tous les arguments) :

/biolo/cluspack/bin/cluspack myDataForClustering.txt -dt=coordinates -cm=mixturemodels -nbc=aic -wc -dt2

autres choix des parametres :
-cm=kMeans
number of clusters :
(mixturemodels :) -nbc=bic
(kMeans :) -nbc=dpc
density :
(kMeans :) -dt1


pour utiliser le GUI cré par Adeline et Nicolas :

setcluspack
cluspackX


Il existe aussi une variante de clustering itérative en ligne de commande: (cet exemple lancera 10 fois un clustering kMeans)

/biolo/cluspack/cluspacksucc.tcl kmeans 10