Difference between revisions of "String"

From Wikili
Jump to: navigation, search
(New page: STRING - Known and Predicted Protein-Protein Interactions from [http://string.embl.de http://string.embl.de] STRING is a database of known and predicted protein interactions.The interac...)
(No difference)

Revision as of 18:46, 13 December 2009

STRING - Known and Predicted Protein-Protein Interactions

 from http://string.embl.de STRING is a database of known and predicted protein interactions.The interactions include direct (physical) and indirect (functional) associations;;they are derived from four sources: Genomic Context, High-throughput Experiments, (Conserved) Coexpression and Previous Knowledge 	 		 		 		 
 STRING quantitatively integrates interaction data from these sources for a large number of organisms, and transfers information between these organisms where applicable. The database currently covers 2,590,259 proteins from 630 organisms.

Nous avons implémenté en local la base de données PostgreSQL String8.2 et développer quelques outils pour l'interroger.

Gscope DePartoutAString

Il suffit de donner un fichier contenant une liste de gènes ou de probesets (NM, affy, nom de gène, etc.), par exemple le fichier String_essai.txt avec une ligne d'entête (s'il n'y en a pas on mettra data1 data2, etc.)

 accessnum	genename
 NM_177470	Acaa2
 NM_010678	Aff3
DePartoutAString {FichierDepart RepertoireParent Org {SeuilString ""} {From ""} {WithoutTextMiningOnly ""} {GetWhat ""}}
  • FichierDepart (est ici String_essai.txt)
  • RepertoireParent va contenir un nouveau répertoire
    • appelé Sting_taxid_date qui est créé automatiquement
    • ou si RepertoireParent est de la forme /bidule/machin/SameAsFile on créera /bidule/machin/FichierDepart (sans .txt ... ici String_essai)
  • Org est soit Mus_musculus ou "Mus musculus" ou 10090, Homo_sapiens ou "Homo sapiens" ou 9606, Rattus_norvegicus etc.
  • SeuilString par défaut 700
  • From est FromNM, FromAffy ou FromTest (défaut). Si FromTest on teste chaque valeur pour détecter si c'est NM ou Affy etc.
  • WithoutTextMiningOnly on ne prend pas ceux qui ne sont trouvés QUE PAR textmining
  • GetWhat ne sert plus car on rend tout !

DePartoutAString va créer le répertoire RepertoireParent/String_10090_20091213_1655 (ou RepertoireParent/String_essai) qui contiendra

 AttributeNode		contiendra une colonne appelée QueryColor et qui permettra de colorier les gènes de départ
 Identifiers		contient les identifiants String
 QueryOnly.string	network avec uniquement les gènes du FichierDepart
 Sandwich.string	network avec au moins deux interactions
 String_essai.tgz	le tar gzip de tout ça.
 String_essai.txt	le FichierDepart
 String_essai_context.txt le contexte dans lequel on a créé cette liste
 Summary.txt		un résumé de pour qui on a trouvé un identifiant String   "vide" si non
 WithAny.parser	je sais pas !
 WithAny.string	network avec toutes les interactions

PHP String

tout ça est accessible depuis PHP.

  • par RrFun::Wscope("EVImm", "DePartoutAString", $params);
  • par PipeWork ... voir le PipeWork ImAnnoEarGeneListWithDiaVennString
    • en gros, il faut appeler ImAnnoString et lui fournir un array des données, les clés à garder dans le bon ordre (NM en premier), le nom de la racine (par ex. String_essai), un texte avec le context
 params est un array de la forme (on voit ici les valeurs prises par défaut)
       $params["org"]       = "Mus_musculus";  (puisque Laëtitia refuse de mettre un défaut dans DePartoutAString !!!)
       $params["seuil"]     = "";
       $params["from"]      = "";
       $params["wtmo"]      = "";
       $params["repparent"] = "home/ripp/GenoretWww/ImAnno/ImAnnoEar/String";

Dans touts les cas on crée un tar gzip .tgz qui peut être télécharger.

Cytoscape

On a maintenant tou ce qu'il faut pour entrer dans Cytoscape

  1. File/import network from table table WithAny.string
  2. File/import network from table Sandwich.string
  3. File/import network from table QueryOnly.string
  4. import attribute AttributeNode

Quand on fait import network il faut :

  1. select file ...
  2. cocher Show text file import options
    • Delimiter Tab (enlever Space)
    • Show all entries
    • Transfert first line as attribute names
  1. Source Interaction prendre column 2 (PNInitial)
  2. Target Interaction prendre column 4 (PNCopain)
  3. Import
  4. Close la fenêtre de baratin

Quand on fait import Attributes

  1. Select table ...
  2. Show text file import options
    • Delimiter Tab (c'est déjà bon)
    • Show all entries
    • Transfert first line as attribute names
  1. Import
  2. Close la fenêtre de baratin

Avec ça on peut colorier nos gènes

  1. Cliquer sur l'onglet WizMapper
  2. Double-cliquer Node Color (il saute en haut)
  3. Select Value QueryColor
  4. Mapping type Discrete Mapper
  5. Cliquer sur le 1 puis dans sa case vide à droite
  6. IL apparaît trois petits points cliquer dessus pour choisir une couleur

Bonne chance !

              Raymond