Gscope Procedures

From Wikili
Jump to: navigation, search

You'll find here description about some important Gscope Procedures

 see all procedures with Gscope Chez le Psy

OrthoInspector

La manière de gérer OrthonInspector a vraiment beaucoup changé depuis 2016, Yannis avait fait ses protéomes et je les intégrais au fur et à mesure. Fin 2016 on a lancé les 10 000 000 de blast sur la grille pour les Eucaryotes. Après on a recommencé mais on ne prenant pas tout le monde ... il a fallu nommer les organismes, etc.

 voir OrthoInspector

proc BoutADNDeUcsc

Marche très bien !  :-)

  • Sur /genomics/link/UCSCGenomes on trouve des répertoires avec différents organismes (2018/01/10 Caenorhabditis_elegans, Drosophilia_melanogaster, Rattus_norvegicus, Danio_rerio, Homo_sapiens, Mus_musculus)
  • Chaque réperoirte contient un ensemble de BigZips qui contiennent eux-mêmes des fichiers de séquence des chromosomes par exemple /genomics/link/UCSCGenomes/Homo_sapiens/bigZips200903/chr14.fa
  • Souvent pour chaque organism on a un lien bigZips qui pointe sur le bigZips par defaut
  • On a accès à tout ça par
  proc BoutADNDeUcsc {{Deb ""} {Fin ""} {Orient ""} {Orga ""} {Chro ""} {BigZips ""}}
  • Deb est la position de départ (on compte à partir de 1)
  • Fin est la position de fin (on peut mettre 'end')
  • Orient F pour Forward, R pour Reverse
  • Orga à choisir parmi ceux cités ci-dessus

Mais il y a d'autres fonctionnalités qui permettent de lister ce qui existe

 BoutADNDeUcsc
 BoutADNDeUcsc Dir
 BoutADNDeUcsc List of organisms
 BoutADNDeUcsc List of bigZips
 BoutADNDeUcsc List of bigZips Homo_sapiens
 BoutADNDeUcsc List of links
 BoutADNDeUcsc List normal fasta Homo_sapiens - bigZips200903
 BoutADNDeUcsc List all fasta Homo_sapiens - bigZips200903
 BoutADNDeUcsc 23 2789 R Homo_sapiens chr1 bigZips200903
 BoutADNDeUcsc 1 end F Homo_sapiens chr14 bigZips

proc FromMacsim

 attention FromMacsim without S

With FromMacsim you can query any information from a Macsims XML file

FromMacsim can be called

  • as a console command (it calls /biolo/wscope/cafedessciences/bin/qds Zero ... )
 frommacsim /path/to/the/macsim.xml arg2 arg3
  • within Gscope
 FromMacsim Prefixe123 arg2 arg3

  • with QuestionDeScicence (from any language i.e. python, etc.)
 /biolo/wscope/cafedessciences/bin/qds Zero FromMacsim arg2 arg3
  • from the web


FromMacsim without any argument gives you a help as follow

   #rR FromMacsim permet d'interroger n'importe quel macsims au format XML
   #rR on utilise DecortiqueUnMacsimXml qui crée pleins de variables globales
   #rR la liste des variables globales existantes est accessible par
   #rR  FromMacsim FichierMacsims ListOfList
   #rR  FromMacsim FichierMacsims ListOfArray
   #rR On indexe tout par le nom du fichier ou par le MD5 du Texte xml s'il est fourni
   #rR Quand on interroge un Projet Gscope particulier (par exemple CilioCarta2014) le nom CIL123 suffit 
   #rR  FromMacsim CIL006 ListOfList
   #rR  FromMacsim CIL006 AlnName
   #rR  FromMacsim CIL006 LNOrdali
   #rR  FromMacsim CIL006 ListOfList
   #rR  FromMacsim CIL006 Sequences get          (rend la liste cle valeur cle valeur ...)
   #rR  FromMacsim CIL006 Sequences G1PUE7_MYOLU (rend la seqence)
   #rR  FromMacsim CIL006 MacsimsColor           (rend la liste cle valeur cle valeur des Colorations utilisées)
   #rR  FromMacsim CIL006 MacsimsColor names     (rend les cles des Colorations utilisées)
   #rR  FromMacsim CIL006 MacsimsColor ConsGlob  (rend le couple foreground background pour les Conservation Globales)
   #rR  FromMacsim CIL006 MacsimsColor Stock     (rend les couleurs utilisées pour les Features)
   #rR  FromMacsim CIL006 MacsimsColor 4         (rend la quatrième couleur utilisée pour les Features)
   #rR On peut mettre un nom complet de fichier
   #rR  FromMacsim /ici/oula/toto
   #rR ou pour tout projet Gscope
   #rR  FromMacsim ProjetGscope/Prefixe12345     (qui évite de mettre /genomics/link/ProjetGscope/macsimXml/...)

GeneNames

Gscope knows a lot about GeneNames

proc StringInteractome

With a list of gene names, NM_xxxxxs, probeset_ids, etc. you'll get a STRING analysis as a set of files allowing the display of the network with Cytoscape

 Please see our wiki page for String

proc Iterator

See the source of proc Iterator

set Name [Iterator New Init $L0 $L1 $L2]
while {[Iterator $Name Next  v0  v1  v2]} { ... } #rR sans $
#rR L2 is the fastest !!!!!!!!!!!!!!!!!!!!
#rR Attention lists are numbered from 0 to 2 (for the caller)
#rR           but are from 2 to 0 in the proc
Iterator $Name Reset
Iterator $Name Destroy
set Info [Iterator Iterator Get ListOf Name]
set Info [Iterator $Name    Get Current 2]    #rR current index de L2
set Info [Iterator $Name    Get Current All]  #rR tous les current L0 L1 L2
set Info [Iterator $Name    Get Max 0]
set Info [Iterator $Name    Get Max All]  
set Info [Iterator $Name    Get Total Iter]

GO

Attention attention ! Depuis 2014/12/6 j'ai mis "biological_process" "cellular_component" "molecular_function" en TermType. Du coup on récupère tout ... et peut-être trop. En plus ce n'est plus tellement compatible avec les mémorisation que je faisais avant un peu partout :'(

Ce qu'il faut savoir aussi c'est que la recherche des GO se fait en remontant vers les parents: quand un gène est à un noeud on le place artificiellement dans tous ses ancêtres.

proc GoGetInFile {File args}

Petite astuce qui consite à ranger le résulta de la commande args dasn un fichier ... ça nous évite de passer par Wscope au retour car GO2000 veut simplemnet créer le fichier pour s'en servir de mémoire tampon plus tard ... Désolé pour cet artifice.

proc GoNext {UpDown Go}

Several procs are concerned ... see the source file gscope_go.tcl See the source file proc GoNext

  • GoNext returns its children if down, its parent if up (can be more than 1 parent)
  • GoChildren Go is GoNext Down Go
  • GoParents Go is GoNext Up Go

proc GoGetFromGo {Go GENEofPFAMwhatyouneed JoinCar RecordsJoinCar UpDown}

Several procs are concerned ... see the source file gscope_go.tcl See the source file proc GoGetFromGo

  • UpDown can be Up / Down / Here / -n (n levels Up) / 0 (Here) / n (n levels down) ... and if it starts with + we skip 0 (+1 is only children)
  • GoGetFromGo starts from a GO and includes recursively all its children (ATTENTION we use Mus musculus by default) and return what you need about its GENEs or PFAMs
set ListOfGo           [GoGetFromGo "protein binding" GO]
set ListOfGoWithAcc    [GoGetFromGo "protein binding" GOacc]
set ListOfGoWithIdName [GoGetFromGo "GO:0005515"      GOid,name]
set ListOfPfam         [GoGetFromGo "protein binding" PFAM]
set ListOfPfamWithId   [GoGetFromGo "protein binding" PFAMxref_key,id]
set ListOfPfamWithDesc [GoGetFromGo "GO:0005515"      PFAMxref_key,xrefdesc]
set ListOfGene         [GoGetFromGo "protein binding" GENE]
set ListOfGene         [GoGetFromGo "protein binding" GENEsymbol]
set ListOfGeneWithDesc [GoGetFromGo "GO:0005515"      GENEfull_name,symbol]

proc GoGetFromGene {Gene GOwhatyouneed JoinCar RecordsJoinCar {Up ""}}

Several procs are concerned ... see the source file gscope_go.tcl See the source file proc GoGetFromGene

  • GoGetFromGene returns what you need about all its GO

if Up == "Up" each geen is also included recursilvely in the parent GOs

set ListOfGO           [GoGetFromGene PAX6 GO]
set ListOfGOWithAcc    [GoGetFromGene PAX6 GOacc]
set ListOfGOWithName   [GoGetFromGene PAX6 GOacc,name]
set ListOfGOWithSource [GoGetFromGene PAX6 GOacc,a.source_db_id]

proc GoGetFromGeneList {List GOwhatyouneed JoinCar RecordsJoinCar ListJoinCar {Up ""}}

Same as GoGetFromGene but for a list of genes. The return value is an indexed list of couples {gene=itsGOs} {gene=itsGOs} ...

proc GoGetFromPfam {Pfam GOwhatyouneed JoinCar RecordsJoinCar}

Several procs are concerned ... see the source file gscope_go.tcl See the source file proc GoGetFromPfam

  • GoGetFromGene returns what you need about all its GO
set ListOfGO           [GoGetFromPfam PF09088 GO]
set ListOfGOWithAcc    [GoGetFromPfam PF09088 GOacc]
set ListOfGOWithName   [GoGetFromPfam PF09088 GOacc,name]
set ListOfGOWithSource [GoGetFromPfam PF09088 GOacc,a.source_db_id]