Difference between revisions of "OrthoInspector"

From Wikili
Jump to: navigation, search
Line 15: Line 15:
 
#* un protéome est un fichier fasta dont le nom est du style UP000005640_9606.fasta. On y voit 9606 car c'est celui de Homo sapiens
 
#* un protéome est un fichier fasta dont le nom est du style UP000005640_9606.fasta. On y voit 9606 car c'est celui de Homo sapiens
 
# Comment gérer tous les noms des organismes ?  
 
# Comment gérer tous les noms des organismes ?  
#* Le petit nom (que j'appelle '''OiCoded''') d'un organisme dépend de son nom bien sûr mais aussi du domaine et des noms des autres pour ne pas avoir de doublons  
+
#* Le petit nom (que j'appelle '''OiCode''') d'un organisme dépend de son nom bien sûr mais aussi du domaine et des noms des autres pour ne pas avoir de doublons  
 
#* Pour ne pas avoir de noms farfelus et surtout pour ne pas avoir de noms trop longs j'ai mis en place les procédures '''OiCode''' et '''OIDomain''' ... et '''OiCodeForOiDomain'''
 
#* Pour ne pas avoir de noms farfelus et surtout pour ne pas avoir de noms trop longs j'ai mis en place les procédures '''OiCode''' et '''OIDomain''' ... et '''OiCodeForOiDomain'''
 
#* '''OiCode''' quand on l'appelle la première fois (supposons être dans Bacteria par ex) :
 
#* '''OiCode''' quand on l'appelle la première fois (supposons être dans Bacteria par ex) :
Line 22: Line 22:
 
#*#* BVerbaC sera son petit nom (B comme Bacteria, Verba comme Verrucomicrobia bacterium et s'il a d'autre homonymes, C parce que lui c'est le 3eme. Sinon on ne rajoute pas de lettre)
 
#*#* BVerbaC sera son petit nom (B comme Bacteria, Verba comme Verrucomicrobia bacterium et s'il a d'autre homonymes, C parce que lui c'est le 3eme. Sinon on ne rajoute pas de lettre)
 
#*#* BVerbaC_Verrucomicrobia_bacterium_L21-Fru-AB_1609981 sera le nom du fichier fasta avec le TaxId à la fin après le _ (important pour la suite)
 
#*#* BVerbaC_Verrucomicrobia_bacterium_L21-Fru-AB_1609981 sera le nom du fichier fasta avec le TaxId à la fin après le _ (important pour la suite)
#*# range le fasta dasn ./NotaBene
+
#*# range le fasta dans ./NotaBene
 +
#*# En fait une fois que le NotaBene est rempli OiCOde sert tout le temps après pour avoir la liste de OS ou OX etc.
 
#* '''OiDomain''' permet d'interroger le domaine ou de le positionner.
 
#* '''OiDomain''' permet d'interroger le domaine ou de le positionner.
 
#** si le projet Gscope est défini comme étant OnTraiteLike BacteriaProteome (voir beton/miniconfig) OiDomain rend Bacteria (ou Virus ou Qfo, etc...)
 
#** si le projet Gscope est défini comme étant OnTraiteLike BacteriaProteome (voir beton/miniconfig) OiDomain rend Bacteria (ou Virus ou Qfo, etc...)
 
#** OiDomain est souvent appelé, entre autres par OiCode puor savoir dans quel domain on est.
 
#** OiDomain est souvent appelé, entre autres par OiCode puor savoir dans quel domain on est.
 
#* Si on est dans un projet quelconque on peut forcer le domain en utilisant '''OiCodeForDomain''' Bacteria :)
 
#* Si on est dans un projet quelconque on peut forcer le domain en utilisant '''OiCodeForDomain''' Bacteria :)

Revision as of 22:04, 23 January 2018

OrthoInspector

Initialement développé par Benjamin Linard, repris par Yannis Nevers. Je (Raymond) ne parlerai ici que de ce qui concerne Gscope et la gestion des organismes pour les projets Archaea, Bacteria, Eukaryota, Qfo, Transverse et Virus.

La manière de gérer OrthonInspector a vraiment beaucoup changé depuis 2016, Yannis avait fait ses protéomes et je les intégrais au fur et à mesure. Fin 2016 on a lancé les 10 000 000 de blast sur la grille pour les Eucaryotes. Après on a recommencé mais on ne prenant pas tout le monde ... il a fallu nommer les organismes, etc.

Comment ça marche

 voir la proc OiMiseEnPlace dans gscope_orthoinspector.tcl
  1. Yannis crée les protéomes dans /genomics/link/OrthoInspector_Proteomes/
    • ./Archaea ./Bacteria ./Eukaryota ./Qfo ./Transverse ./Virus
    • Ces répertoires correspondent à ce qui est appelé OiDomain dans Gscope (voir plus loin)
    • Yannis y dépose les protéomes de chaque organisme
    • un protéome est un fichier fasta dont le nom est du style UP000005640_9606.fasta. On y voit 9606 car c'est celui de Homo sapiens
  2. Comment gérer tous les noms des organismes ?
    • Le petit nom (que j'appelle OiCode) d'un organisme dépend de son nom bien sûr mais aussi du domaine et des noms des autres pour ne pas avoir de doublons
    • Pour ne pas avoir de noms farfelus et surtout pour ne pas avoir de noms trop longs j'ai mis en place les procédures OiCode et OIDomain ... et OiCodeForOiDomain
    • OiCode quand on l'appelle la première fois (supposons être dans Bacteria par ex) :
      1. crée le répertoire /genomics/link/OrthoInspector_Proteomes/Bacteria/NotaBene
      2. donne un petit nom (d'où le OiCode) à chaque organisme et nomme aussi le fichier qui contiendra le protéome en fasta :
        • BVerbaC sera son petit nom (B comme Bacteria, Verba comme Verrucomicrobia bacterium et s'il a d'autre homonymes, C parce que lui c'est le 3eme. Sinon on ne rajoute pas de lettre)
        • BVerbaC_Verrucomicrobia_bacterium_L21-Fru-AB_1609981 sera le nom du fichier fasta avec le TaxId à la fin après le _ (important pour la suite)
      3. range le fasta dans ./NotaBene
      4. En fait une fois que le NotaBene est rempli OiCOde sert tout le temps après pour avoir la liste de OS ou OX etc.
    • OiDomain permet d'interroger le domaine ou de le positionner.
      • si le projet Gscope est défini comme étant OnTraiteLike BacteriaProteome (voir beton/miniconfig) OiDomain rend Bacteria (ou Virus ou Qfo, etc...)
      • OiDomain est souvent appelé, entre autres par OiCode puor savoir dans quel domain on est.
    • Si on est dans un projet quelconque on peut forcer le domain en utilisant OiCodeForDomain Bacteria :)