Travaux pratiques de programmation du mardi 23 janvier 2018. Blast.

   On se propose d'écrire les procédures qui permettent de lancer un blast sur une séquence protéique et de traiter le résultat.

   *** voir les explications détaillées ***

   Le programme principal Blabla.tcl demande le nom du fichier FASTA à blaster.
   
   Les procédures se trouvent dans Blabla_Procedures.tcl

   Il faut créer 
   
     - une procédure DoBlast qui lance le programme blast du fichier FASTA en exec sur la banque /blast/sprot
     - une procedure LesAccessExpectTrouves qui retourne la liste des access et des expect des protéines présentes dans le blast
            il faut aller jusqu'à 
            Sequences producing significant ...
            puis prendre le premier et dernier mot
            ce jusqu'à trouver un chevron >
            
            
     - une procédure OrganismesPresents qui rend les organismes ayant un expect < 0.001
   
   
   Exécution du blast en ligne de commande : 
      (si la commande blastall est inconnue tapez  setncbi )
       blastall -p blastp -d /blast/sprot -i FichierFasta -o FichierBlast 
   
   Pour executer cette commande à partir de Tcl il suffit de faire 
   exec blastall -p blastp -d /blast/sprot -i FichierFasta -o FichierBlast
   
   Pour OrganismesPresents : 
      on pourra se servir de la procédure EmblFromUniprot Access qui rend la fiche EMBL de l'access Access
      Attention si les hits sont de la forme sp|Q91G88|006L_IIV6 Putative KilA-N domain-containing protein ... 
         on utilisera  EmblFromUniprot Q91G88
      L'organisme de la fiche EMBL peut s'extraire par
        regexp {\nOS   ([^\n]+)\n} $Texte Match Orga
        set Orga [string trim $Orga "."]  

   
                 Raymond Ripp