Travaux pratiques de programmation du mardi 23 janvier 2018. Blast.
On se propose d'écrire les procédures qui permettent de lancer un blast sur une séquence protéique et de traiter le résultat.
*** voir les explications détaillées ***
Le programme principal Blabla.tcl demande le nom du fichier FASTA à blaster.
Les procédures se trouvent dans Blabla_Procedures.tcl
Il faut créer
- une procédure DoBlast qui lance le programme blast du fichier FASTA en exec sur la banque /blast/sprot
- une procedure LesAccessExpectTrouves qui retourne la liste des access et des expect des protéines présentes dans le blast
il faut aller jusqu'à
Sequences producing significant ...
puis prendre le premier et dernier mot
ce jusqu'à trouver un chevron >
- une procédure OrganismesPresents qui rend les organismes ayant un expect < 0.001
Exécution du blast en ligne de commande :
(si la commande blastall est inconnue tapez setncbi )
blastall -p blastp -d /blast/sprot -i FichierFasta -o FichierBlast
Pour executer cette commande à partir de Tcl il suffit de faire
exec blastall -p blastp -d /blast/sprot -i FichierFasta -o FichierBlast
Pour OrganismesPresents :
on pourra se servir de la procédure EmblFromUniprot Access qui rend la fiche EMBL de l'access Access
Attention si les hits sont de la forme sp|Q91G88|006L_IIV6 Putative KilA-N domain-containing protein ...
on utilisera EmblFromUniprot Q91G88
L'organisme de la fiche EMBL peut s'extraire par
regexp {\nOS ([^\n]+)\n} $Texte Match Orga
set Orga [string trim $Orga "."]
Raymond Ripp