Material i Mètodes
Automatitzacions
Alhora de fer l'anotació en el genoma de les selenoproteïnes, hem utilitzat una sèrie de programes en llenguatge Bash i Perl per automatitzar els diferents passos a seguir en la cerca de les selenoproteïnes.
Primerament cal usar la comanda d'unix mkdir per a crear tot un seguit de directoris:
- - Llibreria
- - output_blast
- - prova
- - subseq
- - regions
- - translations
- - output_exonerate
- - genewise
- - t_coffee_e
Programes
Cal donar-los permís d'execució amb la comanda chmod u+x d'Unix. Per tal de veure el programa més detalladament, cliqueu el títol.
Usant el programa canvi.pl, canvia automàticament les U (abreviatura de l'a selenocisteïna) per X. és un pas necessari perquè hi ha programes que no poden treballar amb Us.
El programa requereix que les querys estiguin dins la carpeta Llibreria i ,alhora, que els programes canvi.pl i canvi.sh tinguin permís de execució.
Aquest programa és l'automatització d'un tBLASTn de cada seqüència proteica que es trobi a la carpeta Llibreria contra el genoma de Chrysochloris asiatica. El output del programa es guarda en el directori output_blast, i a més, també es crea un fitxer anomenat resultats_blast.txt que conté els hits adjuntant scaffolds repetitius, aquest fitxer conté la llista dels hits amb el scaffold on es troben i la posició o start des d'on comença a extreure la subseqüència .
El programa requereix que les querys estiguin dins de la carpeta Llibreria. I també, que els programes autoblast.sh i hits.pl tinguin permís de execució.
Aquest programa crea un fitxer per cada hit dins de l'arxiu resultats_blast.txt i els guarda a la carpeta prova. Només requereix el permís d'execució del propi programa i l'arxiu resultant d'executar el programa anterior.
Aquest programa extreu la subseqüència desitjada per cada hit, començant 50.000 abans de l'inici determinat pel tBLASTn i ho allarga 300.000. A més, té certs mecanismes per corregir possibles errors com que estigui massa aprop del final del scaffold i no pugui agafar els 300.000 nucleòtids. La subseqüència es guarda a la carpeta subseq i la regió a la carpeta regions.
El programa requereix que els hits es trobin a la carpeta prova i el permís d'execució dels programes linia.pl i autoextracció.sh.
Aquest programa el que fa és un exonerate exhaustiu de tots els hits obtinguts pel tBLASTn en les regions genòmiques delimitades en la carpeta subseq i tradueix les prediccions a proteïnes.
La traducció a proteïna queda emmagatzemada a la carpeta translations, el cDNA de la proteïna a la carpeta cDNA i el resultat de l'exonerate a la carpeta output_exonerate. El programa requereix la carpeta subseq amb els resultats del fastasubseq i la carpeta Llibreria amb les nostres querys. I els permisos d'execució dels programes fastaseqfromGFF.pl i del mateix Autoexonerate.sh. Aquest programa permet obtenir unes prediccions de gens mitjançant l'ús del Genewise. Els resultats del Genewise s'emmagatzemen a la carpeta Genewise. El programa requereix la carpeta subseq amb els resultats del fastasubseq i la carpeta Libreria amb les nostres querys. I els permís d'execució del mateix programa. Aquest programa realitza uns alineamets globals entre les seqüències peptídiques del exonerate i les nostres querys originals. El resultats te'ls ubica a la carpeta t_coffee_e. Requereix que les nostres proteïnes predites estiguin traduïdes a la carpeta translations i el permís d'execució del programa.