CERCA DE PROTEÏNES HOMÒLOGUES A SELENOPROTEÏNES D'ALTRES ESPÈCIES
Després de realitzar un tBLASTn contra totes les selenoproteïnes de la base de dades de SelenoDB vam observar els següents resultats. En la taula següent observem aquells hits que són més significatius que compleixen amb els criteris de selecció que han estat descrits a l'apartat de materials i mètodes.
ESPÈCIE | PROTEÏNA | CONTIG | SCORE | E-VALUE | IDENTITY (%) | POSICIÓ |
S. cerevisiae | SelR | AANW02001203.1 | 94 | 7e-20 | 30 | 574-984 |
MsrA | 69 | 2e-12 | 40 | 97-552 | ||
C. elegans | SelR | AANW02001203.1 | 120 | 6e-28 | 45 | 580-1002 |
MsrA | AANW02001203.1 | 61 | 7e-10 | 28 | 94-531 | |
eEFSec | AANW02000129.1 | 70 | 5e-12 | 26 | 32502-33374 | |
AANW02001192.1 | 70 | 5e-12 | 26 | 4375-5247 | ||
AANW02002084.1 | 70 | 5e-12 | 26 | 2407-5247 | ||
Anopheles | MsrA | AANW02001203.1 | 70 | 2e-12 | 32 | 97-543 |
Drosophila | SelR | AANW02001203.1 | 120 | 9e-28 | 50 | 628-999 |
MsrA | AANW02001203.1 | 61 | 1e-09 | 29 | 100-543 | |
Eefsec | AANW02000129.1 | 92 | 9e-19 | 24 | 32496-33437 | |
AANW02001192.1 | 92 | 1e-18 | 24 | 4369-5310 | ||
AANW02002084.1 | 92 | 1e-18 | 24 | 2401-3342 | ||
Mus | SelI | AANW02000134.1 | 97 | 3e-20 | 27 | 42874-42119 |
MsrA | AANW02001203.1 | 107 | 1e-23 | 37 | 97-552 | |
Human | SelR3 | AANW02001203.1 | 132 | 2e-31 | 52 | 628-1002 |
SelR2 | AANW02001203.1 | 103 | 1e-22 | 44 | 628-999 | |
SelR1 | AANW02001203.1 | 58 | 1e-09 | 39 | 712-1005 | |
SelI | AANW02000134.1 | 99 | 7e-21 | 27 | 42874-42104 | |
MsrA | AANW02001203.1 | 113 | 2e-25 | 39 | 97-552 | |
eEFSec | AANW02000129.1 | 86 | 1e-16 | 24 | 32481-33290 | |
AANW02001192.1 | 86 | 2e-16 | 24 | 4354-5292 | ||
AANW02002084.1 | 86 | 2e-16 | 24 | 2386-3324 |
eEFSec | SelR | MsrA | SelI |
CERCA DE NOVES SELENOPROTEÏNES
Després de seguir el protocol descrit en materials i mètodes, vam analitzar aquells gens que contenien elements SECIS i que poguessin transcriures en selenoproteïnes. Vam obtenir una gran llista de futurs candidats de gens que podien contenir elements SECIS no obstant, després d'analitzar cas per cas vam observar com els alineaments o bé contenien un e-value molt alt o no contenien l'evidència més significativa per concloure que tractem amb selenocisteïnes: que és l'alineament d'una cisteïna amb una selenocisteïna.
En alguns casos vam veure com s'alineava una cisteïna amb una U, no obstant aquests alineaments contenien moltes regions stop, fet que evidenciava que no tractavem d'una regió gènica. D'altra banda també vam veure un cas on ens alineava una U amb un asterisc, amb regions conservades tant upstream com downstream . No obstant, quan vam agafar el contig que alineava vam veure que hi havia un altre hit amb un altre frame on no hi havia l'alineament (Cys - U) i a més a més presentava un e-value i alinemant millor, fet pel qual que també el vam descartar.
En el nostre cas, que tenim el genoma d'E. invadens fragmentat en múltiples contigs d'una dimensió reduida, la predicció dels gens que contenen elements SECIS es podria veure infravolarada ja que no tenim un genoma lineal i els gens podrien quedar fora o en un altre contig.
Tal i com esperavem vam veure com no ens predia gens que continguessin elements SECIS en els contigs del blast de la primera etapa del nostre treball, ja que no hem trobat selenoproteïnes en el nostre genoma a examinar. No obstant, hem trobat 12 tRNA que codifiquen pel codó de la selenocisteïna (tRNAsec) amb uns scores bastant bons (50-70), fet que ens fa sospitar que realment hi podrien haver selenoproteïnes que no hem pogut predir.