Phaeodactylum tricornutum
(e-value) |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
humana |
|||||||||||
humana |
|||||||||||
humana |
|||||||||||
P.sojae |
|||||||||||
Al fer el tBLASTn emprant les diferents querys de TR, hem obtingut uns alineaments molt significatius tant pel que fa amb el tBLASTn sense filtres (tBLASTn extès), com afegint-los (tBLASTn amb filtres). A banda de presentar unes E-values molt petits (que ens indiquen que la probabilitat de trobar aquella seqüència per atzar és molt baixa), tots ells s'alinien amb codons TGA, cosa que ens fa pensar que existeix una elevada probabilitat que es tracti de les selenocisteïnes que estem buscant.
Al extreure les regions genòmiques on es troba cada hit i al dur a terme l'Exonerate, observem que en tots els casos trobem la selenocisteïna alineada amb un codó TGA en la penúltima posició de la seqüència. Cal destacar que totes les seqüències que prediu l'Exonerate amb les diferents querys, presenten tres exons i dos introns, excepte pel cas de la query TR1 que prediu dos gens diferents i més petits. Segurament, el motiu pel qual succeeix això és perquè el programa parteix el gen en dues parts. Això ho podem corroborar ja que veiem que els gens que ens prediuen la resta de querys, tenen la mateixa mida i ocupen la mateixa posició al genoma que al unir els dos gens procedents de l'alineament amb la query TR1. A més, al fer el fastatranslate (degut que el programa que executem ens uneix tots els exons), obtenim una sola proteïna que, com comentarem més endavant, correspon a la mateixa proteïna que obtenim amb la resta de querys.
Per altra banda, el GeneWise no dóna un bon alineament de les proteïnes, ja que la selenocisteïna no es troba alineada ni es prediu la mateixa proteïna. Per aquesta raó, a partir d'aquí continuarem amb els resultats que ens proporciona l'Exonerate.
Al realitzar el TCoffee a partir dels resultats obtinguts amb l'Exonerate, podem observar que el grau de similaritat entre les proteïnes procedents de l'Exonerate amb la query corresponent és molt elevat i que a més, en tots els casos s'alinea la selenocisteïna amb un codó TGA. En el cas de la query TR3, s'observa que aquesta presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita amb l'Exonerate. Segurament, el que ha passat és que la Thioredoxin reductase 3 humana, s’ha especialitzat en alguna funció determinada que ve donada per aquest domini i que no trobem en la proteïna predita de P. Tricornutum.
Per saber si les proteïnes obtingudes a partir de l'alineament amb les querys corresponen a la mateixa proteïna, hem mirat en quina regió genòmica es localitzen i hem fet un alineament múltiple (veure) per tal de determinar si presenten homologia entre elles. Com es pot observar, es troben dins la mateixa regió i a més, hem pogut observar un grau d'identitat pràcticament perfecte entre les diferents proteïnes. Per aquest motiu, podem concloure que les quatre proteïnes, corresponen en realitat a la mateixa.
Arribats a aquest punt, per tal de determinar que la selenoproteïna trobada correspon a una proteïna de la família TR, hem fet un BLASTp amb una base de dades no redundant (NCBI). Efectivament, hem pogut comprovar que correspon a una selenoproteïna de la família de les Thioredoxin Reductasesja que tots els alineaments són amb proteïnes d’aquesta família.
Finalment, hem buscat elements SECIS a la regió 3' del gen que codifica per la selenoproteïna trobada i mitjançant el programa SECIS.bash, que inclou el programa SECISearch.pl, no n’hem trobat cap. Degut que això era bastant incoherent, hem volgut corroborar aquest resultat i, per dur-ho a terme, hem buscat una altra vegada els elements SECIS però mitjançant la plana web que conté el software SECISearch. Així doncs, en aquest cas, hem trobat un possible element SECIS mitjançant el patró “Default (ATGA)”, tot i que aquest no es troba a la regió 3’ del gen, sinó que es troba just abans de la seqüència codificant del gen de la selenoproteïna, a uns 1575 nuclèotids 5’ de l'aminoàcid selenocisteïna, que es troba en la penúltima posició de la proteïna en qüestió. Com que el SECIS trobat té una bona qualitat, aquesta troballa ens porta a pensar que aquest genoma pot estar representant un pont entre el regne archaea, que presenta elements SECIS en les regions 5' de les selenoproteïnes, i el regne eucariota, on els elements SECIS es troben en les regions 3' de les selenoproteïnes.