Hyaloperonospora arabidopsidis
(e-value) |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
humana |
|||||||||||
humana |
|||||||||||
humana |
|||||||||||
P.sojae |
|||||||||||
Al fer el tBLASTn emprant les querys de TR1, TR2 i TR3 humanes i TR del protista Aerococcus Anophagefferens, hem obtingut uns alineaments molt significatius, tant pel que fa amb el tBLASTn sense filtres (tBLASTn extès), com afegint-los (tBLASTn amb filtres). En el cas de l'alineament amb la query TR de Phytopthora sojae obtenim un bon hit al fet el tBLASTn, però al afegir els filtres perdem aquest hit. Per aquest motiu, hem aplicat el -F F al tBLASTn (on no es substitueixen les regions de baixa complexitat). A més a més, tots els hits s'alineen amb codons TGA, cosa que ens fa pensar que existeix una elevada probabilitat que es tracti de les selenocisteïnes que estem buscant.
Un cop determinats els candidats a selenoproteïnes, hem extret les diferents regions genòmiques on es troba cada hit i hem dut a terme l'Exonerate. Com podem veure als fitxers adjunts, aquest programa ens reporta un alineament molt significatiu, on la selenocisteïna de la query es continua alineant amb un codó TGA en els cinc casos.
A continuació, hem executat el GeneWise però n'hem descartat els valors perquè estaven pitjor alineats que en l’Exonerate i a més la selenocisteïna no es trobava en l’alineament.
Al realitzar el TCoffee, podem observar que en totes les proteïnes s’alinea la X de la proteïna del genoma de H. Arabidopsidis amb la X de la query. Això ens indica que la proteïna conté probablement una selenocisteïna i que per tant, és una selenoproteïna. L’alineament que presenta més similaritat és el de la query del protista P. sojae, ja que és l’organisme filogenèticament més proper a H. Arabidopsidis. No obstant, la resta d’alineaments presenten una similaritat bastant notable. En el cas de l’alineament amb la query TR3 humana s'observa que aquesta presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita amb l'Exonerate. Això, segurament és degut al fet que la Thioredoxin reductase 3 humana presenta alguna funció determinada que ve donada per aquest domini i que no trobem en la selenoproteïna de H. Arabidopsidis.
Per determinar si les diferents proteïnes obtingudes a partir de les querys corresponen a la mateixa proteïna, hem mirat en quina regió cromosòmica es localitzen i hem fet un alineament múltiple d'aquestes mitjançant el programa TCoffee (veure). En aquest cas, les cinc proteïnes extretes es troben a la mateixa regió cromosòmica i, a més a més, al fer l'alineament múltiple hem vist que presenten un alt grau d’identitat entre elles. Per aquesta raó, hem conclòs que les cinc proteïnes corresponen en realitat a la mateixa proteïna.
Un cop fet això, per assegurar-nos que la selenoproteïna trobada correspon a una proteïna de la família de TR, hem dut a terme un BLASTp d'aquesta proteïna contra una base de dades no redundant (NCBI). Aquesta aplicació ens ha confirmat que la selenoproteïna obtinguda correspon a una proteïna de la família de les Thioredoxin reductases (veure BLASTp).
Per últim, hem buscat elements SECIS a la regió 3' del gen que codifica per la selenoproteïna trobada i n'hem trobat un executant el programa SECIS.bash, que inclou el programa SECISearch.pl. Com es pot veure en el fitxer adjunt, aquest element es troba a uns 160 nucleòtids a partir de l'extrem 3' del gen en concret (veure SECIS).