Saprolegnia parasitica
(e-value) |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
humana |
1e-120 |
||||||||||
humana |
3e-122 |
||||||||||
humana |
4e-121 |
||||||||||
P.sojae |
|||||||||||
3e-120 |
Els alineaments que hem obtingut al fer el tBLASTn per a les diferents querys de TR contra el genoma de S.parasitica han estat molt significatius en els cinc casos (veure tBLASTn extès). Al afegir els filtres al tBLASTn també hem obtingut hits significatius a partir de les cinc querys (veure tBLASTn filtres). No obstant, per la query TR de Phytophthora sojae hem hagut d'afegir el paràmetre -F F al tBLASTn (on no es substitueixen les regions de baixa complexitat), ja que sinó no obteníem resultats. Concretament, mitjançant l'aplicació dels filtres, hem obtingut un bon hit on la selenocisteïna de la query s'alinea amb un codó TGA per a cada query excepte per la TR del protista Phytophthora sojae, i un altre hit molt significatiu per, ara sí, cada query, on la selenocisteïna present en aquesta s'alinea amb una glicina (excepte en el cas de TR2, on la selenocisteïna s'alinea amb una cisteïna). Hem decidit agafar els hits en els que la selenocisteïna s'alinea amb una glicina perquè hem observat aquest fet en quatre de les querys i hem pensat que potser tBLASTn ha alineat incorrectament, ja que al costat d'aquestes glicines hi ha sempre una cisteïna, que és l'aminoàcid amb el qual esperaríem que s'alineés la selenocisteïna si ens trobéssim davant d'un homòleg en cisteïna.
Un cop determinats els candidats a selenoproteïnes i homòlegs en cisteïna, hem extret les diferents regions genòmiques on es troba cada hit i hem dut a terme l'Exonerate (veure Exonerate).
Pels hits que s'alineen al tBLASTn amb un codó TGA, aquest programa duu a terme un alineament molt significatiu en el cas de la TR del protista Aerococcus Anophagefferens, on la selenocisteïna de la query es continua alineant amb un codó TGA. Pel que fa TR1, TR2 i TR3, l'Exonerate ens ha reportat dos gens en comptes d'un. En cada cas, el segon gen està alineat també amb un codó TGA. La raó per la qual succeeix això és segurament perquè l'Exonerate parteix el gen que esperaríem trobar en dues parts. Això ho hem suposat perquè hem vist que si unim els dos gens que hem obtingut en cada cas, el gen resultant té la mateixa mida i es troba a la mateixa posició al genoma que el gen que hem obtingut a partir de la query TR del protista Aerococcus Anophagefferens. A més a més, al fer el fastatranslate hem obtingut una sola proteïna, ja que quan s'extreuen els exons, s'extreuen els dels dos gens com si pertanyessin al mateix. Aquestes proteïnes, com veurem més endavant, corresponen a la mateixa proteïna que obtenim amb la query TR del protista Aerococcus Anophagefferens.
Per al hit que s'alinea al tBLASTn amb una glicina o amb una cisteïna en el cas de TR2, l'Exonerate també ha dut a terme alineaments significatius. Com es pot veure en els fitxers adjunts, en el cas de TR1, TR2 i TR3, la selenocisteïna present a cada query s'alinea amb una cisteïna i, en canvi, en el cas de la TR del protista Aerococcus Anophagefferens i la del protista Phytophthora sojae, la selenocisteïna present en les querys es continua alineant amb una glicina. Això ens corrobora la hipòtesis que el tBLASTn ha produït un alineament incorrecte en aquests casos.
També hem realitzat el GeneWise, però en el cas del hit que s'alinea amb un codó TGA en el tBLASTn, en l'alineament produït pel GenWise no s'alinea la selenocisteïna de la query. Per altra banda, en el cas del hit que s'alinea amb una glicina o amb una cisteïna en el tBLASTn, mitjançant l'alineament produït pel GeneWise, aquesta selenocisteïna s'alinea en tots els casos amb una glicina (veure GeneWise). Així doncs, tindrem en compte els resultats de l'Exonerate abans que els del GeneWise.
A continuació hem extret la seqüència exònica de cada regió genòmica mitjançant l'Exonerate i hem obtingut els cDNA i les seqüències aminoacídiques corresponents (veure cDNA i proteïna). Aleshores, per saber si les diferents proteïnes obtingudes a partir de les diferents querys i hits obtinguts corresponen a la mateixa proteïna, hem mirat en quina regió cromosòmica es troben i hem fet un alineament múltiple d'aquestes mitjançant el programa TCoffee (veure). En aquest cas, trobem dos tipus de proteïnes diferents. Una que es troba a la regió gi|288565202|gb|GG743995.1| i que conté una X (corresponent a un codó TGA), i una altra que es troba a la regió gi|288565305|gb|GG743892.1| i que conté una cisteïna o una glicina (segons l'alineament de cada query).
Hem realitzat el TCoffee pels resultats obtinguts amb Exonerate, ja que, com hem comentat, aquest programa ens dóna uns resultats més bons que els de GeneWise. Tal i com es pot observar en els fitxers adjunts, el programa TCoffee ens reporta uns resultats molt significatius ja que el grau de similaritat que presenten entre elles és molt elevat.
Per una banda, podem veure com totes les proteïnes extretes que contenen una X s'alineen amb la X de la query corresponent (veure TCoffe). Això ens indica que la proteïna trobada conté possiblement una selenocisteïna i que, per tant és, probablement, una selenoproteïna. En el cas de la query TR3 humana, s'observa que aquesta presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita amb l'Exonerate. Segurament, el que ha passat és que la Thioredoxin reductase 3 humana, presenta alguna funció determinada que ve donada per aquest domini i que no trobem en la selenoproteïna de S.parasitica.
Per altra banda, podem veure com en totes les altres proteïnes extretes corresponents a l'altre regió cromosòmica, la X de la query s'alinea amb una glicina excepte en el cas de TR2, que s'alinea amb un gap. Com que en l'Exonerate havíem vist que TR1, TR2 i TR3 s'alineaven amb una cisteïna i havíem suposat que l'alineament amb tBLASTn no era correcte i ara hem tornat a veure aquest alineament amb glicines en el TCoffee, hem decidit substituir la X de la query per una cisteïna i veure amb que s'alinea. Duent a terme això hem vist que, efectivament, aquesta cisteïna que hem introduït a la query s'alinea amb una cisteïna en les diferents proteïnes. Per això, hem conclòs que la proteïna trobada en la regió gi|288565202|gb|GG743995.1| és un homòleg en cisteïna.
Un cop fet això, per determinar si les dues proteïnes trobades corresponen a una proteïna de la família de TR, hem dut a terme un BLASTp d'aquestes proteïnes contra una base de dades no redundant (NCBI). Aquesta aplicació ens ha confirmat que tant l'homòleg en cisteïna obtingut corresponent a la regió gi|288565202|gb|GG743995.1| com la selenoproteïna corresponent a la regió gi|288565305|gb|GG743892.1| pertanyen a la família de les Thioredoxin reductases (veure BLASTp).
Per últim, hem buscat elements SECIS a la regió 3' del gen que codifica per la selenoproteïna trobada i n'hem trobat un executant el programa SECIS.bash, que inclou el programa SECISearch.pl. Com es pot veure en el fitxer adjunt, aquest element es troba a uns 105 nucleòtids a partir de l'extrem 3' del gen en concret (veure SECIS).
També hem buscat elements SECIS a la regió 3' de l'homòleg en cisteïna per veure si aquests s'havien conservat. No obstant, no hem trobat SECIS a 3', sinó que n'hem trobat dos a la regió 5' del gen, un a 12816 nucleòtids i un altre a 15581 de l'extrem 5' del gen en qüestió. Això no s'adequa al que esperaríem, de manera que no podem afirmar que aquests elements trobats siguin elements SECIS de l'homòleg en cisteïna obtingut en aquest cas. Així doncs, aquests elements trobats seran segurament falsos positius. Probablement, aquest genoma no ha conservat aquest element perquè no el necessita i, per aquest motiu, no n'hem trobem cap a la regió 3' del gen que codifica per l'homòleg en cisteïna (veure SECIS).