Cryptosporidium muris
(e-value) |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
humana |
|||||||||||
humana |
|||||||||||
humana |
|||||||||||
P.sojae |
|||||||||||
Els alineaments que hem obtingut al fer el tBLASTn per a les diferents querys de TR contra el genoma de C.muris han estat molt significatius en els cinc casos (veure tBLASTn extès). En afegir els dos filtres també hem obtingut hits significatius mitjançant les cinc querys (veure tBLASTn filtres), tot i que per la query TR de Phytophthora sojae hem hagut d'afegir el paràmetre -F F al tBLASTn, ja que sinó no obteníem resultats.
Mitjançant l'aplicació dels filtres, hem obtingut un hit on la selenocisteïna present en la query s'alinea amb una glicina per cadascun dels casos excepte per la TR2 humana, on la selenocisteïna de la query s'alinea amb una cisteïna. Hem decidit agafar els hits en els que la selenocisteïna s'alinea amb una glicina perquè hem observat aquest fet en quatre de les querys i hem pensat que potser el tBLASTn ha alineat incorrectament, ja que al costat d'aquestes glicines hi ha sempre una cisteïna, que és l'aminoàcid amb el qual esperaríem que s'alineés la selenocisteïna si ens trobéssim davant d'un homòleg en cisteïna.
Un cop determinats els candidats a homòlegs en cisteïna, hem extret les diferents regions genòmiques on es troba cada hit i hem dut a terme l'Exonerate (veure Exonerate). Aquest programa duu a terme un alineament molt significatiu en el cas de TR2, on la selenocisteïna de la query es continua alineant amb una cisteïna. En el cas de la TR1, TR3 i TR del protista Aerococcus Anophagefferens, l'Exonerate ens ha reportat dos gens en comptes d'un i en el cas de la TR del protista Phytophthora sojae el programa ens ha reportat tres gens. La raó per la qual succeeix això és segurament perquè l'Exonerate divideix el gen que esperaríem trobar en dues o més parts. Això ho hem suposat perquè hem vist que si unim els diferents gens que hem obtingut en cada cas, el gen resultant té la mateixa mida i es troba a la mateixa posició al genoma que el gen que hem obtingut mitjançant l'Exonerate per la query TR2 humana. A més a més, en fer el fastatranslate hem obtingut una sola proteïna, ja que quan s'extreuen els exons, s'extreuen els de tots els gens reportats per un mateix hit, com si pertanyessin al mateix gen. I aquesta proteïna, com veurem més endavant, correspon a la mateixa proteïna que obtenim amb la query TR2 humana. En TR1, TR2 i TR3, la selenocisteïna present en la query s'alinea amb una cisteïna, mentre que en les TR dels protistes Aerococcus Anophagefferens i Phytophthora sojae s'alinea amb una glicina. Això ens corrobora la hipòtesis que el tBLASTn ha produït un alineament incorrecte en aquests casos, ja que obtenim dos alineaments més on la selenocisteïna de la query s'alinea amb una cisteïna.
També hem realitzat el Genewise, però la selenocisteïna present en la query, s'alinea en tots els casos amb una glicina (veure GeneWise). Així doncs, tindrem en compte els resultats de l'Exonerate.
A continuació hem extret la seqüència exònica de cada regió genòmica mitjançant l'Exonerate i hem obtingut els cDNA i les seqüències aminoacídiques corresponents (veure cDNA i proteïna). Aleshores, per saber si les diferents proteïnes obtingudes a partir de les diferents querys corresponen a la mateixa proteïna, hem mirat a quina regió cromosòmica es localitzen i hem fet un alineament múltiple d'aquestes mitjançant el programa TCoffee (veure). En aquest cas, les cinc proteïnes extretes es troben a la mateixa regió cromosòmica i, a més a més, al fer l'alineament múltiple hem vist que tenen un alt grau d'identitat entre elles, tot i que presenten petites variacions. Per aquesta raó, hem conclòs que les cinc proteïnes corresponen en realitat a la mateixa proteïna.
Hem realitzat el TCoffee pels resultats obtinguts amb l'Exonerate, ja que, com hem comentat, aquest programa ens dóna uns resultats més bons que els de GeneWise. Tal i com es pot observar en els fitxers adjunts, el programa TCoffee ens reporta uns resultats molt significatius, ja que el grau de similaritat entre les proteïnes procedents de l'Exonerate amb la query corresponent, és molt elevat (veure TCoffee).
En les proteïnes extretes a partir de la TR1, TR3 i TR del protista Aerococcus Anophagefferens, la X de la query corresponent s'alinea amb una glicina. En canvi, les proteïnes extretes a partir de la TR2 i la TR del protista Phytophthora sojae, la X de la query s'alinea amb un gap. Com que en l'Exonerate havíem vist que TR1, TR2 i TR3 s'alineen amb una cisteïna i havíem suposat que l'alineament amb tBLASTn no era correcte, i ara hem tornat a veure un alineament amb glicines i gaps en el TCoffee, hem decidit substituir la X de la query per una cisteïna i veure amb què s'alinea. Duent a terme això, hem vist que efectivament, aquesta cisteïna que hem introduït en la query s'alinea amb una cisteïna en les diferents proteïnes. Per això, hem conclòs que la proteïna trobada és probablement un homòleg en cisteïna. En el cas de la query TR3, s'observa que presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita corresponent amb l'Exonerate. Segurament, el que ha passat és que la Thioredoxin reductase 3 humana, presenta alguna funció determinada que ve donada per aquest domini i que no trobem a la selenoproteïna de C.muris.
Un cop fet això, per determinar que la proteïna trobada correspon a una proteïna de la família de TR, hem dut a terme un BLASTp d'aquesta proteïna contra una base de dades no redundant (NCBI). Aquesta aplicació ens ha confirmat que la proteïna obtinguda correspon a una proteïna de la família Thioredoxin reductase, concretament ens reconeix com a primera opció una Thioredoxin reductase de C. muris que prèviament ja s’havia trobat al seqüenciar el genoma d’aquest protista. Per tant, això ens corrobora que hem trobat un homòleg en cisteïna de la família TR.
Finalment, hem buscat elements SECIS mitjançant el programa SECIS.bash, que inclou el programa SECISearch.pl. a la regió 3' del gen que codifica per l'homòleg en cisteïna i no n'hem trobat cap. Això ja concorda amb els nostres resultats, ja que l'homòleg en cisteïna no presenta cap selenocisteïna i, per tant, no necessita tenir elements SECIS al seu genoma per recodificar el codó TGA. No obstant, ens hem volgut assegurar que aquest genoma no conté un element SECIS que s'ha conservat i hem fet una cerca mitjançant la plana web que incorpora el software SECISearch. En aquest cas, utilitzant el patró “Loose (canonical and no canonical)”, hem trobat un element SECIS potencial (veure SECIS). Però, com es pot veure en els fitxers adjunts, aquest element es troba a uns 5953 nucleòtids de l'extrem 3' del gen en concret. Normalment, els elements SECIS es troben a pocs nucleòtids de l'extrem 3' dels gens que codifiquen per a selenoproteïnes, per la qual cosa podem concloure que aquest protista no conté cap element SECIS per l'homòleg en cisteïna trobat i que el que hem trobat mitjançant SECISearch és un fals positiu (veure SECIS).