--> Selenoproteines_TR_Fep15
*/

Cryptosporidium parvum

Query
tBLASTn extès
tBLASTn filtres
Hits
(e-value)
Exonerate
Localització dels exons
cDNA
Proteïna
GeneWise
TCoffee
BLASTp
Elements SECIS
TR1
humana
Veure
Veure
1e-112
Veure
Veure
Veure
Veure
Veure
Exonerate

GeneWise
Exonerate

GeneWise
Veure

Imatge
TR2
humana
Veure
Veure
-
-
-
-
-
-
-
-
-
TR3
humana
Veure
Veure
3e-110
Veure
Veure
Veure
Veure
Veure
Exonerate

GeneWise
Exonerate

GeneWise
Veure

Imatge
TR
P.sojae
Veure
Veure
1e-121
Veure
Veure
Veure
Veure
Veure
Exonerate

GeneWise
Exonerate

GeneWise
Veure

Imatge
TR A.Anophagefferens
Veure
Veure
5e-113
Veure
Veure
Veure
Veure
Veure
Exonerate

GeneWise
Exonerate

GeneWise
Veure

Imatge



Els alineaments que hem obtingut al fer el tBLASTn per a les diferents querys de TR contra el genoma de C.parvum han estat molt significatius en els cinc casos (veure tBLASTn extès). No obstant, al afegir els dos filtres al tBLASTn, només hem obtingut hits significatiusper quatre de les querys (veure tBLASTn filtres). A més, per la query TR de Phytophthora sojae hem hagut d'afegir el paràmetre -F F al tBLASTn, ja que sinó no obteníem resultats.

Mitjançant l'aplicació dels filtres, per la query TR1 hem obtingut un hit on la selenocisteïna present en la query s'alinea amb una cisteïna. Per la query TR2 no hem obtingut cap hit i per les querys TR3, TR del protista Aerococcus Anophagefferens i TR del protista Phytophthora sojae, hem obtingut un hit en cada cas on la selenocisteïna present en les querys s'alinea amb una glicina. Hem decidit agafar els hits en els que la selenocisteïna s'alinea amb una glicina perquè hem observat aquest fet en tres de les querys i hem pensat que potser el tBLASTn ha alineat incorrectament, ja que al costat d'aquestes glicines hi ha sempre una cisteïna, que és l'aminoàcid amb el qual esperaríem que s'alineés la selenocisteïna.

Un cop determinats els candidats a homòlegs en cisteïna, hem extret les diferents regions genòmiques on es troba cada hit i hem dut a terme l'Exonerate (veure Exonerate). Aquest programa ens ha reportat dos gens en comptes d'un en tots els hits que hem alineat amb les querys corresponents. La raó per la qual succeeix això és segurament perquè l'Exonerate parteix el gen que esperaríem trobar en dues parts. Això ho hem suposat perquè hem vist que si unim els dos gens que hem obtingut en cada cas, el gen resultant dóna lloc a una proteïna mitjançant fastatranslate que s'alinea correctament amb la query al fer el TCoffee com veurem més endavant. En el cas de TR1 i TR3, la selenocisteïna present en la query s'alinea amb una cisteïna, mentre que en les TR dels protistes Aerococcus Anophagefferens i Phytophthora sojae s'alinea amb una glicina. Això ens corrobora la hipòtesis que el tBLASTn ha produït un alineament incorrecte, ja que obtenim un alineament més respecte abans on la selenocisteïna de la query s'alinea amb una cisteïna.

També hem realitzat el GeneWise, però la selenocisteïna s'alinea en tots els casos amb una glicina (veure GeneWise). Així doncs, tindrem en compte els resultats de l'Exonerate.

A continuació hem extret la seqüència exònica de cada regió genòmica mitjançant l'Exonerate i hem obtingut els cDNA i les seqüències aminoacídiques corresponents (veure cDNA i proteïna). Aleshores, per saber si les diferents proteïnes obtingudes corresponen en realitat a la mateixa proteïna, hem mirat en quina regió cromosòmica es troben i hem fet un alineament múltiple d'aquestes mitjançant el programa TCoffee (veure). En aquest cas, les quatre proteïnes extretes es troben a la mateixa regió cromosòmica i, a més a més, al fer l'alineament múltiple hem vist que tenen un alt grau de d'identitat entre elles, tot i que presenten alguna petita variació. Per aquesta raó, hem conclòs que les quatre proteïnes corresponen en realitat a la mateixa proteïna.

Hem realitzat el TCoffee pels resultats obtinguts amb Exonerate, ja que, com hem comentat, aquest programa ens dóna uns resultats més bons que els de GeneWise. Tal i com es pot observar en els fitxers adjunts, el programa TCoffee ens reporta uns resultats molt significatius, ja que el grau de similaritat entre les proteïnes procedents de l'Exonerate amb la query corresponent, és molt elevat (veure TCoffee).

En totes les proteïnes extretes, la selenocisteïna de la query corresponent s'alinea amb una glicina, excepte en el cas de la proteïna extreta a partir de TR1, on la selenocisteïna de la query s'alinea amb un gap.

Com que en l'Exonerate havíem vist que TR1 i TR3 s'alineen amb una cisteïna i havíem suposat que l'alineament amb el tBLASTn no era correcte, i a més, ara hem tornat a veure alineaments amb glicines i gaps en el TCoffee, hem decidit substituir la selenocisteïna de la query per una cisteïna i veure amb què s'alinea. Al fer això hem vist que, efectivament, aquesta cisteïna que hem introduït en la query s'alinea amb una cisteïna en les diferents proteïnes. D'aquesta manera, hem arribat a la conclusió que la proteïna trobada és probablement un homòleg en cisteïna. En el cas de la query TR3, s'observa que aquesta presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita corresponent amb l'Exonerate. Segurament, el que ha passat és que la Thioredoxin reductase 3 humana presenta alguna funció determinada que ve donada per aquest domini i que no trobem en la selenoproteïna de C.parvum.

Un cop fet això, per determinar que la proteïna trobada correspon a una proteïna de la família de TR, hem dut a terme un BLASTp d'aquesta proteïna contra una base de dades no redundant (NCBI). Aquesta aplicació ens ha confirmat que la proteïna obtinguda correspon a una proteïna de la família Thioredoxin reductase, concretament ens reconeix com a primera opció una Thioredoxin reductase de C. parvum que prèviament ja s’havia trobat al seqüenciar el genoma d’aquest protista. Per tant, això ens corrobora que hem trobat un homòleg en cisteïna de la família TR.

Per últim, hem buscat elements SECIS mitjançant el programa SECIS.bash, que inclou el programa SECISearch.pl. a la regió 3' del gen que codifica per l'homòleg en cisteïna i no n'hem trobat cap. Això ja concorda amb els nostres resultats, ja que l'homòleg en cisteïna no presenta cap selenocisteïna i, per tant, no necessita tenir elements SECIS per recodificar el codó TGA. No obstant, ens hem volgut assegurar que aquest genoma no conté un element SECIS que s'hagués pogut conservar i hem fet una cerca mitjançant la plana web que incorpora el software SECISearch. En aquest cas, utilitzant el patró “Loose (canonical and no canonical)”, hem trobat un element SECIS potencial (veure SECIS). Però, com es pot veure en els fitxers adjunts, aquest element es troba a uns 14016 nucleòtids de l'extrem 3' del gen en concret. Normalment, els elements SECIS es troben a pocs nucleòtids de l'extrem 3' dels gens que codifiquen per a selenoproteïnes, per la qual cosa podem concloure que aquest protista no conté cap element SECIS per l'homòleg en cisteïna trobat i que el que hem trobat mitjançant SECISearch és un fals positiu (veure SECIS).