SelenoproteinsThioredoxinReductase
Recerca en genomes de protistes
B. bovis
Query | A. anophagefferensTR1 humà |
cDNA | Visualitza |
BLAST | A. anophagefferens TR1 humà | Proteïna | Visualitza |
Exonerate | Visualitza | TCoffee | Visualitza |
GFF | Visualitza | Secis | - |
GeneWise | Visualitza | - | - |
Els alineaments que resulten del tBLASTn de TR de A.anophagefferens (query) i el genoma d'aquest protista són molt significatius, tal i com podem veure al fitxer adjunt.
El primer hit que varem analitzar és el corresponent al scaffold gi|154796031|gb|AAXT01000005.1|; que té un E-value de 1e-107, tot i que no trobem la selenocisteïna de la query alineada correctament, sinó que la trobem alineada amb una glicina. Sabem, però, que és molt poc probable que existeixin homòlegs en glicina de TR i que, possiblement, es tractés d'un error del programa al reconèixer la selenocisteïna com a codó stop, no seguís recorrent el genoma i, per tant, aliniés la selenocisteïna de manera errònia. Vam deduir que l'alineament no estava incloent la regió final de la proteïna que potencialment devia contenir la selenocisteïna o la cisteïna homòloga i per això vam allargar el final de l'alineament amb el programa ExPASy amb el qual vàrem veure que el final real de la proteïna es troba a 4 a.a i que la selenocisteïna hauria d'alinear amb la cisteïna que trobem a tres a.a.
Per determinar que realment es tractava d'una proteïna de la família TR vam procedir a l'extracció de la proteïna i a la seva introducció a una base de dades no redundant (nr database; NCBI) per tal de realitzar un BLASTp. Aquesta aplicació ens va confirmar que es tractava d'una Thioredoxin reductase homòloga en cisteïna.
Amb l'objectiu d'extreure la proteïna completa, es va modificar l'arxiu GFF extenent la seqüència 12 nucleòtids més, per tal d'incloure tots els aminoàcids abans del codó stop, i per tant, incloent també la cisteïna homòloga.
A l'hora de realitzar un T_coffee amb la query utilitzada per fer el tBLASTn, però, seguim veien un alineament entre la selenocisteïna (X) i una glicina. Si ens fixem bé en l'alineament, tot sembla indicar que per un seguit de glicines seguides pot haver-hi un error per part del programa a l'hora d'introduir un gap i, per aquest motiu, no hi ha un alineament entre la cisteïna indicada com a homòloga de la selenocisteïna.
El segon hit estudiat va ser el corresponent a gi|154797556|gb|AAXT01000002.1| on també tenim un E-value significatiu (4e-11) però en el qual no s'alineava la Sec. Després d'extreure la proteïna vàrem fer un BLASTp contra una base de dades no redundant, i vàrem veure que no es tractava d'una proteïna de la família TR, sinó d'una dihydrolipoamide dehydrogenasa (no es tracta d'una selenoproteïna). La raï per la qual obteníem un hit significatiu és perquè aquestes dues proteïnes tenen dominis conservats entre elles.
Aixï, vàrem concloure que no calia mirar els altres hits significatius, ja que estaven causats pel mateix fenomen.
Tornar enrera