Capsaspora owczarzaki

Query	tBLASTn extès	tBLASTn filtres	Hits (e-value)	Exonerate	Localització dels exons	cDNA	Proteïna	GeneWise	TCoffee	BLASTp	Elements SECIS
TR1 humana	Veure	Veure	7e-134	Veure	Veure	Veure	Veure	Veure	Exonerate GeneWise	Exonerate GeneWise	Veure Veure Imatge Imatge Imatge Imatge Imatge
TR2 humana	Veure	Veure	6e-128	Veure	Veure	Veure	Veure	Veure	Exonerate GeneWise	Exonerate GeneWise	Veure Veure Imatge Imatge Imatge Imatge Imatge
TR3 humana	Veure	Veure	3e-141	Veure	Veure	Veure	Veure	Veure	Exonerate GeneWise	Exonerate GeneWise	Veure Veure Imatge Imatge Imatge Imatge Imatge
TR P.sojae	Veure	Veure	4e-114	Veure	Veure	Veure	Veure	Veure	Exonerate GeneWise	Exonerate GeneWise	Veure Veure Imatge Imatge Imatge Imatge Imatge
TR A.Anophagefferens	Veure	Veure	1e-88	Veure	Veure	Veure	Veure	Veure	Exonerate GeneWise	Exonerate GeneWise	Veure Veure Imatge Imatge Imatge Imatge Imatge

Al fer el tBLASTn emprant les diferents querys de TR1, TR2 i TR3 humanes i TR del protista Aerococcus Anophagefferens hem obtingut uns alineaments molt significatius, tant pel que fa amb el tBLASTn sense filtres (tBLASTn extès), com afegint-los (tBLASTn amb filtres). En el cas de l'alineament amb la query TR de Phytopthora sojae obtenim un bon hit al fet el tBLASTn, però en afegir els filtres perdem aquest hit. Per aquest motiu, hem aplicat el -F F al tBLASTn (on no es substitueixen les regions de baixa complexitat). Tots ells s'alineen amb codons TGA, cosa que ens fa pensar que existeix una elevada probabilitat que es tracti de les selenocisteïnes que estem buscant.

A continuació hem acotat la regió on s'alinea el genoma amb la nostra query, i utilitzant el programa Exonerate hem pogut observar els diferents alineaments i que les selenocisteïnes de les querys es segueixen alineant amb un codó TGA. No obstant, l'Exonerate ens segmenta el gen en dues parts segurament per un error del programa, excepte pel cas de la query T3. Tot i així, tal com hem comentat en altres casos, això no ens suposa cap problema ja que en fer el fastatranslate obtenim una sola proteïna (en realitat 6 degut als diferents marcs de lectura), ja que quan s'extreuen els exons s'extreuen els dels dos gens, com si formessin part del mateix (que és el que passa en realitat).

Per altra banda, el GeneWise no dóna un bon alineament de les proteïnes, ja que la selenocisteïna no es troba alineada i ni tan sols prediu la mateixa proteïna. Per aquesta raó, a partir d'aquí continuarem amb els resultats que ens proporciona l'Exonerate.

Mitjançant el programa TCoffee, obtenim uns resultats molt significatius, ja que observem un alt grau de similaritat entre les proteïnes procedents de l'Exonerate amb la query corresponent, i a més a més, en tots els casos s'alinea la selenocisteïna. Tot i així, per la query T3, s'observa que aquesta presenta un domini a l'inici de la seqüència que no s'alinea gens amb la proteïna predita amb l'Exonerate. Segurament, el que ha passat és que la Thioredoxin reductase 3 humana, presenta alguna funció determinada que ve donada per aquest domini i que no trobem en la proteïna predita de C. Owczarzaki.

Aleshores, per tal de determinar si les proteïnes obtingudes a partir de l'alineament amb les querys corresponen a la mateixa proteïna, hem mirat en quina regió genòmica es localitzen i hem fet un alineament múltiple (veure) per tal de determinar quin grau d’homologia presenten entre elles. Com es pot observar, es troben dins la mateixa regió i es dóna un grau d'identitat pràcticament perfecte entre les diferents proteïnes. Per aquest motiu, podem concloure que les cinc proteïnes predites corresponen en realitat a la mateixa selenoproteïna.

Per determinar si la selenoproteïna que hem trobat pertany a la família TR, hem realitzat un BLASTp amb una base de dades no redundant (NCBI), i el que hem obtingut és que ens reconeix com a primera opció una Thioredoxin reductase de C. Owczarzaki que prèviament ja s’havia trobat en seqüenciar el genoma d’aquest protista. Per tant, això ens corrobora que ens trobem davant la selenoproteïna TR que buscàvem inicialment.

Finalment, hem buscat elements SECIS a la regió 3' del gen que codifica per la selenoproteïna trobada i, mitjançant el programa SECIS.bash, que inclou el programa SECISearch.pl, no n'hem trobat en aquesta regió, sinó que hem trobat un element SECIS potencial a 5', exactament a uns 16000 nucleòtids del gen en concret. Aquest és un fet inusual i, per aquest motiu, hem volgut corroborar aquesta troballa utilitzant la plana web que conté el software SECISearch. En aquest cas, utilitzant el patró “Loose (canonical and no canonical)”, hem trobat el mateix element SECIS i quatre més que també es troben a la regió 5' del gen. Entre aquests, hi ha un element SECIS que es troba a 555 nucleòtids de la regió 5' de la selenoproteïna trobada (veure SECIS). Tot i això, aquest element SECIS no és de gaire qualitat, pel que podem arribar a la conclusió que el software SECISearch no està trobant l'element SECIS real, ja que els elements SECIS en eucariotes es troben a pocs nucleòtids de l'extrem 3' del gen que codifica per la selenoproteïna.

Veure altres resultats