- Sel T
Antes de empezar la búsqueda de SelT, recopilamos seis queries, dos de las cuales eran proteínas homólogas a SelT (con cisteína).
A partir de los resultados del tBLASTn (queries vs. cada genoma protista), seleccionamos de cada genoma aquellos alineamientos que cumplieran las siguientes características: se encontraran alineamientos de un mismo contig con diversas queries, la pauta de lectura coincidiera entre todos ellos, que el e-value fuera inferior a 0,5 y que tuvieran la U o C de la query alineada con una C o un codón de parada.
Los 4 protistas candidatos a tener SelT fueron: G. intestinalis, P. sojae, T. pseudonana y T.cruzi. En el genoma de este último encontramos el mismo alineamiento en dos contigs diferentes.
A continuación procedimos a la obtención de la alineación teniendo en cuenta las estructuras intrónicas y exónicas mediante el programa Exonerate. En este paso obtuvimos cuatro alineamientos significativos: uno de P. sojae, uno de T. pseudonana y dos de T. cruzi. Con el contig de G. intestinalis no hallamos ningún exón.
El siguiente paso fue conseguir el cDNA de nuestros genes predichos utilizando un programa subministrado por el profesorado. Una vez ya teníamos el cDNA, con fastatranslate conseguimos las proteínas teóricas de los genes predichos.
Finalmente comparamos estas proteínas teóricas con las queries utilizadas al principio mediante T-coffee. El resultado de estos alineamientos fue muy bueno. En P. sojae, la Sec se alineaba con una Cys; esto significaba que la proteína de P. sojae era en realidad una homóloga a SelT. Para las proteínas de T. pseudonana y T. cruzi sí encontramos SelT "verdaderas".
Habiendo llegado a esta conclusión, necesitábamos encontrar un elemento SECIS en unos 5000 nucleótidos después de los genes de las SelT encontradas. Efectivamente, en el caso T. pseudonana lo hallamos 2682 nucleótidos después del gen predicho mediante el pattern menos estricto (loose canonical and non-canonical).
En el caso de T. cruzi, en el contig “>gi|70872757|gb|AAHK01001168.1|” pudimos seleccionar las 5000bp posteriores al final de nuestra proteína, pero el programa SECISearch no nos proporcionó ningún resultado.
En cuanto al contig “>gi|70872946|gb|AAHK01001137.1|” (también de T. cruzi) intentamos seleccionar 5000bp de la región 3' UTR pero el contig no era lo suficientemente largo (sólo nos alcanzó para 798pb). Pensamos que con la longitud de esta región, no habríamos abarcado el inicio del supuesto SECIS. Mediante un BLASTn intentamos encontrar el contig que se solapara con el nuestro en la región 3', y que supuestamente contendría el elemento SECIS de nuestra proteína, pero no obtuvimos resultados.
Así pues, aunque las proteínas que encontramos parecían buenas candidatas para tener SECIS, al final resultó que no los tenían (o bien que no los hemos podido hallar). Igualmente estamos casi convencidos de que se trata de selenoproteínas, ya que la homología con otras SelT era muy grande y porque mediante una búsqueda en el Blast de NCBI vimos que se relacionaban claramente con diferentes SelT.
Por lo que se refiere a los otros protistas no hemos encontrado ningún tBLASTn aceptable que nos haga pensar en la posibilidad de que existan estas selenoproteínas en sus genomas, pero no lo podemos asegurar al 100% ya que no sabemos hasta donde abarca nuestro modelo informático.
- Sel V
Por lo que incumbe a SelV utilizamos la query de H.sapiens (SelenoDB) para compararla con los genomas de los protistas. Habiendo hecho el tBLASTn, sólo había un alineamiento aceptable con el protista M.brevicollis. Por esta razón únicamente hicimos con esta especie el proceso explicado anteriormente. Al utilizar Exonerate y T-coffee vimos que el gen predicho era exactamente el mismo que el de SelW1. Para averiguar a qué familia pertenecía recurrimos a la literatura y vimos que SelV solamente está presente en organismos vertebrados, mientras que SelW1 ha tenido una historia evolutiva a lo largo de diferentes reinos. Por esto creemos que SelV no se encuentra en los organismos protistas y que el gen predicho corresponde a SelW1.
- Sel W
La búsqueda de la selenoproteína W en los diferentes genomas de protistas que nos proporcionaron no fue demasiado exitosa. En primer lugar en el momento de decidir qué queries utilizar, nos decantamos por las secuencias descritas en H.sapiens (SelenoDB) y en el pez D.rerio (NCBI) para la subfamilia W1. Para la SelW2, utilizamos la secuencia de A.franciscana (NCBI). Utilizamos estas queries, ya que SelW está descrita en muy pocos organismos y éstos eran los que estaban más lejanos entre ellos. Todas las queries de la subfamilia W2 son homólogas con Cys.
En el BLAST, obtuvimos unos resultados con un e-value muy elevado. Igualmente, decidimos quedarnos con los alineamientos con mayor similaridad y con un e-value inferior a 0,5. Sólo obtuvimos alineamientos que cumplían nuestros requisitos con los protistas M.brevicollis, T.pseudonana y en P.sojae para SelW1. Para SelW2 seleccionamos G.Intestinalis y M.brevicollis como posibles candidatas. Vimos que la misma región genómica de M.brevicollis se alineaba para SelW1 y SelW2, por lo que para saber a qué subfamilia pertenecía, miramos con qué se alineaba. SelW1 era la que tenía alineada su U con un codón stop, deduciendo así que correspondía a ésta.
En el Exonerate, sólo obtuvimos un alineamiento significativo para SelW1 con el protista M.brevicollis, donde se nos alineaba toda la proteína de H.sapiens, y además la selenocisteína se alineaba con un teórico codón stop del genoma de M.brevicollis.
Obtuvimos el cDNA del gen predicho y posteriormente lo traducimos. Finalmente comparamos esta proteína teórica con las queries utilizadas al principio mediante T-coffee. El resultado de este alineamiento fue muy bueno por lo que parece que efectivamente M.brevicollis contiene en su genoma la selenoproteína W.
Encontramos su elemento SECIS a 2334 nucleótidos de distancia del gen.
Para SelW2 hicimos el Exonerate y obtuvimos solamente una parte de la proteína. Realizamos el mismo proceso y vimos, que ciertamente, G.intestinalis era un homólogo en cisteina de la subfamilia SelW2. En este caso, al ser un homólogo en cisteína no teníamos que encontrar elementos SECIS.
Respecto a los otros protistas, no hemos encontrado ningún Blast aceptable, por lo que consideramos que no existen SelW1 ni SelW2.