RESULTADOS Y DISCUSIÓN

Para analizar el genoma de nuestro organismo y descubrir si tiene selenoproteínas seguimos los siguientes pasos:

  1. Comprobamos que el código genético de B.bigemina es estándar en el NCBI. [ir]
  2. Miramos si B. bigemina tiene alguna selenoproteína homóloga a las selenoproteínas humanas que proporciona la base de datos de selenoproteínas: SelenoDB. Los resultados para este análisis fueron negativos. [ir]
  3. Buscamos en B. bigemina selenoproteínas homólogas a P. falciparum, E. huxleii y dos selenoproteínas de humano (SelJ y SelP) que no aparecían en SelenoDB. Tampoco en este caso obtuvimos resultados que indicaran la presencia de selenoproteínas en B. bigemina. [ir]
  4. Comprobamos si B. bigemina tiene las proteínas y factores propios de la maquinaria necesaria para la síntesis de selenoproteínas y los comparamos con los que tienen diversas especies de insectos con y sin selenoproteínas. [ir]
  5. Buscamos selenoproteínas propias de B. bigemina a partir de la búsqueda de elementos SECIS. [ir]

TABLA RESUMEN DE RESULTADOS

Código genético de B.bigemina

Antes de comenzar comprobamos que el código genético de B.bigemina es estándar en NCBI.

Búsqueda de selenoproteínas homólogas en humano

Empezamos a partir de la secuencia del organismo que vamos a estudiar, B. bigemina, y de las selenoproteínas de humano conocidas. El objetivo será comprobar si en B. bigemina existen selenoproteínas homólogas a las humanas.

Secuencias de B. bigemina
Secuencias de Selenoproteínas humanas

A partir de los resultados obtenidos con tBLASTn, descartamos los alineamientos no significativos, quedándonos con aquellos de menor e-value.

Alineamientos con e-value 1.0
Alineamientos con e-value 10.0

Los alineamientos con los que nos hemos quedado han sido los siguientes:

Selenoproteína humana Contig de B. bigemina
eEFSec 3160
GPX2 2766
DI2 2984
SPS1 3973
Sel15 4131.3
SelI 4096
SelR1 4165
SelR3 1507
SelS 4088
SelU3 1916
SelV 4158
SelW2 4102
TR1 4075
TR2 4075
TR3 4075

Tabla 1: Alineamientos de selenoproteínas humanas contra B. bigemina.

A partir de estos contigs extraemos un fragmento de 3000 nucleótidos a partir del primer nucleótido alineado para no tener que trabajar con todo el contig.

Para ver estos fragmentos pulsa aquí

Los contigs de eEFSec, DI2, SPS1, Sel15, SelR1, SelR3, SelS, SelU3 y SelW2 estaban dados en su forma reversa y por lo tanto tuvimos que pasarlos a su forma directa.

Para ver estos contigs reversos pulsa aquí

A continuación tuvimos que repetir el tBLASTn y la selección del fragmento adecuado para estos contigs reversos.

Para ver el tBLASTn de los contigs reversos pulsa aquí
Para ver los fragmentos de estos contigs reversos pulsa aquí

Para estos alineamientos buscamos aquellos que alinean una U en la secuencia de humano con una C o un codón STOP TGA, marcado con un asterisco, en la secuencia de B. bigemina. En el primer caso la proteína encontrada en nuestro organismo es una homóloga con cisteína. En el segundo caso, la proteína encontrada es una posible selenoproteína en B. bigemina por lo que tenemos que buscar un segundo codón STOP y mirar si se conserva la secuencia hasta éste. Por otro lado, también buscamos alineamientos entre una C en la secuencia de humano con un codón STOP TGA en la secuencia de B. bigemina. En este caso la proteína encontrada será una posible selenoproteína en nuestro organismo con un homólogo con cisteína en humano.

A partir de los resultados obtenidos de Genewise y Exonerate, descartamos las selenoproteínas eEFSec, GPX2, DI2, SPS1, Sel15, SelR1, SelR3, SelS, SelU3, SelV y SelW2 como selenoproteínas de humano que pueden tener un homólogo en B. bigemina debido a su mal alineamiento. En los casos en los que el alineamiento dado por Genewise no nos mostraba la U, comprobamos manualmente que dicha U de la proteína humana no alineaba con C ni con * (TGA) en la secuencia de B.bigemina. Esto se hizo para todas las selenoproteí humanas excepto para eEFSec que como se explica a continuación, es una proteína de maquinaria. Seguimos trabajando con el resto: SelI, TR1, TR2 y TR3.

eEFSec es el factor de elongación para selenoproteínas. Sin embargo, existe un factor de elongación denominado EF-tu, utilizado para la elongación del resto de las proteínas. Para asegurarnos de que B. bigemina tiene el homólogo de eEFSec y no de EF-tu, primero construimos la proteína correspondiente a partir del fragmento alineado por Exonerate. Con esta secuencia hicimos un BLAST proteína contra proteína en www.ncbi.nlm.nih.gov/blast/Blast.cgi y comprobamos que efectivamente los mejores hits correspondían al alineamiento con EF-tu. Por lo tanto descartamos que B. bigemina tenga eEFSec y el alineamiento que habíamos obtenido previamente, era debido a la elevada similitud de secuencia entre ambos factores.

Para obtener mejores resultados en el alineamiento de estas proteínas, lo que hicimos fue construir la proteína compuesta de cada una de ellas y repetir el Genewise y Exonerate.

Para SelI, el alineamiento obtenido no fue mejor que el anterior. Esto puede ser debido a que sólo alinea la región de proteína que procede de la secuecia de B. bigemina, pero no la que procede de humano. Es decir, estamos alineando dos secuencias iguales y por lo tanto el alineamiento de esa región es prácticamente perfecto. De este modo podemos descartar que B. bigemina tenga una proteína homóloga a SelI humana.

En cuanto a las TR vemos que:

En el alineamiento de la proteína TR1 y TR3 vemos que U alinea con G.

 
	TR1              480 SFVNLTVTKKSGES-ILQAGCUG                           
                   	     SFVNLTVTKKSGES +   GC G                           
                	     SFVNLTVTKKSGESWVASQGCGG 
                          
	Contig4075     20448 atgacagaaatggttggacgtgg                           
               		     gttatctcaacgacgtcgagggg                           
               		     ccatctcggaccgagggcagtcc 

				

Sin embargo observamos un gap cercano a la U que puede estar mal situado. Si fuera así U alinearía con la C situada justo delante de la G. Para comprobar si ha ocurrido este error miramos unos nucleótidos downstream de la secuencia para ver si encontramos algún codón STOP real cercano. No obstante, encontramos el codón STOP muy lejos y por lo tanto es imposible que haya ocurrido este error que imaginábamos. Concluimos que B. bigemina no tiene TR1 ni TR3 homólogas a las humanas.

En el alineamiento de la proteína TR2 vemos que el Genewise y el Exonerate cortan justo antes de la U. Por lo tanto, miramos como siguen las secuencias codificando la secuencia aminoacídica a una nucleotídica y observamos que la U de humano alinea con una G de B. bigemina y el TGA de B. bigemina aparece más lejos por lo que es imposible que realmente B. bigemina tenga la homóloga humana TR2.

		
	TR2              492 IDDTIGIHPTDAESFVNLTVTKKSG                         
               		     IDDTIGIHPTDAESFVNLTVTKKSG                         
               		     IDDTIGIHPTDAESFVNLTVTKKSG  
                       
	Contig4075     20409 aggaagaccagggatgacagaaatg                         
               		     taactgtaccacagttatctcaacg                         
               		     tcccctccgtctgccatctcggacc 

				

Búsqueda de selenoproteínas homólogas a SelP y SelJ humanas, de P. falciparum y de E. huxleii

A partir de los resultados anteriores, todo indica que nuestro organismo no tiene selenoproteínas homólogas a las de humano. Por este motivo, decidimos comprobar si B. bigemina tiene algunas selenoproteínas homólogas a Plasmodium falciparum (SP1, SP2, SP3, SP4), Emiliana huxleii (dbj) y comprobamos dos selenoproteínas humanas que no aparecen en la base de datos SelenoDB: SelJ y SelP.

Repetimos las mismas operaciones que en el apartado anterior, empezando por un alineamiento con tBLASTn. El resultado tanto para SelJ como para SelP fue No hits found por lo que las descartamos como posibles selenoproteínas. El resultado de los alineamientos con P. falciparum SP1, SP2 y SP3 tampoco dieron un e-value significativo, ni la U alineaba con C ni con * (TGA). A partir de aquí seguimos trabajando tan solo con P. falciparum 4, E. huxleii.

A continuación extraemos los 3000 nucleótidos que nos interesan de cada contig y con estos fragmentos hacemos un Genewise y un Exonerate.

Para obtener mejores resultados, construimos las secuencias de las proteínas compuestas y repetimos el Genewise y el Exonerate.

Para P. falciparum 4 obtuvimos 2 contigs con e-values buenos, así que hicimos la proteína compuesta de cada uno de ellos. En ninguno de los dos casos el alineamiento fue mejor, por lo que parece ser que B. bigemina no tiene selenoproteínas homólogas a las encontradas en P. falciparum.

Para E. huxleii obtuvimos 4 contigs y decidimos trabajor con el contig4175.0 y el contig4169, puesto que el valor de los alineamientos era significativo. En el caso del primer contig observamos que el codón TGA que en E. huxleii codifica para una selenocisteína tiene un homólogo cisteína en nuestro organismo. Para este contig buscamos si se conserva el elemento SECIS correspondiente a la selenoproteína de E. huxleii. Sin embargo, comprobamos que en B. bigemina no se ha conservado este elemento. En el segundo contig, que alineaba * con *, corresponde a dos codones STOP y por lo que la descartamos como posible selenoproteína homóloga a la de E. huxleii.

Al obtener alineamiento con tBLASTn en el contig4175.0. de la proteína de E. huxleii contra una región de B. bigemina en la que se alinean * con C pensamos que teníamos una proteína homóloga a la de E. huxleii pero que en nuestro caso tiene una C en vez de una U.Decidimos caracterizar dicha proteína del genoma de Babesia. Para ello, pusimos los 3000 nucleótidos extraídos del contig que contiene el alineamiento en el Expasy y obtuvimos la traducción de la secuencia en las 6 pautas de lectura posibles. Averiguamos la pauta de lectura de la proteína de Babesia recortando los aminoácidos que se alineaban en el tBLASTn y búscandolos en la traducción que nos daba Expasy.

Una vez encontramos la pauta de lectura, que en este caso fue 5'3' Frame 2'', alargamos la proteína, por delante del alineamiento hasta la primera metionina, y por detrás, hasta el primer codón STOP. La proteína resultante fue:

			MVTNLRRLIMFFAPWCGHCKALEPEWRRMATIADRVTVGSVDATVNTALAQRYGVKGYPT
			IVLLPQGPKGPSKAIPYNGARKAEDILAFAKRHYRNMGPPVHVNSFDDLKQRCSGPLCLL
			FFLPEEGLQGNIDIISKVMENNSTLPFQFCYTLGMFVGRLSLISSQRAVIQCGSVRWACR
			LSRPCWV
					

A continuación miramos que nucleótidos del contig4175.0 codifican para esta proteína. En primer lugar, buscamos los nucleótidos comprendidos en el alineamiento, es decir, del nucleótido 59639 al 59968. A continuación miramos cuántos aminoácidos había antes del primer aminoácido alineado y vimos que eran 7. Hicimos lo mismo pero contando los que hay detrás del último aminoácido alineado, y vimos que eran 70. Así pues:

	7 aminoácidos x 3 nucleótidos para codificar cada aminoácido = 21 nucleótidos

	70 aminoácidos x 3 nucleótidos para codificar cada aminoácido + 3 nucleótidos del codón STOP = 

	213 nucleótidos 
					
De modo que tuvimos:

	59639 - 21 = 59618 (primer nucleótido)

	59968 + 213 = 60181 (último nucleótido)
					

Por lo que la proteína se codificaría desde el nucleótido 59618 al 60181. Por último, decidimos buscar posibles elementos SECIS en este mismo contig, por si pese a tratarse de una proteína con Cys tenía esta estructura. El único posible SECIS que encontró el programa Secisearch para este contig estaba aproximadamente en el nucleótido 61000 y tenía un score de 5.13 (el recomendado es de 15).

Búsqueda de un patrón de expresión común

Por el momento parece que B. bigemina no tiene selenoproteínas homólogas en los organismos que hemos estudiado. En los organismos que carecen de selenoprotema, existe un patrón común de expresión o no expresión de ciertas proteínas como por ejemplo aquellas implicadas en la maquinaria de síntesis de selenoproteínas. Esperar­amos que si B. bigemina no tiene selenoproteínas, comparta este patrón de expresión.

En este cuadro se muestran las proteínas que vamos a estudiar y su expresión en diferentes insectos. Los insectos que no tienen selenoproteínas aparecen marcados en rojo y los que sí que tienen en verde.

  SPS1 SPS2 SBP2 EfSec TRNASec SelH SelK Secp43 LP PSTK
Drosophilas
D.willistoni x x BAD (Cys) (Cys) x x
A.gambiae x (?)
A.aegypti
A.mellifera x x x x x
N.vitripennis x x x x x x x
B.mori x x x BAD x x x x
T.castaneum x x x BAD x (Cys) BAD x

Tabla 2: Resultados para cada selenoproteína y factor de selenoproteína para cada especie

Para ver las secuencias de estas proteínas pulsa aquí.

En primer lugar, analizamos si B. bigemina tiene maquinarias de selenoproteínas. Por una parte habíamos analizado SPS1 de humano y habíamos concluido que no existe su homóloga en B. bigemina. Ahora analizaremos la SPS1 de Drosophila para asegurarnos de que realmente no existe esta proteína en B. bigemina. Al analizar a fondo eEFSec vimos que tenía más homología con EF-tu y por lo tanto también lo descartamos como posible factor de elongación de selenoproteínas.

De estas proteínas descartamos SPS1, SPS2, SBP2 y tRNASec ya que el resultado era No hits found. Para ver los resultados de BLAST pulsa aquí. Seguimos analizando el resto de proteínas. De la misma forma que antes, seleccionamos el fragmento de interés para poder realizar el Genewise y Exonerate, utilizando las secuencias directas en todos los casos. En este caso sólo fue necesario hacer la secuencia directa para Secp43 ya que venía anotada en su forma reversa. En la siguiente tabla se muestran los contigs correspondientes a las diferentes proteínas y factores que seguimos analizando:

Selenoproteína Contig de B. bigemina
SelH 3887
SelK 4132
Secp43 4184.3
SLA/LP 3744
PSTK 4120

Tabla 3: Alineamientos de selenoproteínas humanas contra B. bigemina.

A partir de este análisis vemos que únicamente Secp43 da resultados significativos y por lo tanto sabemos que el resto de proteínas y factores no se encuentran en nuestro organismo. Estos resultados coinciden con el patrón observado en los insectos que no tienen selenoproteínas, excepto para SPS1 que aparece en todos los insectos y en B. bigemina. Sin embargo esto tampoco es extraño ya que estamos trabajando con un organismo eucariota unicelular.

Parece que tan solo Secp43 se encuentra en B. bigemina. Para asegurarnos repetimos el Genewise y Exonerate para la correspondiente proteína compuesta.

Para nuestro organismo el patrón de expresión de las proteínas y factores estudiados sería el siguiente:

  SPS1 SPS2 SBP2 EfSec TRNASec SelH SelK Secp43 LP PSTK
B. bigemina x x x x x x x x x

Tabla 4: Resultados en B. bigemina.

Decidimos realizar la proteína compuesta con el alineamiento de SLA/LP de Drosophila contra B. bigemina para ver si obtenemos un mejor resultado de Genewise y Exonerate para dicha proteína.

En los resultados de Genewise vemos que únicamente se alinea el fragmento de la proteína de B. bigemina utilizado para crear la proteína compuesta.En Exonerate vemos un STOP (TAA) en B. bigemina, indicador del final de la proteína. Este STOP no coincide con el final de la proteína en Drosophila.

Podemos concluir por lo tanto que SLA/LP no se encuentra en B. bigemina, ya que es demasiado diferente como para ser encontrada basándonos en homología.

¿Qué ocurre en otras especies filogenéticamente cercanas?

Es de extrañar que Babesia bigemina no tenga selenoproteínas porque organismos cercanos en el árbol evolutivo como los Plasmodium sí que las tienen. [Figura 1] Aunque no es en el único caso en el que vemos algo así. Sucede algo parecido con las moscas: todas las Drosophila tienen selenoproteínas excepto la especie willistoni, que carece de ellas.

Figura 1: Árbol filogenético de las especies próximas a Babesia

Búsqueda de nuevas selenoproteínas a partir de elementos SECIS

Para encontrar nuevas selenoproteínas exclusivas de Babesia bigemina buscamos los posibles elementos SECIS del genoma del organismo. Mediante el programa Secisearch 2.19 se obtienen 64 hits. A continuación se muestran aquellos que tienen una puntuación superior a 9:

Hit Score Contig nt inicio nt final
2 12,18 2633.0 4650 4749
4 17,71 3144 3250 3346
7 13,97 3170 2102 2198
21 9,74 4073 11685 11782
24 9,26 4170 4307 4399
31 9,26 4170 70896 70995
33 16,63 4171 14522 14618
34 14,24 4171 14702 14798
38 15,60 4173.0 48520 48609
55 9,75 1846 903 997
60 10,79 2517 2 90
62 14,57 2953 1468 1555

Tabla 5: Posibles SECIS en B. bigemina.

Con la extracción de 3000 nucleótidos upstream a la estructura de cada SECIS pudimos hacer un BLASTx contra los proteomas de todas las especies. Previamente descartamos los SECIS predichos 55 y 60 ya que no podemos cortar 3000 nucleótidos anteriores al SECIS porque las estructuras se hallan al principio del contig. De todos los alineamientos que nos da el BLASTx sólo uno es de * contra C. Se trata de un alineamiento de *-C con una proteína de Drosophila melanogaster llamada "Salivary glue protein Sgs-3 precursor" hecho a partir del contig 4171, cuyo valor del SECIS es de 14,24 (próximo a 15, que es el recomendado). A pesar de esto y bajo nuestro criterio, creemos que no se trata de una selenoproteína ya que, por un lado B. bigemina no dispone de maquinaria de selenoproteínas (al menos estándard) y por otro lado porque la proteína subject es bastante repetitiva, característica quefavorce el alineamiento con numerosas proteínas. Al ver el alineamiento podemos darnos cuenta que tan sólo se alinean Ts, Ks y Ps.

Volver al menú

CONTÁCTANOS:  selenoproteinas_upf@live.com