Búsqueda de Selenoproteínas

Selenoproteína R
Selenoproteína T
Maquinaria

A continuación, comentamos los resultados obtenidos de las queries de S. cerevisiae, D. melanogaster, C. elegans y H. sapiens (R1, R2 y R3) de la selenoproteína R en los prostistas. Hemos realizado un multiple sequence alingment (MSA) mediante el programa T-Coffee para comprobar las relaciones de similitud entre las distintas queries. Se puede observar que presentan regiones con alta similaridad que podrían corresponder a domininios conservados de la Selenoproteína R. Para ver el resultado haced click aquí

A. rara

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

C. fasciculata

El alineamiento a partir del programa tBLASTn de las queries de S. cerevisiae, C. elegans y H. sapiens (SelR1, SelR2 y SelR3) con el genoma de C. fasciculata nos reporta un hit significativo para cada query en el mismo contig (Cf_contig980). Los E-values cumplen con el criterio establecido por nuestro programa, con unos valores de 2e-21 (S. cerevisiae), 1e-21 (C. elegans), 7e-10 (SelR1), 7e-18 (SelR2) y 2e-18 (SelR3). En todos los casos, nos encontramos frente a posibles homólogos con cisteína. Todas los hits incluyen el aminoácido cisteína de la query alineado con una cisteína presente en el genoma de C. fasciculata, a excepción de SelR1 de H. sapiens que tiene una selenocisteína (U) alineada con una cisteína del genoma del protista.

Posteriormente, realizamos la predicción de los genes, y para ello utilizamos dos programas: Exonerate y Genewise. Excepto para la SelR1 de H. sapiens en la que sólo hemos obtenido resultados con Exonerate, hemos encontrado una proteína tanto con Exonerate cómo con Genewise. Además, en el caso de las queries de S. cerevisiae, C. elegans, y SelR3 de H. sapiens, la proteína predicha por los dos programas es la misma. De la SelR2 de H. sapiens, hemos seleccionado la proteína obtenida a partir del Genewise ya que es lo que hemos decidido hacer con todas por defecto, además, en este caso, la proteína predicha por Exonerate no incluía la cisteína de interés. A continuación, con el T-Coffee realizado a partir de la proteína predicha, en todos los casos, vemos que la proteína se alinea sólo con una región de la query y todas tienen un score ~ 90. En todos los casos, a excepción de la SelR1, la proteína predicha contiene una cisteína que alinea con la cisteína de interés en la query. En el caso de SelR1, vemos que la selenocisteína (U) de la query, alinea con un gap en la proteína predicha. También hemos realizado una búsqueda de elementos SECIS, sin embargo, no hemos encontrado ninguno.

Por último, realizamos un BLASTp de la proteína predicha y observamos coincidencias para todas las queries con dominios de methionine sulfoxide reductase, que forman parte de la familia de la selenoproteína R, con un score ~ 180. Además, vemos que hay similitud del 70% con proteínas conservadas entre especies.

A partir de toda la información obtenida podemos afirmar que hemos encontrado un homólogo con cisteína de la selenoproteína R en el genoma de C. fasciculata.

T. congolense

A partir del alineamiento obtenido con las queries de los organismos S. cerevisiae, C. elegans y H. sapiens (R1, R2 y R3), obtenemos hits en un contig (T.congo.pschr.11) con E-values significativos: 1e-25 (S. cerevisiae), 2-19 (C. elegans), 4e-09 (SelR1), 1e-21 (SelR2) y 9e-18 (SelR3). Estos hits presentan el alineamiento de un aminoácido cisteína de la query, y en el caso de SelR1 de H. sapiens de una selenocisteína (U), con una cisteína de la secuencia del genoma. De modo que se trata de posibles candidatos a homólogos con cisteína.

En cuanto al alineamiento de estos hits con cada una de las queries, excepto para SelR1 de H. sapiens, no obtenemos resultados con el programa Genewise. Así pues, obtenemos la predicción de la proteína a partir del alineamiento obtenido con Exonerate. A continuación, mediante el programa T-Coffee realizado a partir de la proteína predicha que contiene 1 exón, podemos ver que hay una similitud significativa de las proteínas predichas con las queries de S. cerevisiae (score 89), C. elegans (score 88), SelR2 (score 96) y SelR3 (score 94) de H. sapiens. En el caso de la query de SelR1 de H. sapiens, obtenemos resultados con el programa Genewise, cuyo alineamiento resultante con la proteína predicha tiene un score de 89.

Para confirmar los resultados obtenidos hasta el momento, realizamos un BLASTp de las proteínas predichas con una base de datos no redundante de NCBI y los resultados que obtenemos con el mejor E-value presentan una similitud del 100% con una proteína de Trypanosoma congolense. También vemos que, con otros resultados obtenidos con el BLASTp, las proteínas predichas presentan similitud con un dominio methionine sulfoxide reductase presente en distintas especies, y que pertenece a la familia de la selenoproteína R.

Finalmente, cabe destacar que, en el contig de interés (T.congo.pschr.11), hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra el posible homólogo con cisteína. Este hecho, junto con la elevada similitud que presentan las queries con esta región del genoma, podría tener una explicación evolutiva, es decir, puede haberse producido una mutación reciente en la región de interés del genoma de este protista en la cual el aminoácido selenocisteína ha pasado a ser una cisteína, siendo la proteína igualmente funcional y conservando la secuencia genómica del elemento SECIS. Así pues, a partir de todos los datos obtenidos, podemos afirmar que hemos encontrado un homólogo con cisteína a SelR en el genoma del protista.

L. tarentolae

El alineamiento a partir del programa tBLASTn de las queries de S. cerevisiae, C. elegans y H. sapiens (SelR1, SelR2 y SelR3) con el genoma de L. tarentolae nos reporta un hit significativo para cada query en el mismo contig (Lt_contig5668). Los E-values cumplen con el criterio establecido por nuestro programa, con unos valores de 1e-22 (S. cerevisiae), 8e-20 (C. elegans), 3e-07 (SelR1), 8e-17 (SelR2) y 8e-19 (SelR3). En todos los casos, nos encontramos frente a posibles homólogos con cisteína. Todos los hits incluyen la cisteína de la query alineada con una cisteína presente en el genoma de L. tarentolae, a excepción de SelR1 de H. sapiens que tiene una selenocisteína (U) alineada con cisteína.

Posteriormente, realizamos la predicción de los genes. Excepto para la SelR1 de H. sapiens en la que sólo hemos obtenido resultado con Genewise, hemos encontrado una proteína tanto con Exonerate como con Genewise. No obstante, en todos los casos, hemos seleccionado la proteína obtenida con el programa Genewise, ya que es lo que hemos decidido hacer con todas por defecto. A continuación, con el T-Coffee realizado a partir de la proteína predicha, en todos los casos, vemos que la proteína alinea sólo con una región de la query y todas tienen un score ~ 90. Para las queries de S. cerevisiae, C. elegans, SelR2 y SelR3 de H. sapiens, vemos que la cisteína de interés alinea con una cisteína de la proteína predicha. Sin embargo, el resultado de SelR1 de H. sapiens es distinto, ya que vemos que la proteína predicha es más corta y no alinea con la selenocisteína de la query.

Por último, realizamos un BLASTp de la proteína predicha y observamos en todas las queries coincidencias con dominios de methionine sulfoxide reductase, que forman parte de la familia de la selenoproteína R, con unos score de ~ 180 y todas tienen similitud elevada (~ 90%) con proteínas conservadas en otras especies del género Leishmania. También realizamos una búsqueda de elementos SECIS, no obstante, no encontramos ninguno.

A partir de toda la información obtenida podemos afirmar que hemos encontrado un homólogo con cisteína de la selenoproteína R en el genoma de L.tarentolae.

L. donovani

El alineamiento obtenido con las queries de los organismos S. cerevisiae, C. elegans y H. sapiens (R1, R2 y R3), nos reporta hits en un contig (contig_28) con E-values significativos: 4e-22 (S. cerevisiae), 5e-19 (C. elegans), 3e-07 (SelR1), 9e-17 (SelR2) y 9e-19 (SelR3). Estos hits presentan el alineamiento de un aminoácido cisteína de la query, y en el caso de SelR1 de H. sapiens de una selenocisteína (U), con una cisteína de la secuencia del genoma. De modo que se trata de posibles candidatos a homólogos con cisteína.

En el análisis de predicción de genes, obtenemos resultados con el programa Exonerate y Genewise, excepto en el caso de SelR1 de H. sapiens, la cual nos reporta resultados sólo con Genewise. En el contig de interés, obtenemos la predicción de la proteína. En el caso de S. cerevisiae, las proteínas predichas con ambos programas son idénticas y ambas contienen 1 exón, no obstante, la proteína predicha por Exonerate es 5 aminoácidos más larga. Al hacer el T-Coffee, obtenemos alineamientos con un score similar (89 y 91). En cuanto a C. elegans, las proteínas predichas con ambos programas son idénticas, contienen sólo 1 exón y el alineamiento de éstas tiene un score de 88. Al mismo tiempo, la SelR1 de H. sapiens presenta un alineamiento con score de 85 donde la selenocisteína de la query se encuentra alineada con un gap. En el caso de SelR2, la proteína predicha por Genewise presenta una mayor longitud que la predicha con Exonerate, ambas constituidas por un exón. Además, el alineamiento del T-Coffee con la proteína predicha a partir de Genewise tiene un score de 87. Por último, en cuanto a SelR3 de H. sapiens, la proteína predicha con Exonerate tiene una mayor longitud que la de Genewise, está constittuída por dos exones y el alineamiento con T-Coffee presenta un score de 92.

Para confirmar los resultados obtenidos hasta el momento, realizamos un BLASTp de las proteínas predichas con la base de datos NCBI y los resultados que obtenemos con el mejor E-value presentan una similitud del 100% con una proteína de Leishmania donovani. Al mismo tiempo, vemos que, con otros resultados obtenidos con el BLASTp, las proteínas predichas presentan similitud con un dominio methionine sulfoxide reductase presente en distintas especies, y que pertenece a la familia de la selenoproteína R.

Finalmente, cabe destacar que, en el contig de interés (contig_28), hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra el posible homólogo con cisteína. Este hecho, junto con la elevada similitud que presentan cada una de las queries con esta región del genoma, podría tener una explicación evolutiva, es decir, puede haberse producido una mutación reciente en la región de interés del genoma de este protista en la cual el aminoácido selenocisteína ha pasado a ser una cisteína, siendo la proteína igualmente funcional y conservando la secuencia genómica del elemento SECIS.

Así pues, a partir de todos los datos obtenidos, podemos afirmar que hemos encontrado un homólogo con cisteína a SelR en el genoma del protista.

D. discoideum

El alineamiento obtenido con las queries de los organismos S. cerevisiae y H. sapiens nos reporta hits en un contig (gi|93569069|gb|CM000154.2|) con E-values significativos: 1e-24 (S. cerevisiae) y 1e-20 (R2 H. sapiens). Estos hits presentan el alineamiento de un aminoácido cisteína de la query con una cisteína de la secuencia del genoma. De modo que estamos delante de posibles candidatos a homólogos con cisteína.

En el análisis de la predicción de genes, hemos obtenido resultados tanto con Exonerate como Genewise y, para continuar con nuestro estudio, nos hemos basado en los resultados de Genewise, con el cual obtenemos una proteína de mayor longitud que, mediante T-Coffee, alinea con score de alrededor de 89. Cabe destacar que, en S. cerevisiae, la proteína predicha contiene 3 exones, encontrándose la cisteína de interés en el tercer exón.

Para confirmar los resultados obtenidos, realizamos un BLASTp de las proteínas predichas con la base de datos NCBI y los resultados que obtenemos presentan una similitud del 100% con una proteína de D. discoideum. A su vez, también vemos que las proteínas predichas presentan similitud con un dominio methionine sulfoxide reductase presente en distintos organismos, y que pertenece a la familia de la selenoproteína R.

Finalmente, cabe destacar que, en el contig de interés (gi|93569069|gb|CM000154.2|), no hemos encontrado elementos SECIS en sentido downstream a la región donde se encuentra el posible homólogo en cisteína. Así pues, a partir de todos los datos obtenidos, podemos llegar a la conclusión de que hemos encontrado un homólogo con cisteína a SelR en el genoma de D. discoideum.

D. fasciculatum

El alineamiento a partir del programa tBLASTn de las queries de S. cerevisiae, C. elegans y H. sapiens (SelR1 y SelR3) con el genoma de D. fasciculatum nos reporta un hit significativo para cada query en el mismo contig (gi|328872098|gb|GL883010.1|). Los E-values cumplen con el criterio establecido por nuestro programa, con unos valores de 6e-30 (S. cerevisiae), 1e-23 (C. elegans), 2e-12 (SelR1), y 8e-22 (SelR3). En todos los casos, nos encontramos frente a posibles homólogos con cisteína. Todos los hits incluyen la cisteína de la query alineada con una cisteína presente en el genoma de D. fasciculatum, a excepción de SelR1 de H. sapiens que tiene una selenocisteína (U) alineada con una cisteína del genoma.

Posteriormente, realizamos la predicción de los genes. Utilizamos los programas Genewise y Exonerate pero, para las cuatro queries, obtenemos únicamente resultados con el programa Exonerate. A partir de las proteínas que nos predice el programa realizamos un T-Coffee. En primer lugar, para las queries de S. cerevisiae, C. elegans y SelR3 de H. sapiens, la proteína predicha alinea en gran parte con la query y, además, todos los alineamientos tienen un score ~ 95. En los tres casos anteriores, la cisteína de la query alinea con la cisteína de interés en la proteína predicha. En segundo lugar, para la query SelR1 de H. sapiens, el alineamiento obtenido tiene un score más bajo (85) respecto a los anteriores y vemos que la selenocisteína (X) de la query está alineada con una cisteína de la proteína predicha, tal y como pasaba en el análisis del tBLASTn.

Finalmente, realizamos un BLASTp para ver si encontramos coincidencias de nuestras proteínas en la base de datos NCBI. Para las cuatro queries que hemos analizado, vemos que las proteínas predichas, en cada caso, tienen una identidad del 100% con un peptide methionine sulfoxide reductase, descrito en D. fasciculatum, que sabemos que forma parte de la familia de la selenoproteína R. Además, hemos realizado una búsqueda de elementos SECIS y hemos encontrado uno en la región de interés del genoma de D. fasciculatum.

A partir de toda la información obtenida, podemos afirmar, en primer lugar, que hemos encontrado un homólogo con cisteína de la selenoproteína R en el genoma de D. fasciculatum. En segundo lugar, el hecho de que exista un elemento SECIS en la región donde se encuentra el homólogo con cisteína podría tener una explicación evolutiva, es decir, podría haberse producido una mutación reciente en la región de interés del genoma de este protista en la cual el aminoácido selenocisteína ha pasado a ser una cisteína, siendo la proteína igualmente funcional y conservando la secuencia genómica del elemento SECIS.

P. polycephalum

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

S. arctica

El alineamiento a partir del programa tBLASTn de las queries de S. cerevisiae, C. elegans, D. melanogaster y SelR3 de H. sapiens con el genoma de S. arctica nos reporta un hit significativo para cada query en el mismo contig (supercont1.1467). Los E-values cumplen con el criterio establecido por nuestro programa, con unos valores de 3e-07 (S. cerevisiae), 1e-05 (C. elegans), 5e-05 (D. melanogaster) y 6e-06 (SelR3). En todos los casos, nos encontramos frente a posibles homólogos con cisteína. Además, todos los hits incluyen la cisteína de la query alineada con una cisteína presente en el genoma de S. arctica.

Posteriormente, realizamos la predicción de los genes. Para las cuatro queries, obtenemos resultados con los dos programas utilizados: Genewise y Exonerate. En el caso de las queries de S. cerevisiae, C. elegans y SelR3 de H. sapiens, seleccionamos, por defecto, la proteína obtenida con el Genewise y, para D. melanogaster, seleccionamos la obtenida con el programa Exonerate, ya que el alineamiento en la región de interés es mejor. Seguidamente, realizamos un T-Coffee y observamos, en todos los casos, que la cisteína de la query alinea con la proteína predicha. Cabe destacar que los scores obtenidos son elevados (~ 90).

Finalmente, realizamos un BLASTp para ver si encontramos coincidencias de nuestras proteínas en la base de datos NCBI. Para las cuatro queries que hemos analizado vemos que las proteínas predichas, en cada caso, tienen una identidad de ~ 70% con un dominio de selenoproteína R. También realizamos una búsqueda de elementos SECIS, no obstante, no encontramos ninguno.

A partir de toda la información obtenida podemos afirmar que hemos encontrado un homólogo con cisteína de la selenoproteína R en el genoma de S. arctica.

I. multifiliis

El alineamiento a partir del programa tBLASTn de las queries de S. cerevisiae, C. elegans, SelR1, SelR2 y SelR3 de H. sapiens con el genoma de I. multifiliis nos reporta un hit significativo para cada query en el mismo contig (gi|340504152|gb|GL983967.1|). Cabe mencionar que también hemos obtenido otros contigs, no obstante, no incluyen el alineamiento que nos interesa. Los E-values cumplen con el criterio establecido por nuestro programa, con unos valores de 2e-12 (S. cerevisiae), 2e-24 (C. elegans), 2e-10 (SelR1), 2e-2 (SelR2) y 2e-26 (SelR3). En todos los casos, nos encontramos frente a posibles homólogos con cisteína. Todos los hits seleccionados incluyen el aminoácido cisteína de la query alineado con una cisteína presente en el genoma de I. multifiliis, a excepción de SelR1 de H. sapiens que tiene una selenocisteína (U) alineada con una cisteína del genoma.Posteriormente, realizamos la predicción de los genes. Excepto para la SelR1 de H. sapiens en la que sólo hemos obtenido resultados con Genewise, hemos encontrado una proteína tanto con Exonerate como con Genewise. Para el resto de queries, las proteínas predichas por ambos programas son diferentes. Para la query de S. cerevisiae, seleccionamos la proteína predicha por el Genewise, ya que es lo que decidimos hacer por defecto cuando ninguno de los alineamientos es óptimo, además, en este caso, la cisteína de interés no está incluida en ninguna de las proteínas. En el resto de casos, seleccionamos la proteína obtenida por el Exonerate, ya que incluye la cisteína de interés. Después realizamos un T-Coffee y observamos para las queries de C. elegans, SelR2 y SelR3, que la proteína predicha tiene una cisteína alineada con la cisteína de interés de la query. En cambio, las queries de S. cerevisiae y SelR1 tienen la cisteína y selenocisteína de la query alineadas con gaps.

Por último, realizamos un BLASTp de la proteína predicha y vemos que, para cada query, encontramos identidad de más del 90% con dominios de methionine-R-sulfoxide reductasedescritos ya en I. multifiliis, que sabemos que forman parte de la familia de la selenoproteína R. También realizamos una búsqueda de elementos SECIS, no obstante, no encontramos ninguno.

Finalmente, con toda la información obtenida, podemos afirmar que hemos encontrado un homólogo con cisteína de la selenoproteína R en el genoma de I. multifiliis.

G. niphandrodes

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

A. laibachii

El alineamiento obtenido con las queries de los organismos S. cerevisiae, C. elegans y H. sapiens (R2) nos reporta hits en dos contigs con E-values significativos. En el primer contig (gi|325181427|emb|FR824061.1|), obtenemos E-valuesde 2e-22 (S. cerevisiae), 5e-18 (C. elegans) y 4e-16 (H. sapiens). En el segundo contig (gi|325192474|emb|FR824473.1|), obtenemos E-valuesde 2e-22 (S. cerevisiae), 6e-18 (C. elegans) y 4e-16 (H. sapiens). Estos hits presentan el alineamiento de un aminoácido cisteína de la query con una cisteína de la secuencia del genoma. De modo que estamos delante de posibles candidatos a homólogos con cisteína.

En el análisis de la predicción de genes, hemos obtenido resultados tanto con Exonerate como con Genewise. En todas las queries, en los contigs de interés, el alineamiento de las proteínas predichas con la query presenta coincidencias con un score de alrededor de 96, no obstante, la cisteína de las queries alinea con un gap de las proteínas predichas.

Para completar los datos obtenidos hasta el momento, realizamos un BLASTp de las proteínas predichas con la base de datos NCBI y los resultados que obtenemos presentan una identidad del 100% (S. cerevisiae y H. sapiens) y del 96% (C. elegans) con una methionine-R-sulfoxide reductasede Albugo laibachii Nc14. Con todos los datos anteriores, vemos que las proteínas predichas a partir de ambos contigs son casi idénticas. De modo que, realizamos un BLASTn de los contigs en la base de datos NCBI en el que vemos que hay una identidad del 99% entre ambos. Así pues, podríamos pensar que se trata de una duplicación de la proteína dentro del genoma del protista o, lo más probable, es que los contigs se solapen, es decir, que la región haya sido secuenciada dos veces y, por lo tanto, estaríamos viendo la misma región del genoma.

Finalmente, cabe destacar que, en los contigs de interés no hemos encontrado elementos SECIS en sentido downstream a la región donde se encuentra el posible homólogo con cisteína. Así pues, a partir de todos los datos obtenidos, podemos llegar a la conclusión de que hemos encontrado un homólogo con cisteína a SelR en el genoma de A. laibachii Nc14.

P. capsici

El alineamiento obtenido con las queries de los organismos S. cerevisiae, D. melanogaster y C. elegans nos reporta hits en un contig (PHYCAscaffold_33) con E-values significativos: 6e-26 (S. cerevisiae), 3e-23 (D. melanogaster) y 6e-16 (C. elegans). Estos hits presentan el alineamiento de un aminoácido cisteína de la query con una cisteína de la secuencia del genoma. De modo que se trata de posibles candidatos a homólogos con cisteína.

En cuanto al alineamiento de estos hits con cada una de las queries, obtenemos resultados con Exonerate y Genewise. En el caso de S. cerevisiae, mediante Genewise, obtenemos una predicción de la proteína de mayor longitud, de modo que el alineamiento de la query con dicha proteína presenta más coincidencias que con Exonerate. En cuanto a D. melanogaster, las proteínas predichas son idénticas y, en el caso de C. elegans, las proteína predicha por Genewise presenta una mayor longitud. Todos los alineamientos obtenidos con T-Coffee presentan un score de alrededor de 98.

Para confirmar los resultados obtenidos, realizamos un BLASTp de las proteínas predichas con la base de datos NCBI y los resultados que obtenemos presentan una identidad del 100% con una proteína del género Phytophthora. Al mismo tiempo, también vemos que las proteínas predichas presentan similitud con un dominio methionine sulfoxide reductase presente en distintas especies, y que pertenece a la familia de la selenoproteína R.

Finalmente, cabe destacar que, en el contig de interés (PHYCAscaffold_33), hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra el posible homólogo con cisteína. Este hecho, junto con la elevada similitud que presentan cada una de las queries con esta región del genoma, podría tener una explicación evolutiva, es decir, puede haberse producido una mutación reciente en la región de interés del genoma de este protista en la cual el aminoácido selenocisteína ha pasado a ser una cisteína, siendo la proteína igualmente funcional y conservando la secuencia genómica del elemento SECIS.

Así pues, a partir de todos los datos obtenidos, podemos afirmar que hemos encontrado un homólogo con cisteína a SelR en el genoma de P. capsici.

F. cylindrus

A partir del alineamiento obtenido con la query de los organismos S. cerevisiae, D. melanogaster, C. elegans, y H. sapiens (R2 y R3), obtenemos hits en distintos contigs con E-values significativos. Por un lado, en el contig de interés scaffold_7, obtenemos E-values de 5e-20 (S. cerevisiae) y de 1e-17 (D. melanogaster). Por otro lado, en el contig scaffold_21, obtenemos E-values de 9e-¹⁹ (C. elegans) y 1e-20 (R2). Además, en el scaffold_65, obtenemos un E-value de 2e-19 (R3). Cabe destacar que, todos estos hits presentan el alineamiento de un aminoácido cisteína de la query con una cisteína de la secuencia del genoma. De modo que estamos delante de posibles candidatos a homólogos con cisteína.

En el análisis de la predicción de genes, hemos obtenido resultados tanto con Exonerate como con Genewise en la mayoría de los hits encontrados. A partir de los resultados obtenidos con el programa T-Coffee, vemos que en todas las querys, en los contigs de interés, el alineamiento de las proteínas predichas con la query presenta coincidencias con un score de alrededor de 90. Por otro lado, observamos que, en los alineamientos del contig scaffold_7, la cisteína de la query no se encuentra dentro del alineamiento. Al mismo tiempo, en cuanto a las proteínas predichas en scaffold_21 y scaffold_65, la cisteína de la query está incluida en el alineamiento.

Para completar los datos obtenidos, realizamos un BLASTp de las proteínas predichas con la base de datos NCBI y los resultados que obtenemos presentan una similitud con una methionine-R-sulfoxide reductase de F. cylindrus, que pertenece a la familia de la selenoproteína R.

Con todos los datos anteriores, vemos que las proteínas predichas a partir de todos los contigs son casi idénticas. De modo que, realizamos un alineamiento múltiple de los contigs en la base de datos NCBI en el que vemos que hay una identidad ~ 90 por ciento entre ellos. Así pues, podríamos pensar que se trata de una zona repetitiva dentro del genoma del protista o, lo más probable, es que los contigs se solapen, es decir, que la región haya sido secuenciada varias veces y, por lo tanto, estaríamos viendo la misma región del genoma en todos los contigs. Para ver el resultado del alineamiento múltiple de los contigs haz click aquí

Por otro lado, cabe destacar que, en scaffold_7 i scaffold_65, hemos encontrado elementos SECIS en sentido downstream a la región donde se encuentra el posible homólogo concisteína. No obstante, no hemos encontrado elementos SECIS en scaffold_21.

Finalmente, a partir de todos los datos obtenidos, podemos llegar a la conclusión de que hemos encontrado un homólogo con cisteína a SelR en el genoma de F. cylindrus.

Resumen:

A.rara	C.fasciculata	T.congolense	L.tarentolae	L.donovani	D.discoideum	D.fasciculatum	P.polycephalum	S.arctica	I.multifiliis	G.niphandrodes	A.laibachii	P.capsici	F.cylindrus
-----	Homólogo Cys.	Homólogo Cys.	Homólogo Cys.	Homólogo Cys.	Homólogo Cys.	Homólogo Cys.	-----	Homólogo Cys.	Homólogo Cys.	-----	Homólogo Cys.	Homólogo Cys.	Homólogo Cys.

Selenoproteína T

A continuación comentamos los resultados obtenidos de las queries de H. sapiens y M. musculus de la selenoproteína T en los protistas.

Cabe destacar que ambas queries tienen una secuencia idéntica, por lo tanto, los resultados obtenidos son los mismos. Este hecho nos india que la selenoproteína T se encuentra conservada en almenos dos especies diferentes, de modo que, los genes que codifican para dicha proteína son ortólogos y, probablemente, codifican para proteínas con función y estructuras similares. Para ver el alinemiento de las queries haz click aquí

A. rara

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

C. fasciculata

A partir del alineamiento con la query de H. sapiens, obtenemos 2 hits significativos en dos contigs diferentes (Cf_contig1035 y Cf_contig_896), y unos E-values que cumplen el criterio establecido por nuestro programa (1e-08 y 2e-08 respectivamente). Los dos hits reportan el aminoácido selenocisteína alineado con un codón stop, de manera que estamos delante de un candidato a selenoproteína.

Posteriormente, realizamos la predicción de los genes, y para ello utilizamos dos programas: Exonerate y Genewise. En este caso, sólo obtenemos resultados con el Genewise para los dos hits, dándonos dos proteínas que difieren en muy pocos aminoácidos. Seguimos adelante con los dos hits y realizamos un T-Coffee. La similitud entre las proteínas predichas y los hits es elevada, con un score de 88 para un hit y 89 para el otro. No obstante, la selenocisteína (U) de la query no alinea con la región N-terminal de la proteína. No obstante, el hecho de que encontremos una región similar después de un codón stop, hace pensar que esta región está conservada, hecho que encaja con que sea una selenoproteína y no un codón stop real.

En el BLASTp de la proteína predicha con la base de datos de NCBI, observamos similitud de alrededor del 40% con proteínas conservadas en otras especies, pero que no están descritas. Además, también vemos que hay una identidad del 42% con selenoproteínas T descritas en otros organismos.

Por último, en el contig de interés, hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra la candidata a selenoproteína.

Con todos los datos anteriores, vemos que las proteínas predichas a partir de ambos contigs son casi idénticas. De modo que, realizamos un BLASTn de los contigs en la base de datos NCBI en el que vemos que hay una identidad del 99% entre ambos. Así pues, podríamos pensar que se trata de una duplicación de la proteína dentro del genoma del protista o que los contigs se solapan, es decir, la región ha sido secuenciada dos veces y, por lo tanto, estaríamos viendo la misma región del genoma.

Teniendo en cuenta que la proteína predicha no contiene una selenocisteína (U) o un codón stop en su secuencia, no podemos afirmar que se trate de una selenoproteína. A priori, podríamos pensar que se ha producido una deleción de la región N-terminal de la proteína, no obstante, teniendo en cuenta que las deleciones acostumbran a ser más cortas, descartamos esta hipótesis. Así pues, pensamos que la región de la query que se encuentra alineada con gaps podría coincidir con un exón que no ha sido secuenciado.

No obstante, los resultados de BLASTp nos indican que la proteína predicha es muy similar a selenoproteínas descritas en otros organismos. Además, la presencia de elementos SECIS en la región de interés es un marcador de que hay una selenoproteína en esa región del genoma, o al menos que ha existido en algún momento. Por lo tanto, a partir de todos los datos obtenidos, podemos concluir que hemos encontrado una selenoproteína T en el genoma de C. Fasciculata.

T. congolense

A partir del alineamiento con la query de H. sapiens, obtenemos un hit significativo en un contig (T.congo.pschr.5) y un E-value que cumple el criterio establecido por nuestro programa (E-value: 9e-08). El hit reporta el aminoácido selenocisteína alineado con un codón stop, de manera que estamos delante de un candidato a selenoproteína.

Posteriormente, realizamos la predicción de los genes, y para ello utilizamos dos programas: Exonerate y Genewise. En este caso, sólo obtenemos la proteína predicha por el Genewise. Con dicha proteína realizamos el T-Coffee y obtenemos un alineamiento que presenta un score de 87. No obstante, la selenocisteína de la query no alinea con la proteína predicha, sino que el alineamiento comienza unos aminoácidos después. Teniendo en cuenta que se encuentra localizada después de la selenocisteína, podemos pensar que el hecho de que esté conservada significa que el codón que contiene la selenocisteína no codifica un codón stop, sino que es una selenoproteína.

Realizamos un BLASTp con la proteína obtenida y vemos que hay una similitud del 100% con una proteína conservada en T. Congolense. Además, en este análisis también hemos encontrado una similitud del 33% con una selenoproteína T descrita en Xenopus.

Por último, en el contig de interés, hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra la candidata a selenoproteína.

Teniendo en cuenta que la proteína predicha no contiene una selenocisteína (U) o un codón stop en su secuencia, no podemos afirmar que se trate de una selenoproteína. No obstante, los resultados de BLASTp nos indican que la proteína predicha es similar a selenoproteínas descritas en otros organismos. Además, la presencia de elementos SECIS en la región de interés es un marcador de que hay una selenoproteína en esa región del genoma, o al menos que ha existido en algún momento. Por lo tanto, a partir de todos los datos obtenidos, podemos concluir que hemos encontrado una selenoproteína T en el genoma de T. Congolense.

L. tarentolae

A partir del alineamiento con la query de H. sapiens, obtenemos un hit significativo en un contig (Lt_contig1348), y un E-value que cumple el criterio establecido por nuestro programa (E-value: 6e-07). El hit reporta el aminoácido selenocisteína alineado con un codón stop, de manera que estamos delante de un candidato a selenoproteína.

Posteriormente, realizamos la predicción de los genes, y para ello, utilizamos dos programas: Exonerate y Genewise. En este caso, sólo obtenemos la proteína predicha por el Genewise. Con dicha proteína realizamos el T-Coffee y obtenemos un alineamiento con una similitud no muy elevada, y con un score de 70. En este caso, la selenocisteína de la query no alinea con la proteína predicha, el alineamiento se produce a partir del aminoácido siguiente y, además, no incluye toda la query.

Posteriormente, realizamos un BLASTp con la proteína obtenida y vemos que hay identidad del 48% con una proteína conservada en otra especie del mismo género (Leishmania). También encontramos coincidencias, con scores más bajos e identidad de alrededor del 30% con selenoproteínas T descritas en otros organismos.

Con toda la información que hemos obtenido, podríamos pensar que hemos encontrado una selenoproteína en L. Tarentolae. No obstante, el score obtenido con el Genewise es bajo y la selenocisteína no está alineada con la proteína predicha y ésta no presenta una selenocisteína (U) o un codón stop en su secuencia. Además, cabe destacar que no hemos encontrado elementos SECIS en la región de interés del genoma del protista, por lo tanto, no podemos afirmar que se trate de una selenoproteína. Consideramos pues, que hemos encontrado una proteína homóloga a una selenoproteína T en el genoma de L. Tarentolaeno.

L. donovani

A partir del alineamiento obtenido con la query de H. sapiens, obtenemos un hit en el contig 35 con un E-value significativo (2e-06) que reporta el aminoácido selenocisteína alineado con un codón stop, de modo que podemos definirlo como un candidato a selenoproteína en el genoma del protista.

En el análisis de la predicción de genes, sólo obtenemos resultados con el programa Genewise, a partir de los cuales obtenemos la predicción de la proteína. Al realizar el T-Coffee, el alineamiento de la proteína predicha con la query presenta un score de 78 y la selenocisteína no está incluída en el alineamiento. Sin embargo, a partir de este aminoácido, la proteína predicha alinea con la query.

En el BLASTp de la proteína predicha con la base de datos de NCBI, los resultados con los mejores E-values nos indican que la proteína predicha presenta alrededor de un 45% de identidad con proteínas conservadas en distintas especies del género Leishmania y similitud con selenoproteínas T descritas en otros organismos.

Finalmente, en el contig de interés, hemos encontrado un elemento SECIS en sentido downstream a la región donde se encuentra la candidata a selenoproteína.

Por lo tanto, a partir de todos los datos obtenidos, podemos concluir que hemos encontrado una selenoproteína T en el genoma de L. Donovani.

D. discoideum

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

D. fasciculatum

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

P. polycephalum

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

S. arctica

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

I. multifiliis

A partir del alineamiento obtenido con la query de H. sapiens, obtenemos dos hits en diferentes contigs (gi|340503028|gb|GL984123.1| y gi|340507249|gb|GL983484.1|) con E-values significativos: 4e-09 y 1e-05 respectivamente. No obstante, sólo el primer hit reporta el aminoácido selenocisteína alineado con un codón stop, de modo que analizamos este hit con otras herramientas para comprobar si se trata de una selenoproteína.

En el análisis de la predicción de genes, obtenemos resultados tanto con el programa Exonerate como con Genewise. Mediante el programa Exonerate, obtenemos el alineamiento de la selenocisteína de la query con un codón TGA de la proteína predicha que contiene 1 exón. Dicha predicción de la proteína es distinta a la proteína predicha por Genewise. &EACUTE;sta última tiene una menor longitud y, además, no incluye la selenocisteína en el alineamiento. Así pues, seguimos nuestro estudio con la proteína predicha con el Exonerate. Al realizar el T-Coffee mediante los resultados anteriores, observamos que el alineamiento de la proteína predicha tiene un score de 76, no obstante, la selenocisteína, representada en este caso por una X, está incluida en el alineamiento.

En el BLASTp de la proteína predicha con la base de datos de NCBI, los resultados nos indican que la proteína predicha presenta alrededor de un 49% de identidad con selenoproteínas T descritas en otros organismos.

Finalmente, cabe destacar que no hemos encontrado elementos SECIS en la región de interés. No obstante, el hecho de que no hayamos encontrado SECIS no significa que no haya. Por otro lado, teniendo en cuenta que la selenocisteína se encuentra en una región bien alineada y los resultados obtenidos en BLASTp, podríamos pensar que se trata de una selenoproteína T. No obstante, la proteína predicha contiene muchos codones stop en 6 posibles marcos de lectura. En conclusión, con todos los datos obtenidos, no podemos afirmar que hemos encontrado una selenoproteína T en el genoma de I. Multifiliis. Por este motivo, proponemos realizar un análisis más exhaustivo de todos los datos anteriores para obtener resultados concluyentes.

G. niphandrodes

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

A. laibachii

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

P. capsici

Con este organismo no hemos obtenidos resultados estadísticamente significativos.

F. cylindrus

A partir del alineamiento obtenido con la query de H. sapiens, obtenemos dos hits en diferentes contigs con E-values significativos: scaffold_11 (1e-12) y scaffold_9 (2e-12). Ambos hits presentan el aminoácido selenocisteína alineado con un codón stop, de modo que puede tratarse de un candidato a selenoproteína.

A continuación, en el análisis de predicción de genes, sólo obtenemos resultados para ambos hitscon el programa Genewise. Las proteínas predichas a partir de los dos hits sólo difieren en un aminoácido, de modo que mediante, el programa T-Coffee, observamos que ambos alineamientos son idénticos con un score de 95. En ellos, no obstante, la selenocisteína de la query no está incluida. Sin embargo, el hecho de que encontremos una región de alta identidad después de un codón stop, nos hace pensar que esta región está conservada, hecho que encaja con que sea una selenoproteína y no un codón stop real.

En el BLASTp de las proteínas predichas con la base de datos de NCBI, los resultados nos indican que las proteínas predichas presentan identidad con selenoproteínas T descritas en otros organismos.

Debido a que las proteínas predichas a partir de ambos contigs son casi idénticas podríamos pensar que se trata de una duplicación de la proteína dentro del genoma del protista o que los contigs se solapan, y por tanto, estaríamos viendo la misma región del genoma. Para comprobarlo, realizamos un BLASTn de los contigs en la base de datos NCBI en el que vemos que hay una identidad del 97% entre ambos contigs, Así pues, podríamos pensar que se trata de una duplicación de la proteína dentro del genoma del protista o que los contigs se solapan, es decir, la región ha sido secuenciada dos veces y, por lo tanto, estaríamos viendo la misma región del genoma.

Finalmente, cabe destacar que hemos encontrado un elemento SECIS en cada uno de los hits de interés (scaffold_11 y scaffold_9) en sentido downstream a la región donde se encuentra la candidata a selenoproteína. Teniendo en cuenta que la proteína predicha no contiene una selenocisteína (U) o un codón stop en su secuencia, no podemos afirmar que se trate de una selenoproteína. No obstante, los resultados de BLASTp nos indican que la proteína predicha es similar a selenoproteínas descritas en otros organismos. Además, la presencia de elementos SECIS en la región de interés es un marcador de que hay una selenoproteína en esa región del genoma, o al menos que ha existido en algún momento.

Por lo tanto, a partir de todos los datos obtenidos, podemos concluir que hemos encontrado una selenoproteína T en el genoma de F. Cylindrus.

Resumen:

A. rara	C. fasciculata	T. congolense	L. tarentolae	L. donovani	D. discoideum	D. fasciculatum	P. polycephalum	S. arctica	I. multifiliis	G. niphandrodes	A. laibachii	P. capsici	F. cylindrus
-----	Selenoproteína	Selenoproteína	Homólogo	Selenoproteína	-----	-----	-----	-----	-----	-----	-----	-----	Selenoproteína

Maquinaria

A partir de los resultados obtenidos en la búsqueda de los elementos de la maquinaria de síntesis de selenoproteínas, podemos observar que el único protista que contiene todos los elementos de la maquinaria y tRNAsec es F. cylindrus. Este hecho concuerda con nuestros resultados, ya que hemos encontrado la selenoproteína T en su genoma. En cambio, otros protistas en los que hemos encontrado selenoproteínas no presentan todos los elementos de la maquinaria y tampoco tienen tRNAsec. Los elementos que no están presentes son PSTK, SBP2 y Sec43p en C. fasciculata y T. congolense; PSTK y SBP2, en L. donovani. Vemos pues, que el número de proteínas de la maquinaria varia en función de la especie. Por este motivo pensamos que algunas de estas proteínas pueden tener una función redundante o son prescindibles para la síntesis de selenoproteínas en el organismo.

También vemos que D. discoideum, D. fasciculatum, S. arctica y L. donovani presentan la mayor parte de los elementos de la maquinaria, por ello, a pesar de que no hemos encontrado SelT, SelN y SelR, pensamos que podrían tener otras selenoproteínas.

Cabe destacar que sólo hemos encontrado tRNAsec en el genoma de los siguientes protistas: F. cylindrus, G. niphandrodes y A. laibachii. Si nos fijamos en los resultados obtenidos, vemos que G. niphandrodes no presenta ningún elemento de la maquinaria y, sin embargo, tiene tRNAsec. Al mismo tiempo, encontramos otros protistas que presentan selenoproteínas en su genoma y no tienen todos los elementos de la maquinaria, incluido el tRNA. Con estos datos, pensamos que los resultados obtenidos con el programa tRNAscan-SEQ no son del todo fiables para llegar a una conclusión definitiva.

Identificación de selenoproteínas en protistas

Brugada V, Frías S, Fuentes P, García C.