DISCUSIÓN


SELENOPROTEÍNAS

Familia DI

La familia de las yodotironin deiodinasas está formada por tres proteínas parálogas, la DI1, la DI2 y la DI3. Sus funciones están relacionadas con la regulación de la actividad hormonal tiroidea mediante la activación de dichas hormonas. Las proteínas DI1 y DI2 catalizan la reacción de deyodonización que convierte la prohormona tiroxina (T4) a su forma activa, la triyodotironina (T3). Por otro lado, la proteína DI1 influye en los niveles de hormona circulantes. De forma opuesta, la proteína DI3 media la eliminación del yodo llevando a la formación de triyodotironina reversa (rT3), que tampoco presenta actividad. En conjunto, la familia de selenoproteínas DI es fundamental para mantener los niveles de hormona tiroidea así como para modular su actividad (Vyacheslav M et al, 2014).
DI1
Tras blastear la selenoproteína humana DI1 contra el genoma de Macaca nemestrina, se han encontrado 3 posibles Scaffolds, de los cuales se ha seleccionado el que presentaba el hit con menor e-value (8e-53), que además, era el único Scaffold que cubría prácticamente toda la Query (249 de 253 pares de bases). El Scaffold en cuestión es KQ005701.1, que se encuentra entre las posiciones 34246499 y 34266781, en la cadena positiva. Presenta 4 exones y 3 intrones predichos por Exonerate no exhaustivo y Genewise, así como 1 residuo de Sec coincidente con la Query, y comienza con un residuo de Metionina. Por otra parte, el T-Coffee (no exhaustivo) muestra un muy buen alineamiento con la Query.

El programa SECISearch3 ha encontrado coincidencias con la DI1 de Macaca mulatta y de una variante de DI1 de Homo sapiens. Se han encontrado 3 posibles elementos SECIS, de los cuales se ha seleccionado el que presentaba un grado A, que además, es el que presenta una posición más cercana a la selenoproteína en cuestión (a 954 nucleótidos del codón UGA), en la región 3'-UTR, cadena positiva.

Los otros dos Scaffolds con hits menos significativos no se corresponden con la DI1, sino con miembros de su familia, pero aparecen como hits significativos a causa de la alta similitud entre estas proteínas.

Así pues, concluimos que en Macaca nemestrina existe una selenoproteína DI1 en el Scaffold KQ005701.1.
DI2
La selenoproteína humana DI2 se ha BLASTeado contra el genoma de Macaca nemestrina, y se han encontrado también 3 posibles Scaffolds. El que presentaba los hits más significativos (2 hits, con e-value de 7e-130 y 1e-39), es el KQ005747.1, que se encuentra entre las posiciones 490100 y 498876, en la cadena positiva. La Query seleccionada mide 273 pares de bases, que son abarcados por los hits del Scaffold en cuestión. Se han encontrado 2 exones y 1 intrón al realizar un Exonerate (exhautivo y no exhaustivo) y un Genewise, así como 2 residuos de Sec coincidentes con la Query. La similitud entre la Query y la predicción es muy alta, y es que presentan un muy buen alineamiento según el T-Coffee. La proteína, además, comienza por Metionina.

El programa SECISearc3 no ha encontrado coincidencias con ninguna selenoproteína anotada, pero sí un elemento SECIS de grado A, entre las posiciones 503734 y 503806. Por tanto, consideraremos que se ha encontrado una selenoproteína DI2 en el Scaffold KQ005747.1 de Macaca nemestrina.

El tercer Scaffold más significativo se solapa con la secuencia de DI1, pero se muestra aquí como un posible candidato a causa de la alta similitud entre los miembros de la família DI.
DI3
Tras realizar el BLAST se han encontrado 3 Scaffolds posibles. El hit más significativo presentaba un e-value de 1e-178, situado en el Scaffold KQ007239.1. Cubre a la Query desde la posición 13 a la 278 (la longitud de la Query es de 282 nucleótidos). Dicho Scaffold se encuentra entre las posiciones 2029892 y 2029059, en la cadena negativa. Presenta un único exón y un único residuo de Sec, que es coincidente con el de la Query, con la que presenta un muy buen alineamiento. También presenta un residuo inicial de Metionina.

El programa SECISearch3 ha mostrado coincidencias con la tioredoxina 5-deionasa de Macaca mulatta en lugar de con una yodotironina deionasa. Es posible que este resultado se deba a que ambas selenoproteínas sean muy similares y que la DI3 no haya sido anotada. También ha mostrado una estructura SECIS de grado A en la cadena positiva, a 984 nucleótidos del codón UGA.

El segundo y tercer Scaffolds más significativos se corresponden con DI1 y DI2 respectivamente, pero son presentados en el resultado del BLAST como posibles candidatos a causa de la alta similitud entre miembros de la familia.

Determinamos, pues, que se ha encontrado una selenoproteína DI3 en el Scaffold KQ007239.1 del genoma de Macaca nemestrina.



Familia GPx

La familia de las GPxs (Glutatión peroxidasas) se encuentran entre los componentes del sistema antioxidante.
GPx1
El resultado del BLAST muestra 7 Scaffolds posibles. Hemos seleccionado aquel que presentaba un e-value menor, mejor alineamiento y el que tuviera Sec. Este Scaffold es KQ009282.1, y se sitúa entre las posiciones 20085060 y 20085912 de la cadena complementaria o reversa. Contiene 2 exones y un intrón de 250 pares de bases, según los resultados tanto de Exonerate como de Seblastian, mientras que en Genewise, la diferencia es de 1 par de bases (249 pares de bases).

Con respecto a lo obtenido en T-Coffee, Genewise y Seblastian, se muestra un buen alineamiento respecto la Query inicial y se ha encontrado un único residuo de Sec, el cual está conservado en humano. Además, se ha predicho un único elemento SECIS (grado A) entre 20084939-20085006 de la cadena inversa, en la región 3'-UTR de la cadena complementaria (515 pares de bases downstream desde la Sec y 53 pares de bases desde el último exón).
GPx2
El resultado del BLAST presenta 4 Scaffolds posibles. Se ha seleccionado aquel que presentaba un e-value menor, mejor alineamiento y el que tuviera Sec. Este Scaffold es el KQ008983.1, que se sitúa en 16605575-16608797 de la cadena complementaria. Contiene 2 exones y 1 intrón de 2653bp.

Con respecto a lo obtenido en T-Coffee, Genewise y Seblastian, se muestra un buen alineamiento respecto la Query inicial y se ha encontrado un único residuo de Sec, que se encuentra conservado en Homo sapiens. Además, se ha predicho un único elemento SECIS (grade A) entre 16605292-16605356, en la región 3'UTR de la cadena reversa (668 pares de bases downstream desde la Sec y 218 pares de bases desde el último exón).
GPx3
El resultado del BLAST presenta 5 Scaffolds posibles. Se ha seleccionado aquel que presentaba un e-value menor, mejor alineamiento y el que tuviera Sec. Este Scaffold es el KQ007139.1, que se sitúa en 2405697-2413167 de la cadena reversa. En él, hay 5 exones y 4 intrones.

Tanto en T-Coffee como en Genewise, el alineamiento es muy bueno, y en ambas se encuentra sólo una Sec conservada en humano. El resultado de Seblastian, también muestra una Sec y se ha predicho dos elementos SECIS, de las que se ha seleccionado únicamente la del grado A. Éste se encuentra entre las posiciones 2404968-2405041 en la región 3'-UTR de la cadena complementaria (a una distancia de 1114 pares de bases downstream de la Sec y 655 pares de bases del último exón).
GPx4
El resultado del BLAST presenta 5 Scaffolds posibles. Se ha seleccionado aquel que presentaba un e-value menor, mejor alineamiento y el que tuviera Sec. Este Scaffold es el KQ004606.1, que se sitúa en 21039956-21042576 de la cadena complementaria. En la región donde se encuentra la proteína predicha, hay 7 exones y 6 intrones.

Tanto en T-Coffee como en Genewise, el alineamiento es muy bueno, y en ambas se encuentra sólo un residuo de Sec, el cual está conservado en Homo sapiens. El resultado de Seblastian, también muestra una Sec y se ha predicho dos elementos SECIS, de las que se ha seleccionado únicamente la del grado A. Éste se encuentra entre las posiciones 21039829-21039908 en la región 3'-UTR de la cadena reversa (a una distancia de 419 pares de bases respecto la Sec y 50 pares de bases del último exón).
GPx5
El resultado del BLAST presenta 6 Scaffolds posibles. En este caso, como la Query inicial no presentaba Sec, se ha seleccionado aquel que presentaba un e-value menor y mejor alineamiento con la proteína GPx5 de humano. Este Scaffold es el KQ005374.1, que se sitúa en 1386097-1394222 de la cadena complementaria. En la región donde se encuentra la proteína predicha, hay 5 exones y 4 intrones.

Tanto en T-Coffee como en Genewise, no se aprecia la presencia de ninguna Sec, tal y como se esperaba.
GPx6
El resultado del BLAST presenta 5 Scaffolds posibles. Se ha seleccionado aquel que presentaba un e-value menor y mejor alineamiento con la proteína GPx6 de humano. Este Scaffold es el KQ005374.1, que se sitúa entre 1404874-1414906 de la cadena positiva. En esta región, hay 5 exones y 4 intrones. Como observamos, este Scaffold también se ha predicho para la GPx5 pero en la cadena opuesta.

En Genewise se observa la presencia de una Sec conservada en el humano. Esta Sec también se aprecia en Seblastian, mientras que en T-Coffee da lugar a una Cys. Sin embargo, en Exonerate se predice la presencia de una Sec en el lugar donde se encuentra tanto en Genewise como en Seblastian. De esta manera, concluimos que GPx6 es una selenoproteína, al igual que en otros estudios (Mariotti et al. 2012).

Se ha encontrado un único elemento SECIS de grado A. Éste se encuentra entre las posiciones 1415520-1415595 en la región 3'-UTR de la cadena positiva (a una distancia de 1057 pares de bases respecto la Sec y 613 pares de bases del último exón).

Por otro lado, el segundo Scaffold más probable es el correspondiente a GPx3, del que según estudios, se produce una duplicación que da lugar a GPx6 (Mariotti et al. 2012). Vemos también cómo GPx5 y GPx6 están parcialmente solapadas(Ensembl).
GPx7
El resultado del BLAST muestra 4 Scaffolds posibles. Al igual que en GPx5, se ha seleccionado aquel que presentaba un e-value menor y mejor alineamiento con la proteína GPx7 de humano. Este Scaffold es el KQ005701.1, que se sitúa en 32845962-32871149 de la cadena positiva. En la región donde se encuentra la proteína predicha, hay 3 exones y 2 intrones.

No se aprecia la presencia de ninguna Sec, tal y como se esperaba.
GPx8
El resultado del BLAST muestra 4 Scaffolds posibles. Al igual que en GPx5, se ha seleccionado aquel que presentaba un e-value menor y mejor alineamiento con la proteína GPx7 de humano. Este Scaffold es el KQ005701.1, que se sitúa en 32845962-32871149 de la cadena positiva. En la región donde se encuentra la proteína predicha, hay 3 exones y 2 intrones.

No se aprecia la presencia de ninguna Sec, tal y como se esperaba.


Sel15
El resultado del BLAST presenta un único Scaffold posible: KQ009392.1, el cual se encuentra entre las posiciones 14223610-14272897 de la cadena complementaria. En la región donde se encuentra la proteína predicha, hay 5 exones y 4 intrones.

Tanto el Genewise como el T-Coffee muestran un buen alineamiento con la Query inicial donde se ha encontrado un único residuo de Sec, que se encuentra conservado en Homo sapiens.

Además, se ha predicho un único elemento SECIS (grado A) entre 14222936-14223017 de la cadena negativa, en la región 3'UTR de la cadena reversa.


SelH
La selenoproteína H se caracteriza por presentar un un dominio tioredoxina y motivo Cys-X-X-Sec conservado en su centro activo. Se localiza en el nucléolo y se pese a que se desconoce su función de manera exacta, se postula que puede estar implicada en la síntesis de glutatión y de enzimas de detoxificación (Novoselov SV et al, 2007).

En el genoma de Macaca nemestrina se ha predicho el gen de la SelH que se localiza en el Scaffold KQ005813.1, entre las posiciones 861898 y 862516 de la cadena positiva. Está formado por 3 exones y 2 intrones. Los resultados del alineamiento de la proteína identificada en Macaca nemestrina muestran una gran homología con la de Homo sapiens. El residuo de Sec se ha conservado en el segundo exón y se ha identificado un elemento SECIS de grado A a una distancia de 899 pares de bases con respecto al codón UGA correspondiente a la Sec.


SelI
La selenoproteína I contiene un dominio CDP alcohol fosfatidiltransferasa que está altamente conservado. Es una de las menos estudiadas y por ello su función es todavía desconocida (Mariotti et al, 2012).

La proteína de Macaca nemestrina que presenta homología con la SelI de Homo sapiens se localiza en el Scaffold KQ009260.1, entre las posiciones 6255588 y 6298989 de la cadena de sentido inverso. El gen predicho tiene 10 exones y 9 intrones. El alineamiento con T-Coffee indica que esta selenoproteína es totalmente idéntica en las dos especies estudiadas. Las predicciones de Exonerate y Genewise identifican un residuo de Sec conservado en el último exón de la proteína y además se encuentra un elemento SECIS de grado A en la región 3'UTR, a 1329 pares de bases de dicho aminoácido.

Por otra parte, los resultados del BLAST muestran 2 hits adicionales situados en los Scaffolds KQ009216.1 y KQ005601.1. En ambos casos cubren la misma región de la Query pero de forma parcial, por eso las predicciones de Genewise y los alineamientos con T-Coffee sostienen que podría tratarse de duplicaciones parciales del gen.


SelK
La selenoproteína K se localiza en la membrana del retículo endoplasmático y su función está relacionada con el mantenimiento de la homeostasis de dicha estructura subcelular. Sin embargo, su papel en la célula aún queda por describirse detalladamente (Shchedrina VA et al, 2011).

La secuencia de aminoácidos de SelK predicha es idéntica a la de Homo sapiens a excepción de un residuo. El gen que la codifica presenta 1 exón y está localizado en el Scaffold KQ005309.1, entre las posiciones 6735858 y 6736130 de la cadena de sentido inverso. Los programas SECISearch3 y Seblastian predicen en la misma cadena un elemento SECIS de grado A situado a 127 nucleótidos de distancia del codón que codifica por la Sec.

Así mismo, se han encontrado 6 Scaffolds significativos con similitud a la SelK humana. Los resultados de Exonerate y Genewise para dichos genes analizados coinciden en la presencia de múltiples codones de parada de la traducción (distintos a UGA) en las regiones codificantes. Esto lleva a pensar que podría tratarse de pseudogenes, es decir, genes no funcionales o bien que producen proteínas sin actividad. Esta hipótesis es concordante con los resultados descritos en la literatura (Mariotti et al, 2012) según los cuales la SelK, debido a su reducido tamaño, es la selenoproteína con más pseudogenes en mamíferos.


SelM
La selenoproteína M se distribuye en el retículo endoplasmático y su expresión es predominante en el cerebro. La sobreexpresión de SelM en las neuronas ha demostrado que previene el daño oxidativo. Esta hallazgo ha impulsado nuevas líneas de investigación para definir el papel neuroprotector de SelM (Vyacheslav M et al, 2014).

La SelM de Macaca nemestrina se sitúa en el Scaffold KQ004995.1, entre las posiciones 1170694 y 1173513 de la cadena positiva. De acuerdo con los resultados de Exonerate y Genewise, el gen predicho contiene 5 exones y 4 intrones. La proteína predicha presenta una alta homología con la de Homo sapiens. El elemento SECIS resultante es de grado A y se encuentra en la región 3'UTR, a 333 pares de bases de la Sec, conservada en el segundo exón.


SelN
La selenoproteína N es una glicoproteína transmembrana que se encuentra en el retículo endoplasmático. Su expresión más elevada se produce durante el desarrollo embrionario. Funcionalmente, se ha relacionado con el desarrollo temprano del tejido muscular y la diferenciación del organismo (Petit N et al, 2003). La SelN predicha en el genoma de Macaca nemestrina se encuentra en la cadena positiva del Scaffold KQ005701.1, entre las posiciones 4201310 y 4216299 y contiene 12 exones y 11 intrones. Considerando tanto las predicciones de Exonerate como las de Genewise a partir de la comparación con Homo sapiens, la proteína que se obtiene está incompleta. Además, los resultados del T-Coffee muestran un alineamiento muy pobre y por lo tanto una baja homología entre los genes de respectivas especies. Este dato contrasta con la información que proporciona Genewise, según el cual el gen SelN en Macaca nemestrina ha conservado la Sec de la parte final pero por contra ha perdido dicho residuo localizado en la porción más inicial de la secuencia. Por otro lado, Seblastian no ha podido predecir ningún alineamiento pero sin embargo se han encontrado dos elementos SECIS, uno de grado A en la cadena positiva y otro de grado B en la cadena complementaria. Estos resultados tan heterogéneos no permiten confirmar que el fragmento obtenido pertenezca a la SelN de Macaca nemestrina, pero si tuviésemos que tener en cuenta algún dato escogeríamos el proporcionado por Genewise ya que se corresponde con la predicción de un elemento SECIS y además en la literatura (Mariotti et al, 2012) la SelN está catalogada como selenoproteína en vertebrados. Con respecto al hecho que Seblastian no haya predicho una selenoproteína, puede deberse igualmente a problemas con nuestra predicción o bien a que no hay una buena anotación en la base de datos.


SelO
La selenoproteína O es estructuralmente y funcionalmente desconocida. Los resultados del análisis de la secuencia de SelO en vertebrados indican la presencia de un péptido de unión mitocondrial y un dominio con actividad quinasa (Dudkiewicz M et al, 2012).

La secuencia predicha de acuerdo con los resultados de Exonerate y Genewise está localizada en el Scaffold KQ005223.1, entre las posiciones 656174 y 672124 de la cadena reversa. En el gen se identifican 9 exones y 8 intrones. Los resultados de T-Coffee muestran un alineamiento no óptimo por lo que se podría afirmar que la predicción resultante en ningún caso es homóloga a la SelO de Homo sapiens. Se pueden apreciar que las regiones del Scaffold de Macaca nemestrina más conservadas se corresponden con fragmentos ampliamente separados de la Query y además, presentan una extensión tan pequeña que difícilmente podrían ser considerados exones. Puesto que el resultado del Genewise es el esperado (aunque no incluye la parte final de la proteína, que es donde está la Sec) no achacaremos el mal alineamiento en T-Coffee a que no hayamos incluido la región a analizar. Por tanto, una opción para mejorar el resultado del Genewise y del T-Coffee sería ampliar la región de interés unos 150000 nucleótidos más. Así mismo, no se encuentra ningún residuo de Sec conservado. Contrariamente, el programa SECISearch3 ha encontrado un elemento SECIS y además Seblastian ha predicho un alineamiento con una Sec conservada en la parte final de la proteína. Estos resultados, que equivalen a los de Exonerate, son más lógicos con referencia a lo que cabría esperar de SelO, ya que se ha descrito como una selenoproteína en todos los vertebrados (Mariotti et al, 2012). Por ello, esto lleva a pensar que en este caso, los resultados obtenidos con el programa aplicado carecen de fiabilidad, con lo que no podríamos confirmar la predicción realizada de SelO en Macaca nemestrina.


SelP
La selenoproteína P es una glicoproteína extracelular transportadora de Cys que también tiene función antioxidante.

La proteína se encuentra en el Scaffold KQ005017.1, entre las posiciones 2427532-2435150 de la cadena complementaria y contiene 4 exones y 3 intrones.

En los resultados del T-Coffee se observa un buen alineamiento con 6 residuos de Sec conservadas entre la predicción y la Query inicial. En Genewise, sin embargo, vemos 4 Sec conservadas mientras que en Seblastian, se observan 12 Sec.

El elemento SECIS de esta selenoproteína se encuentra en la cadena reverse a una distancia de 259 pares de bases del último exón y de 268 pares de bases de la última Sec de la proteína.



Familia SelR

SelR1
La selenoproteína R pertenece a la familia de Msr (metionina sulfoxid reductasa).

En el resultado del BLAST presenucleótidosa 2 Scaffolds possibles. Se ha seleccionado aquel que, aparte de tener un e-value muy significativo, presentaba un mejor alineamiento y que contenía Sec conservadas con el humano. Este Scaffold es el KQ004918 que se encuentra entre las posiciones 843265-847104 de la cadena positiva y contiene 4 exones y 3 intrones. En T-Coffee se ve un muy buen alineamiento con 1 residuo de Sec conservado en Homo sapiens, lo que coincide con la información de Genewise.

El elemento SECIS de esta selenoproteína se encuentra en la cadena positiva a una distancia de 1949 pares de bases del último exón y de 1982 pares de bases de la última Sec de la proteína.
SelR2
El resultado del BLAST presenta 2 posibles Scaffolds. Se ha seleccionado aquel que presenta un e-value menor. Éste es KQ009271.1 y se localiza entre 10885632-10911387 de la cadena complementaria. Contiene 5 exones y 4 intrones.

Tanto el resultado de Genewise como de T-Coffee muestran un buen alineamiento con la Query inicial. En ninguno de los dos se aprecia la presencia de Sec, tal y como se esperaba.
SelR3
El resultado del BLAST presenta 2 posibles Scaffolds. Se ha seleccionado aquel que presenta un e-value menor. Éste es KQ008945.1 y se localiza entre 21747159- 21780890 de la cadena complementaria. Contiene 3 exones y 2 intrones.

Muestra un buen alineamiento con la Query inicial. No se aprecia ninguna Sec, tal y como se esperaba.

Curiosamente, el segundo mejor Scaffold de ambas proteínas, SelR2 y SelR3, se corresponden entre sí, lo que nos indica que son proteínas que comparten una secuencia parcial.


SelS
La selenoproteína S es una proteína que participa en los procesos inflamatorios regulando la producción de citoquinas.

La proteína se encuentra en el Scaffold KQ006219.1 entre las posiciones 1900588–1905200 de la cadena positiva y contiene 6 exones y 5 intrones.

No se encontró ninguna Sec en los resultados del T-Coffee ni en los del Genewise. Esto se debe a que en Macaca nemestrina, existen dos gaps en donde tendría que estar la Sec de humano. Tal vez, durante la evolución, esta región en humano haya sufrido inserciones, provocando la aparición de 2 aminoácidos: Gly y Sec.


SelT
La selenoproteína T es una proteína de la familia de tioredoxinas que participa en la regulación de los estados redox y en los procesos de adhesión celular.

La proteína se encuentra en el Scaffold KQ006343 entre las posiciones 18140422-18208847 de la cadena negativa y contiene 2 exones.

En T-Coffe y Genewise encontramos 1 Sec conservada pero al comprobar en la predicción que hace Seblastian, no nos predecía elementos SECIS. Al alargar la subsecuencia 50000 pares de bases por delante y 50000 pares de bases por detrás, para ver si en la anterior no habíamos cogido la región en donde se encontraría un posible SECIS, el resultado fue la predicción de un elemento SECIS en la posición 18161608-18161678 de la cadena complementaria.



Familia SelU

SelU1
La selenoproteína U proteina de la superfamilia de las tioredoxinas.

En el resultado del BLAST presenta 3 Scaffolds posibles. Se ha seleccionado el Scaffold con el segundo e-value ya que presentaba un mejor alineamiento que el primero. Este Scaffold es el KQ006837.1 que se encuentra entre las posiciones 1964093-1974759 de la cadena complementaria y contiene 5 exones y 4 intrones.

En T-Coffee se observa un buen alineamiento con 1 residuo de homólogo de Sec conservado en Homo sapiens, lo que coincide con la información de Genewise.
SelU2
La proteína se encuentra en el Scaffold KQ009171.1 entre las posiciones 4838055-4838729 de la cadena positiva y contiene 1 exón. En T-Coffee se observa un buen alineamiento con 3 residuos de homólogos de Sec conservadas entre la predicción y la Query inicial, lo que coincide con la información de Genewise.

El elemento SECIS de esta selenoproteína no se encontró, tal y como se esperaba.
SelU3
La proteína se encuentra en el Scaffold KQ005836.1 entre las posiciones 1648796-1733590 de la cadena negativa y contiene 6 exones y 5 intrones. En T-Coffee se observa un buen alineamiento con 6 residuos de homólogos de Sec conservados entre la predicción y la Query inicial, mientras que en Genewise se observan 7 residuos de homólogos de Sec.

El elemento SECIS de esta selenoproteína no se encontró, tal y como se esperaba.


SelV
La selenoproteína V es una proteína que participa en la espermatogénesis y se expresa en los testículos.

La proteína se encuentra en el Scaffold KQ005702.1 entre las posiciones 3237669-3335750 de la cadena complementaria y contiene 4 exones y 3 intrones. Tanto en T-Coffee como en Genewise, se observa una Sec no conservada en la Query del humano. El resultado de SeBLASTian también muestra la presencia de una Sec, donde el elemento SECIS se encuentra en la cadena complentaria a una distancia de 983 pares de bases del último exón y de 1202 pares de bases de la última Sec de la proteína.



Familia SelW

SelW1
La selenoproteina W es una proteína participa en los procesos redox y se encuentra en el músculo esquelético y en el corazón.

En el resultado del BLAST presenta 2 Scaffolds posibles. Se ha seleccionado aquel que presentaba un mejor alineamiento y que contenía Sec conservadas con el humano. La proteína se encuentra en el Scaffold KQ009183.1 entre las posiciones 3641096-3643678 de la cadena positiva y contiene 3 exones y 2 intrones.

En T-Coffee se observa un buen alineamiento con respecto a la Query inicial, presentando una Sec conservada en el humano. Sin embargo, el resultado de Genewise no muestra ninguna Sec en nuestro genoma. Para obtener resultados en Seblastian, tuvimos que aumentar la subsecuencia en 50000 pares de bases por delante y 50000 pares de bases por detrás, para ver si en la anterior no habíamos abarcado la región donde se encontraría un posible elemento SECIS. El resultado fue nulo.

Encontramos un elemento SECIS en el otro Scaffold pero se encontraba en la otra cadena, lo que significa que no hemos predicho una selenoproteína. En conclusión, no se trata de una selenoproteína.
SelW2
El resultado del BLAST muestra un único Scaffold posible: KQ008639.1, que se sitúa entre 3777327- 3778201 de la cadena positiva. Esta región presenta 3 exones y 2 intrones. Tanto el resultado del Genewise como del T-Coffee muestran un buen alineamiento con la Query inicial. En ninguno de los dos se aprecia la presencia de Sec, tal y como se esperaba, ya que es clasificada como un homólogo de Cys según la literatura.



Familia SPS

SPS2
Es tanto maquinaria como selenoprotína, véase en la sección maquinaria (clique aquí).



Familia TR

La familia de tioredoxin reductasas forma el mayor sistema de reducción de puentes disulfuro que tiene la célula. En mamíferos se distinguen tres isoformas de las selenoproteínas TR. La primera, TR1, presenta seis isoformas y reduce la forma oxidada de la tioredoxina citosólica. Se localiza fundamentalmente en el citosol y el núcleo. La segunda, TR2, se expresa mayormente en los testículos después de la pubertad y podría estar implicada en la formación de puentes disulfuro durante la maduración de los espermatozoides. La tercera, TR3, se encuentra en las mitocondrias, donde media la reducción de la tioredoxina mitocondrial y la glutaredoxina 2 (Vyacheslav M et al, 2014).
TR1
El resultado del BLAST muestra 4 Scaffolds posibles. Se ha seleccionado aquel que presentaba los hits más significativos (el menor e-value encontrado ha sido 7e-34) y que cubría la Query en mayor medida y prácticamente sin solapaciones, concretamente desde la posición 31 hasta la 586 (la Query medía 649 pares de bases). Dicho Scaffold es el KQ006009.1, con 13 hits significativos. Se encuentra entre las posiciones 3889896 y 3813770, en la cadena negativa. Presenta 14 exones y 13 intrones según Exonerate no exhaustivo (aunque en este caso faltaba el principio de la proteína) y Genewise. El T-Coffee muestra un muy buen alineamiento, con un residuo de Sec coincidente entre la predicción y la Query inicial. No encontramos que la proteína comience con una Metionina.

El programa SECISearch3 ha encontrado coincidencias con la selenoproteína TR1 de Homo sapiens, isoforma 2. También se han encontrado tres posibles elementos SECIS, de los cuales uno de ellos presentaba un grado A, a 220 nucleótidos del codón UGA, en la cadena negativa.

Los otros demás Scaffolds no se han valorado teniendo en cuenta que los e-values de los hits eran los más bajos y que cubrían la Query en menor medida. Determinamos que el Scaffold KQ006009.1 se corresponde con la selenoproteína TR1, y que por tanto, hemos encontrado dicha proteína en el genoma de Macaca nemestrina.
TR2
El resultado del BLAST muestra 3 posibles Scaffolds. De entre estos, el que presentaba hits más significativos ha sido el KQ009283.1 (el hit más significativo tiene un e-value de 7e-28), que cubre a la Query desde la posición 55 hasta la 524 (el tamaño de la Query es de 524). Se encuentra en la cadena positiva, entre las posiciones 2328450 y 2399864. Presenta 17 exones y 16 intrones según Genewise, y 16 exones y 15 intrones según Exonerate (no exhaustivo). Puesto que la predicción de Exonerate es más larga, mantendremos esta como válida. La proteína predicha presenta dos resiuos de Sec, aunque solo uno coincidente con la Query. El alineamiento dado por T-Coffee es muy bueno, y la proteína comienza con Metionina, lo que ya se observa al realizar un Exonerate exhaustivo y un Genewise.

El programa SECISearch3 ha encontrado coincidencias con la TR1β de Homo sapiens, así como un elemento SECIS de grado A situado en la cadena positiva, a una distancia de 1457 nt del codón UGA.

Determinamos como válido este Scaffold teniendo en cuenta las características que hemos mencionado y que el siguiente Scaffold con los hits más significativos (KQ006009.1) solapa con el de la TR1 (y en realidad se corresponde con esta), ya que, como hemos dicho, presentan una alta similaridad. Consideramos, pues, que hemos encontrado una selenoproteína TR2 en el Scaffold KQ009283.1 del genoma de Macaca nemestrina.
TR3
El resultado del BLAST muestra 4 posibles Scaffolds, de los cuales, el que presenta hits más significativos (el hit más significativo tiene un e-value de 3e-39) es el KQ007944.1. Cubre a la Query (su longitud es de 698 nt) desde la posición 4 hasta la 600. Se encuentra entre las posiciones 463514 y 514324 (cadena positiva) y tiene 16 exones (el primero de los cuales presenta 6 inserciones según Exonerate) y 15 intrones según Exonerate y Genewise. Presenta un muy bien alineamiento en el T-Coffee y un único residuo de Sec coincidente con el de la Query, pero no comienza con una Metionina.

El programa SECISearch3 ha encontrado coincidencias con la selenoproteína TR3, isoforma 1 de Homo sapiens en la cadena positiva y una estructura SECIS de grado A a 216 nucleótidos del codón UGA, también en la cadena positiva.

Los siguientes Scaffolds con hits más significativos son KQ006009.1 y KQ009283.1, pero ya hemos determinado que estos se corresponden con la TR1 y la TR2 respectivamente, y que la significancia de dichos hits se debe a la alta similitud que TR3 presenta con los miembros de su familia (TR).

Por tanto, consideramos que hemos encontrado una selenoproteína TR3 en el Scaffold KQ007944.1 del genoma de Macaca nemestrina, aunque no comienza con Metionina.


MAQUINARIA
EEFsec
El resultado del BLAST muestra dos posibles Scaffolds, de los cuales el que presenta el que presenta los hits más significativos es el KQ009149.1 (el hit más significativo tiene una e-value de 3e-142). La Query tiene una longitud de 605 nt, y el Scaffold en cuestión cubre la Query desde la posición 13 a la 596. Se encuentra entre las posiciones 15849335 y 15811551 de la cadena negativa y presenta 3 exones y 2 intrones predichos tanto por Exonerate no exhaustivo como por Genewise. No se ha encontrado ninguna Metionina como residuo inicial y tampoco residuos de Sec.

El programa SeciSearch3 no ha encontrado ninguna Selenoproteína homóloga, pero sí un elemento SECIS de grado B. Sin embargo, este se encontraba en la cadena negativa y por tanto no se correspondería con nuestra proteína.

Así pues, confirmamos que hay una proteína de maquinaria traduccional eEFsec en el Scaffold KQ009149.1.


PSTK
El archivo generado a partir del BLAST muestra un único Scaffold posible, cuyo hit más significativo tiene un e-value de 1e-54. Dicho Scaffold es el KQ004708.1. Cubre la Query desde la posición 1 a la 348, y la Query tiene una longitud de 353 nt. El Scaffold se encuentra entre las posiciones 2238111 y 2244944 de la cadena positiva, con 6 exones y 5 intrones predichos por Exonerate (no exhaustivo), y 7 exones y 6 intrones predichos por Genewise. Puesto que la predicción del Genewise es más larga, tendremos en cuenta esta. Se presenta sin residuos de Sec y con un residuo de Metionina inicial. El alineamiento obtenido por el T-Coffee es muy bueno.

El programa SeciSearch3 no ha predicho ni una selenoproteína ni un elemento SECIS, como era esperable.

Determinamos que existe una proteína de maquinaria traduccional en el Scaffold KQ004708.1 del genoma de Macaca nemestrina.


SBP2
El resultado del BLAST muestra 4 Scaffolds posibles. Se ha seleccionado aquel que, aparte de tener un e-value muy significativo, presentaba un mejor alineamiento y que no contenía Sec, al tratarse de una proteína de la maquinaria. Este Scaffold es el KQ006137.1 y se sitúa entre 19796403- 19837024 de la cadena positiva. En la región donde se encuentra la proteína predicha, hay 17 exones y 16 intrones.

No se aprecia ninguna Sec en Genewise, tal y como se esperaba al pertenecer a la maquinaria traduccional de selenoproteínas, ni elementos SECIS.


SECp43
El BLAST muestra 9 Scaffolds posibles, de los cuales, el que presenta un mayor número de hits, así como el hit más significativo (e-value de 2e-20), es el KQ005701.1. Se encuentra entre las posiciones 7390929 y 7422887 de la cadena positiva. Cubre la Query desde la posición 3 hasta la 287, teniendo la Query una longitud de 291 nucleótidos. Presenta 9 exones y 8 intrones según Genewise y Exonerate no exhaustivo. No presenta ningún residuo de Sec y sí un residuo de Metionina inicial. El alineamiento generado por el T-Coffee es excelente.

El programa SECISearch3 ha encontrado únicamente una estructura SECIS de grado C en la cadena negativa, por lo que no puede corresponder a nuestra proteína.

Si analizamos el segundo Scaffold con el hit más significativo (e-value de 6e-13), el KQ004939.1, cubre la Query desde la posición 3 a la 161, y de hecho se solapa con el segundo hit más significativo de este Scaffold. De la misma forma que con el resto de Scaffolds, decidimos no seleccionarlo como válidos frente al primero, ya que sus e-values son menores y cubren una porción menor de la Query que el Scaffold KQ005701.1.

Consideraremos, por tanto, haber encontrado una proteína de maquinaria traduccional SECp43 en el Scaffold mencionado.


SecS
El resultado del BLAST muestra un único Scaffold posible, cuyo hit más significativo tiene un e-value de 4e-53. Cubre la Query desde la posición 1 a la 501, teniendo la Query una longitud de 509 nucleótidos. El Scaffold en cuestión es el KQ005050.1, que se encuentra entre las posiciones 24424087 y 24460550 de la cadena positiva. Presenta 10 exones y 9 intrones predichos por Exonerate no exhaustivo y 11 exones y 10 intrones predichos por Genewise. La predicción para ambos casos era igual de larga. No se han encontrado residuos de Sec. Esto es esperable, teniendo en cuenta que no se trata de una selenoproteína sino de maquinaria traduccional. El alineamiento es muy bueno. Sólo encontramos una pequeña región que parece presentar una deleción de 25 nucleótidos en relación a la Query, en el archivo obtenido a partir del T-Coffee.

El programa SECISearch3, como era de esperar, no ha encontrado similitud con ninguna selenoproteína anotada, ni tampoco un elemento SECIS.

Confirmamos que existe la proteína de maquinaria traduccional SecS en el genoma de Macaca nemestrina, en el Scaffold KQ005050.1.



Familia SPS

SPS1
El resultado del BLAST presenta 10 Scaffolds posibles. Aquel que se ha seleccionado, presentaba un e-value menor y un buen alineamiento. Este Scaffold es el KQ007505.1 y se localiza en 328697-329872 de la cadena positiva. La región donde se encuentra la proteína predicha contiene un único exón y ningún intrón. Tanto el alineamiento en T-Coffee con Genewise es muy bueno, y en ninguno de los dos se aprecia la presencia de Sec, tal y como se esperaba.
SPS2
En el resultado del BLAST presenta 10 Scaffolds posibles. Se ha seleccionado aquel que, aparte de tener un e-value muy significativo, presentaba un mejor alineamiento y que contenía Sec conservadas con el humano. Este Scaffold es el KQ009403.1. Se localiza en 1648920-1650377 de la cadena complementaria del Scaffold. La región donde se encuentra la proteína predicha contiene un único exón y ningún intrón. Por otro lado, el segundo Scaffold más probable es el que corresponde a SPS1.

Respecto a los resultados de Genewise, vemos que presenta dos Secs que se conservan con las dos Secs de la proteína SPS2 de Homo sapiens. Mientras que los resultados de T-Coffee y Seblastian muestran únicamente 1 Sec conservada. Esto puede deberse a que en Seblastian, el inicio del exón está 105 pares de bases más allá del inicio del exón de Genewise y T-Coffee. Además, se han predicho dos elementos SECIS (ambos de grado A). De estos, se analiza el de 1, que se encuentra entre las posiciones 1648381 y 1648457 de la cadena negativa, en la región 3'UTR de la cadena reversa (a una distancia de 567 pares de bases del último exón).