Búsqueda de selenoproteínas en Alligator mississippiensis

Corrales J, Franco A, Prieto M, Riquelme A, Urbina L

  • Familia DI
  • Familia GPX
  • Familia TR
  • Familia Sel
  • Familia SPS
  • Maquinaria traducción
  • FAMILIA DI: Iodothyronine deiodinase

    Las yodotironina deyodinasas son una familia formada por 3 selenoproteínas con un alto grado de homología de secuencia entre ellas. Se trata de proteínas con actividad enzimática ancladas a la membrana de 29-33 kDa. DI1 (membrana) y DI2 (ER) se encargan de la activación de las hormonas tiroideas (tiroxina o T4 à T3 activa) en diferentes tejidos, mientras que DI3 (membrana) se encarga de convertir T4 en T3 reversa y también inactivar T3 de forma irreversible. Por tanto, son las enzimas encargadas de controlar la concentración de hormona tiroidea activa disponible en distintos tejidos durante las diferentes fases del desarrollo.

    DI1

    Query: DI1

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 50115-50117 (nt), 126 (aa)

    Strand: +

    Scaffold: gi|397456552|gb|JH738948.1|:subseq(11286,101000)

    Posición en el genoma: 7156 -> 50482 (nt)

    Exones: 6

    Longitud de la proteína: 223 (aa)

    Longitud de la query: 25 -> 246 (aa)

    SECIS: Sí, posición 50587-50666 (nt)

    DI1 presenta un codón TGA en la posición 50115-50117 (nt) que codifica para una selenocisteína. Concretamente, en el alineamiento con Exonerate, la selenocisteína de la proteína humana alinea con una selenocisteína en Alligator mississippiensis. Además, en la secuencia del aligátor se observa un codón STOP que alinea con una leucina en la query de humano en la posición 75 (aa) o 49123-49125 (nt). Es posible que esto se deba a que la secuencia del Alligator mississippiensis proceda de un pseudogen o que haya fallado el alineamiento en ese punto.

    Por otro lado, se predijo un elemento SECIS en la región 3'UTR, a unos 470 pares de bases de la selenocisteína. Con todos estos datos, se ha podido concluir que DI1 es una selenoproteína en Alligator mississippiensis.

    DI2

    Query: DI2

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 52555-52557 (nt), 169 (aa)

    Strand: -

    Scaffold: gi|397463745|gb|JH731756.1|:subseq(1130000,100000)

    Posición en el genoma: 64210 -> 52117 (nt)

    Exones: 5

    Longitud de la proteína: 300 (aa)

    Longitud de la query: 0 -> 301 (aa)

    SECIS: Sí, posición 46755-46826 (nt)

    El E-value del tBLASTn de DI2 fue muy significativo (9 x 10-77). Esta proteína presenta un codón TGA que codifica para una selenocisteína en la posición 52555-52557 (nt). Concretamente, en el alineamiento con T-Coffee, se pudieron observar dos selenocisteínas en la query humana que alinean con gaps en la secuencia de aligátor. A través del programa Exonerate, se ha comprobado que el primero de ellos se trata una prolina en la posición 91 (aa) y 61609-61611 (nt) y el segundo, es una selenocisteína en Alligator mississippiensis. Es posible que se haya perdido una de las selenocisteínas en aligátor, y pueda haberse sustituido por una prolina.

    Por otro lado, se predijo un elemento SECIS a una distancia de 5731 pares de bases. Con todos estos datos, se ha podido concluir que DI1 es una selenoproteína conservada en Alligator mississippiensis.

    DI3

    Query: DI3

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 51401-51403 (nt), 144 (aa)

    Strand: +

    Scaffold: gi|397456552|gb|JH738948.1|:subseq(10000,100000)

    Posición en el genoma: 50988 -> 51789 (nt)

    Exones: 1

    Longitud de la proteína: 267 (aa)

    Longitud de la query: 0 -> 272 (aa)

    SECIS: Sí, posición 51873-51952 (nt)

    El E-value del tBLASTn es el mejor de las 3 proteínas de la familia DI (6 x 10-90). DI3 presenta también un codón TGA que codifica para el aminoácido selenocisteína. Se pudo observar que el gap del alineamiento con T-Coffee alinea con una selenocisteína en la secuencia de humano. Se pudo concluir que se trata de una selenoproteína en Alligator mississippiensis porque, además de tener un elemento SECIS en la región 3'UTR de la secuencia, la distancia entre la selenocisteína y el elemento SECIS es de 470 pares de bases.

    FAMILIA GPX: Glutathion peroxidases

    Las glutatión peroxidasas se consideran las principales enzimas antioxidantes en humanos. Estas utilizan el glutatión para catalizar principalmente la reducción del peróxido de hidrógeno y la peroxidación lipídica. Con ello, consiguen modular la síntesis de compuestos que inducen procesos inflamatorios y reducen el daño oxidativo en lípidos, lipoproteínas y DNA. Se encuentran en diversos tejidos y tienen diferente especificidad de sustrato lo que permite una amplia protección antioxidante. Se trata de una familia de proteínas con un elevado grado de homología entre sus miembros, lo cual dificulta su localización en el genoma. Se han descrito ocho glutatión peroxidasas, de las cuales 5 son selenoproteínas en humanos (GPX1-4 y GPX6), y 3 homólogos en cisteína (GPX5, GPX7 y GPX8). GPX1-3 funcionan como homotetrámeros, mientras que GPX4 actúa en forma monomérica.

    GPX1

    Se trata de la selenoproteína más abundante y ubicua en cuanto a su distribución tisular, y la más sensible a los cambios de selenio. Se cree que GPX1 actúa en el proceso de recuperación de las células después de haber sufrido períodos de estrés oxidativo. Existen varias líneas de investigación dedicadas a descubrir su papel protector frente a enfermedades neurodegenerativas o cánceres.

    Query: GPX1

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 54061-54063 (nt), 49 (aa)

    Strand: +

    Scaffold: gi|397464367|gb|JH731134.1|:subseq(120000,100000)

    Posición en el genoma: 53942 -> 57315 (nt)

    Exones: 10

    Longitud de la proteína: 333 (aa)

    Longitud de la query: 8 -> 203 (aa)

    SECIS: Sí , posición 57481-57551 (nt)

    GPX1 presenta un codón TGA (selenocisteína) en la posición 54061-54063 (nt) de la secuencia y un elemento SECIS en a 3418 pares de bases del codón TGA, en la región 3'UTR.

    Se observa un E-value muy significativo en tBLASTn, por lo que el hit obtenido es válido. Sin embargo, las secuencias proteicas en Translate y Exonerate no coinciden. Tanto en Exonerate como en Genewise aparece un codón TGA alineado con una selenocisteína en la secuencia humana por lo que deducimos que el Fastatranslate no realizó el output correctamente.

    Con los resultados obtenidos, se puede concluir que GPX1 es una selenoproteína.

    GPX2

    Se expresa principalmente en el tracto gastrointestinal y también el hígado en humanos. Su función es proteger este epitelio del estrés oxidativo producido por agentes prooxidantes ingeridos o la propia microflora.

    Query: GPX2

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 41948-41950 (nt),40(aa)

    Strand: -

    Scaffold: gi|397459705|gb|JH735796.1|:subseq(850000,100000)

    Posición en el genoma: 42067 -> 40078 (nt)

    Exones: 2

    Longitud de la proteína: 189 (aa)

    Longitud de la query: 8 -> 203 (aa)

    SECIS: Sí, posición 49804-49871 (nt)

    GPX2 presenta un E-value muy significativo en el tBLASTn. Este hecho también se observa a lo largo del alineamiento con Exonerate en Homo sapiens, lo que se ha podido corroborar al compararlo con los valores obtenidos en Genewise.

    Se observa una selenocisteína (codón TGA) en la posición 41948-41950 (nt) de la subsecuencia cuando se alinea con la query humana. Hay un elemento SECIS en la región 3'UTR a 7854 bases de distancia del codón TGA. Por lo tanto, se trata de una selenoproteína.

    GPX3

    Se trata de la única glutatión peroxidasa que se secreta y supone el 20% del selenio que se encuentra en el plasma. Se sintetiza en dos tipos celulares renales y se libera a la sangre, donde se cree que actúa como antioxidante extracelular. También se ha demostrado que regula la biodisponibilidad de óxido nítrico producido por plaquetas y células endoteliales.

    Query: GPX3

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 59440-59442 (nt), 73 (aa)

    Strand: +

    Scaffold: gi|397463514|gb|JH731987.1|:subseq(150000,100000)

    Posición en el genoma: 57517 -> 60569 (nt)

    Exones: 5

    Longitud de la proteína: 218 (aa)

    Longitud de la query: 0 -> 218 (aa)

    SECIS: Sí, posición 61362-61407 (nt)

    GPX3 presenta un codón TGA en la posición 59440-59442 (nt) alineado con una selenocisteína en la query humana. También aparece un elemento SECIS en 3'UTR del codón TGA, a una distancia de 1920 pares de bases.

    Esta proteína puede considerarse una selenoproteína en Alligator mississippiensis. Los alineamientos con Exonerate y Genewise así lo confirman.

    GPX4

    Su principal sustrato es la peroxidación de los lípidos de membrana. También se ha descrito su relevancia para ciertas enfermedades neurodegenerativas, y su efecto protector frente a enfermedad cardiovascular. También actúa como una proteína estructural, ya que durante las fases finales de la espermatogénesis pasa a ser un constituyente de la vaina mitocondrial de los espermatozoides.

    Query: GPX4

    Especie: Homo sapiens

    Tipo: No selenoproteína

    Posición de selenocisteína: 51692-51694 (nt) ,73 (aa)

    Strand: -

    Scaffold: gi|397462837|gb|JH732664.1|:subseq(220000,100000)

    Posición en el genoma: 51877 -> 51372 (nt)

    Exones: 2

    Longitud de la proteína: 173 (aa)

    Longitud de la query: 15 -> 182 (aa)

    SECIS: Sí, posición 8828-8904 (nt)

    En este caso se observa una selenocisteína en la secuencia de aligátor, ya que aparece un codón TGA en la posición 51692-51694 (nt) alineado con una selenocisteína en la query humana. Hay un elemento SECIS en la región 3'UTR a una distancia de 42866 pares de bases respecto a la selenocisteína. Esta distancia es muy elevada por lo que no podemos considerarla como selenoproteína.

    Se han obtenido otros dos codones TGA en medio de la secuencia en el output de Exonerate, lo que indica que esta proteína podría tratarse de un pseudogen o un error en el alineamiento. Aunque el tBLASTn muestra un E-value muy bajo (4 x 10-43), los resultados de los programas Exonerate y Genewise alinean parcialmente la secuencia.

    GPX6

    Se cree que su expresión está limitada al embrión en desarrollo y el epitelio olfativo en adultos. No se ha caracterizado su función, aunque se sugiere un papel antioxidante en las localizaciones ya mencionadas.

    Query: GPX6

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 59438-59440 (nt), 73 (aa)

    Strand: +

    Scaffold: gi|397463514|gb|JH731987.1|:subseq(150000,100000)

    Posición en el genoma: 59292 -> 60578 (nt)

    Exones: 5

    Longitud de la proteína: 221 (aa)

    Longitud de la query: 23 -> 221 (aa)

    SECIS: Sí, posición 61362-61407 (nt)

    En Exonerate se observa que existe una selenocisteína en Alligator mississippiensis codificada por un codón TGA en la posición 59438-59440 (nt), que se alinea con una selenocisteína en la query humana. Además, se ha encontrado un elemento SECIS en 3'UTR del codón TGA, a una distancia de 1922 pares de bases. En base a estos dos criterios se puede afirmar que GPX6 es una selenoproteína.

    El proceso de alineamiento se ha realizado correctamente. Únicamente, cabe destacar que la secuencia obtenida con Genewise es más corta que la de Exonerate.

    FAMILIA TR: Thioredoxin reductases

    Las tioredoxina reductasas son oxidoreductasas que utilizan el NADPH para catalizar la reducción de la tioredoxina oxidada. La tioredoxina es utilizada como cofactor por muchas enzimas, lo cual permite mantener un ambiente reducido en relación al estado redox entre células. Las tioredoxina reductasas presentan dos motivos muy conservados: en el extremo N-terminal, Cys-Val-Asn-Val-Gly-Cys y, en el C-terminal, Gly-Cys-Sec-Gly. La presencia del motivo Cys-Sec en su centro activo les permite funcionar a pH ácido. En mamíferos existen TR1 (citosol/núcleo), que reduce la tioredoxina 1; TR2 (mitocondria), que reduce la tioredoxina 2; y TR3 (testículos), conocida también como tioredoxina-glutatión reductasa.

    TR1

    Query: TR1

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 41286-41288 (aminoácido 648)

    Strand: -

    Scaffold: gi|397461694|gb|JH733807.1|:subseq(0,100000)

    Posición en el genoma: 71200 -> 41281 (nt)

    Exones: 16

    Longitud de la proteína: 590 (aa)

    Longitud de la query: 58 -> 649 (aa)

    SECIS: Sí, posición 40982-41056 (nt)

    Se ha observado una selenocisteína en la posición 41286-41288 (nt) de la secuencia de Alligator mississippiensis, porque alinea con una selenocisteína en la query humana. Por otro lado, se encuentra un elemento SECIS en la región 3'UTR a 232 pares de bases de distancia respecto a la selenocisteína. Por ello, se puede concluir que TR1 es una selenoproteína.

    El alineamiento generado por T-Coffee es correcto, aunque cabe destacar que ha habido un intercambio de aminoácidos en la posición donde se encuentra la selenocisteína. Además, para el genoma de aligátor, T-Coffee muestra dos codones STOP no presentes en Exonerate, por lo que podría tratarse de un error en el alineamiento del software.

    TR2

    Query: TR2

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 47681-47683 (nt), 523 (aa)

    Strand: -

    Scaffold: gi|397458791|gb|JH736710.1|:subseq(380000,120000)

    Posición en el genoma: 112107 -> 47676 (nt)

    Exones: 15

    Longitud de la proteína: 516 (aa)

    Longitud de la query: 8 -> 524 (aa)

    SECIS: Sí, posición 47350-47425 (nt)

    TR2 presenta una selenocisteína en la posición 47681-47683 (nt) de la secuencia de aligátor, debido a que alinea con una selenocisteína en la query humana. Se ha podido localizar un elemento SECIS en posición 47350-47425 (nt), a 258 pares de bases de la selenocisteína. Por todo ello, TR2 se clasifica como Selenoproteína.

    TR2 también presenta en el alineamiento por T-Coffee, un intercambio de aminoácidos en la posición donde se encuentra la selenocisteína. A pesar de ello, todos los resultados obtenidos durante el alineamiento de secuencias han sido correctos.

    TR3

    Query: TR3

    Especie: Homo sapiens

    Tipo: No selenoproteína

    Posición de selenocisteína: 41285-41287 (nt), 697 (aa)

    Strand: -

    Scaffold: gi|397461694|gb|JH733807.1|:subseq(0,100000)

    Posición en el genoma: 91172 -> 41281 (nt)

    Exones: 19

    Longitud de la proteína: 652 (aa)

    Longitud de la query: 46 -> 698 (aa)

    SECIS: Sí, posición 11740-11814 (nt)

    TR3 presenta una selenocisteína en la posición 41285-41287 (nt) de la secuencia del Alligator mississippiensis, ya que se alinea con una selenocisteína en la query humana. También aparece un codón STOP en el centro de la secuencia de aligátor, por lo que se pueden dar dos hechos: que esta proteína proceda de un pseudogen o que se haya producido un error en el alineamiento.

    Al igual que TR1 y TR2, el alineamiento generado por T-Coffee vuelve a presentar un intercambio entre los dos últimos aminoácidos, donde la última glicina de aligátor alinea con la selenocisteína humana. No obstante, se ha observado un alineamiento correcto con Exonerate y Genewise.

    Por último, se ha localizado un elemento SECIS en la región 3'UTR, a 29473 pares de bases de distancia respecto a la selenocisteína. Debido a que la distancia es elevada, y el score del elemento SECIS no es idóneo, TR3 no se considera una selenoproteína.

    FAMILIA Sel

    Sel15

    Se trata de una selenoproteína de 15 kDa localizada en el retículo endoplasmático, principalmente de riñones, tiroides y paratiroides. Se caracteriza por su plegamiento tipo-tioredoxinas y el motivo conservado Cys-X-X-Sec. Funciona como tiol-disulfuro oxidoreductasas. Se ha sugerido que también controla el correcto plegamiento de las proteínas en el ER y la correcta formación de los puentes disulfuro.

    Query: SEL15

    Especie: Homo sapiens

    Tipo: No selenoproteína

    Posición de selenocisteína: 43076-43079 (nt), 94 (aa)

    Strand: +

    Scaffold: gi|397456477|gb|JH739023.1|:subseq(600000,100000)

    Posición en el genoma: 15419 -> 65849 (nt)

    Exones: 4

    Longitud de la proteína: 137 (aa)

    Longitud de la query: 25 -> 162 (aa)

    SECIS: Sí, posición 66452-66526 (nt)

    La secuencia de Alligator mississippiensis presenta una selenocisteína porque aparece un codón TGA en la posición 43076-43079 (nt). También se observa un elemento SECIS en 3'UTR de la secuencia a una distancia de 23373 pares de bases. Debido a que la distancia es elevada, Sel15 no se considera una selenoproteína.

    A pesar de ello, todos los resultados obtenidos durante el alineamiento de Sel15 con la query de Homo sapiens han sido óptimos.

    SelH

    Se trata de una selenoproteína de 14 kDa que presenta un plegamiento tipo-tioredoxina, que conserva el siguiente motivo -Cys-X-X-Sec-. Se localiza en el núcleo, donde actúa como un elemento de respuesta a un estado redox alterado. Se une al DNA y regula la expresión de genes implicados en la síntesis de novo de glutatión y la fase II de detoxificación.

    Query: SELH

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 47288-47290 (nt), 44 (aa)

    Strand: +

    Scaffold: gi|397463590|gb|JH731911.1|:subseq(180000,100000)

    Posición en el genoma: 46808 -> 47843 (nt)

    Exones: 4

    Longitud de la proteína: 121 (aa)

    Longitud de la query: 0 -> 122 (aa)

    SECIS: Sí, posición 48980-49059 (nt)

    La proteína SelH se puede clasificar dentro del grupo de selenoproteínas, porque presenta un codón TGA que codifica para una selenocisteína y contiene un elemento SECIS en la región 3'UTR a una distancia de 1690 pares de bases.

    En el caso de SelH, mediante el tBLASTn se ha obtenido un valor significativo. Sin embargo, el resultado de Exonerate y Genewise no es óptimo. No se observan selenocisteínas en el output de este último software, porque el alineamiento se realiza en la región que no las contiene.

    SelI

    Se trata de una selenoproteína de función desconocida, aunque se sabe que contiene un motivo conservado en fosfolípido sintasas, por lo que se cree que está de alguna forma implicada en una ruta de biosíntesis de fosfolípidos. Su distribución tisular es ubicua.

    Query: SELI

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 23018-23020 (nt), 387 (aa)

    Strand: -

    Scaffold: gi|397463253|gb|JH732248.1|:subseq(0,80000)

    Posición en el genoma: 44683 -> 22986 (nt)

    Exones: 12

    Longitud de la proteína: 374 (aa)

    Longitud de la query: 18 -> 397 (aa)

    SECIS: Sí, posición 21626-21702 (nt)

    En este caso se puede observar un codón TGA que codifica para una selenocisteína en la posición 23018-23020 (nt) de la secuencia de Alligator mississippiensis, y que alinea además con otra selenocisteína en Homo sapiens. Encontramos un elemento SECIS a una distancia 1316 pares de bases respecto a la selenocisteína, por lo que se determina que SelI es una selenoproteína.

    Es necesario destacar que el alineamiento entre la proteína de aligátor y de humano se ha realizado correctamente. El alineamiento coincide en Genewise y Exonerate a lo largo de toda la secuencia proteica pero, con el primer programa, se ha obtenido una secuencia que no contiene los últimos 11 aminoácidos. La selenocisteína se encuentra en esta región del final, por tanto, el output del Genewise no contiene este aminoácido. Esto puede ser debido a que el Genewise no es tan eficiente y pierde información durante la comparación de secuencias.

    SelK

    Se trata de una selenoproteína de 16 kDa localizada en el retículo endoplasmático. Su función es aún desconocida, aunque está en estudio su función antioxidante en este orgánulo.

    Query: SELK

    Especie: Pelodiscus sinensis

    Tipo: Selenoproteína

    Posición de selenocisteína: 57656-57658 (nt), 92 (aa)

    Strand: +

    Scaffold: gi|397459294|gb|JH736207.1|:subseq(0,100000)

    Posición en el genoma: 54271 -> 57664 (nt)

    Exones: 4

    Longitud de la proteína: 94 (aa)

    Longitud de la query: 0 -> 94 (aa)

    SECIS: Sí, posición 58477 - 58555 (nt)

    No se ha conseguido un alineamiento correcto comparando la secuencia de SelK de Alligator mississippiensis y Homo sapiens, por lo que se ha realizado el alineamiento con una especie más cercana, Pelodiscus sinensis.

    SelK presenta en el genoma de aligátor un codón TGA que codifica para una selenocisteína que alinea con el mismo aminoácido en Pelodiscus sinensis. También presenta un elemento SECIS en la posición 58477 - 58555 (nt), a una distancia de 819 pares de bases de la selenocisteína. Por ello se puede concluir que SelK es una selenoproteína.

    SelM

    Se trata de una selenoproteína de 15 kDa localizada en el retículo endoplasmático. Se caracteriza por su plegamiento tipo-tioredoxinas y el motivo conservado Cys-X-X-Sec. Funciona como tiol-disulfuro oxidoreductasas. Se ha sugerido que también controla el correcto plegamiento de las proteínas en el ER.

    Query: SELM

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: : 51136-51134 (nt), 48 (aa)

    Strand: -

    Scaffold: gi|397458552|gb|JH736949.1|:subseq(85500,100000)

    Posición en el genoma: 51154 -> 47918 (nt)

    Exones: 7

    Longitud de la proteína: 95 (aa)

    Longitud de la query: 41 -> 136 (aa)

    SECIS: Sí, posición 47118-47191 (nt)

    SelM contiene una selenocisteína en la posición 51136-51134 (nt) de la secuencia de aligátor, también presente en humano. Cabe decir que también se ha encontrado un elemento SECIS a 3983 pares de bases de la selenocisteína. Se puede concluir que SelM es una selenoproteína.

    El alineamiento obtenido en Exonerate es parcialmente bueno aunque encontramos algunos aminoácidos que no alinean bien. Por otro lado, en Genewise se obtiene una secuencia más corta del aligátor, motivo por el cual no fue posible localizar el codón TGA en este software.

    SelN

    Se trata de una selenoproteína de 70 kDa, localizada transmembrana en el ER. La isoforma 1 del gen SelN se corresponde con la totalidad del transcrito, mientras que la 2 excluye el exón 3. Ambos transcritos se expresan en músculo esquelético, cerebro, pulmón y placenta, aunque predomina la isoforma 2, que también se expresa en corazón, diafragma y estómago. En relación al músculo esquelético, se cree que SelN actúa regulando la movilización de calcio a través de los canales de rianodina del ER necesaria para el correcto desarrollo y diferenciación del músculo. Cabe destacar que estos canales son muy sensibles al estado redox de las células.

    Query: SELN

    Especie: Pelodiscus sinensis

    Tipo: Selenoproteína

    Posición de selenocisteína: : 66470-66472 (nt) 369 (aa)

    Strand: +

    Scaffold: gi|397456876|gb|JH738624.1|:subseq(580000,100000)

    Posición en el genoma: 1122 -> 70900 (nt)

    Exones: 12

    Longitud de la proteína: 495 (aa)

    Longitud de la query: 0 -> 496 (aa)

    SECIS: Sí, posición 74091-74161 (nt)

    Aunque se encontró una selenocisteína en la posición 66470-66472 (nt) al comparar la secuencia de aligátor con la query de Homo sapiens, y se predijo un elemento SECIS, hemos obtenido un mal alineamiento. Tanto el cDNA como el translate son más largos de lo esperado. Genewise y T-Coffee tampoco presentan un alineamiento correcto. Por éste motivo, para predecir si SelN es una selenoproteína, se ha comparado con una especie más cercana que Homo Sapiens y que esté bien caracterizada en SelenoDB2.0, en este caso Pelodiscus sinensis.

    SelN en Pelodiscus sinensis presenta un codón TGA que codifica para una selenocisteína en las posiciones 66470-66472 (nt) y contiene un elemento SECIS a 7619 pares de bases. A pesar de que el elemento SECIS esté un poco alejado, se puede considerar que SelN es una selenoproteína.

    El alineamiento mediante Genewise y Exonerate se realizó correctamente. En cambio, el alineamiento extraído a partir de T-Coffee no se observa ninguna selenocisteína en aligátor, aunque los resultados de Exonerate permiten confirmar que SelN sí que está presenta en Alligator mississippiensis.

    SelO

    Se trata de una selenoproteína de 669 (aa) en humanos, pero suele corresponderse con un homólogo en cisteína en otras especies. Debido a la conservación del motivo Cys-X-X-Sec, se cree que podría tener una función redox.

    Query: SELO

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 49261-49263 (nt), 667 (aa)

    Strand: -

    Scaffold: gi|397461378|gb|JH734123.1|:subseq(1631486,119423)

    Posición en el genoma: 117707 -> 49254 (nt)

    Exones: 23

    Longitud de la proteína: 647 (aa)

    Longitud de la query: 22 -> 669 (aa)

    SECIS: Sí, posición 48894-48943 (nt)

    Se ha podido concluir que SelO es una selenoproteína, ya que se ha identificado un codón TGA en la secuencia de aligátor alineado con una selenocisteína en Homo sapiens en la posición 49261-49263 (nt). También aparece un elemento SECIS en la región 3'UTR en la posición 48894-48943 (nt), a una distancia de 369 pares de bases de la selenocisteína.

    No se ha obtenido un alineamiento correcto a partir de T-Coffee. Sin embargo, a partir de Genewise y Exonerate se han obtenido resultados similares y óptimos.

    SelP

    Se trata de la única selenoproteína que contiene varias selenocisteínas en la secuencia de aminoácidos. Es una glicoproteína extracelular localizada en el plasma, y se cree que actúa como transportador de selenio principalmente, pero también se ha observado la presencia de dominios de actividad glutatión peroxidasa, unión a heparina y formación de complejos con iones de metales pesados. Se ha sugerido que la primera selenocisteína en el extremo N-terminal aporta capacidad antioxidante a las células, siendo esto relevante para algunas enfermedades infecciosas, enfermedades neurodegenerativas y cáncer.

    Query: SELP

    Especie: Pelodiscus sinensis

    Tipo: Selenoproteína

    Posición de selenocisteína: 52170-52172 (nt), 40 (aa)

    Strand: -

    Scaffold: gi|397460716|gb|JH734785.1|:subseq(44689,103000)

    Posición en el genoma: 52289 -> 17448 (nt)

    Exones: 5

    Longitud de la proteína: 187 (aa)

    Longitud de la query: 14 -> 201 (aa)

    SECIS: Sí, posición 49207 - 49286 (nt)

    Inicialmente, se llevo a cabo el alineamiento de esta proteína con la query humana. Sin embargo, a pesar de que el E-value de tBLASTn era bueno (2 x 10-20), los resultados de T-Coffee mostraban muchas selenocisteínas hacia el final de la secuencia de la proteína humana, algunas alineadas con selenocisteínas, y otras que alinean con cisteínas u otros aminoácidos. Por todo ello, se decidió repetir la predicción con la query de Pelodiscus sinensis, que es una especie más cercana a aligátor que la humana.

    Se pudo concluir que SelP es una selenoproteína, debido a que se ha encontrado una selenocisteína en la posición 52170-52172 (nt) y existe un elemento SECIS a 2925 pares de bases de distancia respecto a la selenocisteína.

    SelR1

    Es la única selenoproteína perteneciente a la familia de las metionina-sulfóxido reductasas (MsrB). Existen tres proteínas en humano; la selenoproteína SelR1 y dos homólogos en Cisteína R2 y R3, también llamadas MsrB1, MsrB2 y MsrB3 respectivamente. Su función es reducir los niveles de oxidación que se producen sobre los residuos de metionina de las proteínas (sulfóxidos de metionina).

    Query: SELR1

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 59654-59656 (nt), 95 (aa)

    Strand: +

    Scaffold: gi|397459852|gb|JH735649.1|:subseq(240000,100000)

    Posición en el genoma: 57913 -> 70497 (nt)

    Exones: 4

    Longitud de la proteína: 115 (aa)

    Longitud de la query: 0 -> 115 (aa)

    SECIS: Sí, posición 61203 - 61275 (nt)

    SelR1 contiene una selenocisteína, también presente en Homo sapiens, en la posición 59654-59656 (nt). Además, se ha encontrado un elemento SECIS a 1547 pares de bases de la selenocisteína. Por esta razón, se concluye que SelR1 es una selenoproteína.

    También cabe destacar que la predicción de Genewise no incluía la selenocisteína, por lo que no se pudieron comparar los resultados de ambos programas de predicción de genes. Asimismo, el translate de aligátor no es correcto, porque solapa los dos outputs de Exonerate.

    Los resultados obtenidos durante el alineamiento de las secuencias indican que la proteína de humano y aligátor tienen gran similitud. En el caso de Genewise, se ha obtenido una secuencia aminoacídica más corta, pero que coincide a la perfección con el resultado de Exonerate. Por tanto, se puede concluir que Alligator mississippiensis conserva esta proteína en su genoma, sin presentar grandes cambios en la secuencia.

    SelS

    Se trata de una selenoproteína transmembrana del retículo endoplasmático y la membrana plasmática, que participa en la translocación de proteínas mal plegadas desde el ER hacia el citosol para que sean degradadas y así proteger a las células del estrés oxidativo. Se ha observado que SNPs en el promotor del gen de SelS regulan los niveles de citoquinas inflamatorias, mientras que, por otro lado, la expresión de SelS modula el metabolismo de la glucosa y el estrés en el ER.

    Query: SELS

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 50012-50014 (nt), 180 (aa)

    Strand: -

    Scaffold: gi|397460072|gb|JH735429.1|:subseq(99000,200000)

    Posición en el genoma: 185593 -> 50008 (nt)

    Exones: 18

    Longitud de la proteína: 181 (aa)

    Longitud de la query: 8 -> 189 (aa)

    SECIS: Sí, posición 49124-49204 (nt)

    A pesar de que el E-value de tBLASTn no es tan significativo como en otros casos (6 x 10-5), el alineamiento de T-Coffee tampoco es correcto dado que muestra una selenocisteína en humano alineada con una glicina en aligátor. Se puede confirmar que se trata de una selenocisteína a través del output de Exonerate, por lo que se concluye que ha podido producirse un error en el alineamiento de T-Coffee. Además, en el output de Exonerate, se observa un codón STOP en la secuencia de aligátor alineado con una lisina en la query de humano, lo cual indica que pueda proceder de un pseudogen o que el alineamiento sea erróneo en esa región.

    También cabe destacar que la predicción de Genewise no incluía la selenocisteína, por lo que no se pudieron comparar los resultados de ambos programas de predicción de genes. Asimismo, el translate de aligátor no es correcto, porque solapa los dos outputs de Exonerate.

    Se pudo concluir que SelS es una selenoproteína porque se observa una selenocisteína en la posición 50012-50014 (nt) y aparece un elemento SECIS a 810 pares de bases de distancia respecto a la selenocisteína.

    SelT

    Esta selenoproteína pertenece a una subfamilia de selenoproteínas, que incluye a SelW, SelH y SelV, por su plegamiento tipo-tioredoxina y el motivo conservado Cys-X-X-Sec. Se localiza en retículo endoplásmico a través de un dominio hidrofóbico y su función es desconocida, aunque se ha relacionado con respuesta a estrés oxidativo y movilización de calcio.

    Query: SELT

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 58279-58281 (nt), 49 (aa)

    Strand: -

    Scaffold: gi|397463993|gb|JH731508.1|:subseq(490000,100000)

    Posición en el genoma: 62322 -> 54266 (nt)

    Exones: 5

    Longitud de la proteína: 195 (aa)

    Longitud de la query: 25 -> 246 (aa)

    SECIS: Sí, posición 48441-48522 (nt)

    En el caso de SelT se ha visto una selenocisteína en el genoma de Alligator mississippiensis, presente también en Homo sapiens. Se ha encontrado un elemento SECIS a 9757 pares de bases del codón TGA. A pesar de que el elemento SECIS esté alejado, SELT se puede clasificar como una selenoproteína.

    La proteína de aligátor se ha alineado perfectamente con la de humana ya que los análisis de predicción obtenidos son altamente significativos. Este hecho indica que SelT es una selenoproteína altamente conservada a lo largo de la evolución.

    SelV

    Se trata de una selenoproteína humana que procede de la duplicación de SelW en mamíferos. SelV se expresa exclusivamente en los testículos. Su función está asociada al equilibrio redox.

    Query: SELV

    Especie: Homo sapiens

    Tipo: No selenoproteína

    Se ha determinado que la proteína SelV no existe en Alligator mississippiensis, ya que al realizar el tBLASTn alineando la secuencia con Homo sapiens, el E-value obtenido era elevado. Únicamente se obtuvieron dos hits no significativos con E-values de 0.76 y 4.9. A partir de aquí, no se pudo realizar el alineamiento correctamente: en las secuencias extraídas a partir de Exonerate, Fastatranslate y Genewise no aparecen selenocisteínas y, además, en este último software se ha obtenido una secuencia muy pequeña que no coincide con la secuencia anteriormente predicha. Por esta razón, se intentó alinear con Pelodiscus sinensis, otro reptil, pero este tampoco contenía la selenoproteína. De esta manera, se concluye que SelV no está presente en Alligator mississippiensis.

    SelW1

    Se trata de una pequeña selenoproteína de 9,5 kDa que contiene el motivo Cys-X-X-Sec. Se sabe que interacciona con el glutatión, lo que sugiere que tiene un papel antioxidante en las células.

    Query: SELW1

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 47890-47892 (nt), 13 (aa)

    Strand: +

    Scaffold: gi|397461887|gb|JH733614.1|:subseq(500000,100000)

    Posición en el genoma: 42828 -> 47895 (nt)

    Exones: 5

    Longitud de la proteína: 87 (aa)

    Longitud de la query: 0 -> 87 (aa)

    SECIS: Sí, posición 48204-48281 (nt)

    SelW1 es una selenoproteína dado que se ha observado la presencia de una selenocisteína cuando se ha alineado el genoma de Alligator mississippiensis con el de Homo sapiens. Asimismo, se ha localizado un elemento SECIS a 312 pares de bases del codón TGA. Por tanto, se puede concluir que SelW1 es una selenoproteína.

    A pesar de no haber obtenido un E-value altamente significativo en el tBLASTn (0.03), se han conseguido buenos resultados durante el alineamiento de las dos proteínas, por lo que se puede considerar que SelW1 está conservada en nuestra especie. Solamente con Genewise no se ha obtenido el resultado esperado, ya que la secuencia proteica del aligátor no contiene los primeros 16 aminoácidos entre los que se encontraba la selenocisteína. También se ha perdido el último aminoácido del final de la secuencia porque el anterior es un codón STOP.

    FAMILIA SPS: Selenophosphate synthetase

    Se trata de una selenoproteína que es uno de los enzimas implicados en la biosíntesis de las selenoproteínas, concretamente se encarga de la síntesis del monoselenofosfato para que este pueda incorporarse al seril-tRNAser. SPS2 autoregula su propia producción en relación al resto de selenoproteínas. SPS1 es un análogo en cisteína.

    SPS2

    Query: SPS2

    Especie: Homo sapiens

    Tipo: Selenoproteína

    Posición de selenocisteína: 50075-50077 (nt), 60 (aa)

    Strand: +

    Scaffold: gi|397458164|gb|JH737337.1|:subseq(347813,73300)

    Posición en el genoma: 14401 -> 53565 (nt)

    Exones: 10

    Longitud de la proteína: 444 (aa)

    Longitud de la query: 0 -> 444 (aa)

    SECIS: Sí, posición 54027-54101 (nt)

    SPS2 es una selenoproteína porque la secuencia cumple dos condiciones: presenta un codón TGA codificante para una selenocisteína y contiene un elemento SECIS en la región 3'UTR. La distancia entre estos dos elementos es de 3950 pares de bases.

    Es importante comentar que la secuencia de humano y aligátor alinean correctamente. La principal diferencia entre secuencias, es que la proteína de Homo sapiens es más larga y contiene otra selenocisteína, pero se trata de una región que ya no alinea con la secuencia de Alligator mississippiensis. Asimismo, mediante el Genewise se ha extraído una secuencia en la que faltan los primeros 32 aminoácidos, pero coincide perfectamente con los resultados extraídos del alineamiento de Exonerate.

    Maquinaria de traducción de selenoproteínas

    SPS1

    Query: SPS1

    Especie: Homo sapiens

    Strand: -

    Scaffold: gi|397458686|gb|JH736815.1|:subseq(0,98669)

    Posición en el genoma: 48849 -> 21200 (nt)

    Exones: 7

    Longitud de la proteína: 325 (aa)

    Longitud de la query: 0 -> 321(aa)

    En el caso de SPS1, al realizar el tBLASTn se ha obtenido un E-value de 4 x 10-34 y los resultados obtenidos a lo largo del alineamiento con Homo sapiens son correctos.

    SECS

    Query: SECS

    Especie: Homo sapiens

    Strand: -

    Scaffold: gi|397463559|gb|JH731942.1|:subseq(600000,155000)

    Posición en el genoma: 115575 -> 66275 (nt)

    Exones: 11

    Longitud de la proteína: 470 (aa)

    Longitud de la query: 0 -> 470 (aa)

    Los resultados obtenidos durante el alineamiento son significativos, por ejemplo, el tBLASTn presenta un E-value de 7 x 10-25. Las secuencias alinean correctamente, aunque la secuencia de aligátor es 32 aminoácidos más corta por el extremo 3'. Se puede concluir que el gen que codifica para la proteína SecS, encargada de la maquinaria de las selenoproteínas, también está presente en Alligator mississippiensis.

    SECP43

    Query: SECP43

    Especie: Homo sapiens

    Strand: -

    Scaffold: gi|397461042|gb|JH734459.1|:subseq(152395,112049)

    Posición en el genoma: 62489 -> 49999 (nt)

    Exones: 9

    Longitud de la proteína: 287 (aa)

    Longitud de la query: 0 -> 287 (aa)

    La proteína secp43 también está presente en aligátor, ya que la secuencia de nuestra especie ha alineado a la perfección con la secuencia presente en humano. Se trata de una proteína que forma parte de la maquinaria de las selenoproteínas.

    SBP2

    Query: SBP2

    Especie: Homo sapiens

    Strand: +

    Scaffold: gi|397459409|gb|JH736092.1|:subseq(0,100000)

    Posición en el genoma: 11801-78644 (nt)

    Exones: 37

    Longitud de la proteína: 844 (aa)

    Longitud de la query: 0 -> 844 (aa)

    El E-value de SBP2 es significativo (6 x 10-26), y el alineamiento obtenido mediante Exonerate es correcto. A pesar de que el alineamiento con T-Coffee no es óptimo, hay regiones de las secuencias que alinean perfectamente, por lo que se puede concluir que SBP2 sí que se encuentra en el genoma de Alligator mississippiensis.

    PSTK

    Query: PSTK

    Especie: Homo sapiens

    Strand: +

    Scaffold: gi|397460868|gb|JH734633.1|:subseq(120000,100000)

    Posición en el genoma: 749708 -> 95000 (nt)

    Exones: 9

    Longitud de la proteína: 321 (aa)

    Longitud de la query: 15 -> 336 (aa)

    El E-value de PSTK es significativo (5 x 10-26) y el alineamiento en Exonerate es correcto, por lo que se puede concluir que PSTK también se encuentra en el genoma del aligátor. En la secuencia de aminoácidos obtenida con el Fastatranslate se observó un codón STOP por lo que la proteína en Alligator mississippiensis es más corta que en Homo sapiens.

    eEFsec

    Query: eEFsec

    Especie: Homo sapiens

    Strand: -

    Scaffold: gi|397462090|gb|JH733411.1|:subseq(110221,245320)

    Posición en el genoma: 245320 -> 49999 (nt)

    Exones: 7

    Longitud de la proteína: 1135 (aa)

    Longitud de la query: 12 -> 595 (aa)

    En este caso se ha obtenido un buen alineamiento con Genewise y Exonerate al comparar la query humana con la secuencia de aligátor. No obstante, el output extraído a partir de Fastatranslate es más largo y aparecen varios codones STOP en el centro de la proteína, por lo que la traducción de la secuencia no se ha realizado correctamente. A partir de los resultados obtenidos, se puede concluir que esta proteína está conservada en el genoma del Alligator mississippiensis.