SELENOPROTEÍNAS DE Meleagris gallopavo

CONCLUSIONES

- Hemos aplicado un método de búsqueda y anotación de selenoproteínas basado en la identificación de secuencias homólogas mediante tBLASTn.

- Como query hemos usado un total de 99 selenoproteínas muy bien caracterizadas procedentes de organismos relativamente distantes.

- Posteriormente hemos utilizado dos programas de predicción de la estructura génica que utilizan secuencias aminoacídicas homólogas como query para predecir la estructura del gen codificado en la secuencia génica de la región donde se espera que esté la selenoproteína homóloga.

- Hemos agrupado todos los hits redundantes y los hemos visualizado en alineamientos múltiples para decidir si la predicción de la selenoproteína es correcta.

- Se han buscado elementos SECIS en la región 3' de las selenoproteínas predichas. En algunos casos los hemos encontrado, hecho que respalda nuestras predicciones, pero en otros casos no, pudiéndose deber tanto a la ausencia de dichos elementos como a errores en los parámetros de búsqueda así como a limitaciones del método de búsqueda en si.

-Hemos utilizado el score de alineamientos de pares de secuencias usando t_coffee para elegir las mejores predicciones pero hemos visto que este sitema no siempre otorga un mayor score a la mejor predicción. En consecuencia, se ha dado mayor peso a los resultados del multiple-alignment, mucho más informativos.

-Hemos contrastado nuestros resultados con los obtenidos con SelenoProfiles. Este es un método de anotación más sofisticado que utiliza perfiles de las distintas familias de selenoproteínas para encontrar secuencias homólogas en vez de realizar comparaciónes de pares de secuencias. Los resultados de ambos métodos han coincidido en 24 predicciones de un total de 31 selenoproteínas que hemos dado por buenas. De las selenoproteínas restantes, nuestro método ha conseguido predecir 4 selenoproteínas que SelenoProfiles no había reportado y SelenoProfiles ha conseguido predecir 3 selenoproteínas más que nuestro método había pasado por alto. La principal limitación de ambos métodos es que no permiten identificar nuevas selenoproteínas ya que solo permiten identificar homólogos de selenoproteínas que ya se conocían.

-Hemos comparado nuestros resultados con los resultados esperados en función de la filogénia del selenoproteoma de los vertebrados y hemos identificado algunas diferencias respecto al selenoproteoma de Gallus gallus, que es el pariente más cercano de Meleagris gallopavo del cual se ha caracterizado el selenoproteoma. Finalmente, comentar que en la búsqueda de los genes anotados de NCBI, hemos encontrado algunas diferencias. Mientras que algunos coinciden con nuestras predicciones, algunos de los genes que hemos identificado como posibles selenoproteínas no están anotados como tales en NCBI. En este caso, creemos que deberíamos analizar nuestros resultados con más precisión antes de decidir si la anotación de NCBI es incorrecta. Por otro lado, hay casos en que en la misma región del genoma, nosotros predecimos la existencia de una selenoproteína mientras que NCBI predice otra. Esto pone de manifiesto la dificultad que representa anotar correctamente las selenoproteínas y sugiere que es necesario revisar esta anotación.

TABLA DE SELENOPROTEÍNAS ENCONTRADAS

SELENOPROTEÍNA POSICIÓN NCBI ID EXONERATE GENEWISE SELENOPROFILES PROTEIN REPORT MANUAL CURING
eEFSec 14(-):9947409...9859308
GPx1 14(+):2807261...2807872
GPx2 5(-):6276758...6276132
GPx3 15(-):12636915...12635979 No anotada
GPx4 30(+):2516312...2516800
GPx8 10(+):25215813...25218055
DI1 10(+):25904938...25908050
DI2 5(-):42327820...42315802
MsrA 2(+):112284726...112470320 No anotada
MsrA 25(-):1932125...1930469
SelR1 16(-):6421974...6421606
SelR3 1(+):35733089...35786063
SBP2 12(-):10275751...10275548
SPS1 1(+):8220148...8239794
Sel15 2(-):110511427...110511756 No anotada
Sel15 10(+):16641642...16657948 No anotada
SelH 5(+):17039443...17039538
SelI 2(+):110474340...110479632
SelK 14(-):7500561...7500475
SelN 25(-):2019159...2009276 No anotada
SelO 1(+):20711232...20716200 No anotada
SelP 10(+):21875037...21874369 No anotada
SelP Z(-):14505243...14500506
SelS 12(-):17666982...17666902
SelT 22(-):11472492...11472511
SelU Z(-):44981578...44983202
SelU1 8(+):1361244...1355117
SelW2 GL425690.1(+):1571...1669
TR1 1(-):55633019...55618286
TR2 17(-):1061097...1032927
TR3 14(+):10914838...10928189

     Proteína maquinaria de síntesis de selenoproteínas
     Selenoproteína
     Homólogo con cisteína
     Misma proteína anotada en NCBI
     Diferente proteína anotada en NCBI



......................................................................................................................................................................................................................................................