- Hemos aplicado un método de búsqueda y anotación de selenoproteínas basado en la identificación de secuencias homólogas mediante tBLASTn.
- Como query hemos usado un total de 99 selenoproteínas muy bien caracterizadas procedentes de organismos relativamente distantes.
- Posteriormente hemos utilizado dos programas de predicción de la estructura génica que utilizan secuencias aminoacídicas homólogas como query para predecir la estructura del gen codificado en la secuencia génica de la región donde se espera que esté la selenoproteína homóloga.
- Hemos agrupado todos los hits redundantes y los hemos visualizado en alineamientos múltiples para decidir si la predicción de la selenoproteína es correcta.
- Se han buscado elementos SECIS en la región 3' de las selenoproteínas predichas. En algunos casos los hemos encontrado, hecho que respalda nuestras predicciones, pero en otros casos no, pudiéndose deber tanto a la ausencia de dichos elementos como a errores en los parámetros de búsqueda así como a limitaciones del método de búsqueda en si.
-Hemos utilizado el score de alineamientos de pares de secuencias usando t_coffee para elegir las mejores predicciones pero hemos visto que este sitema no siempre otorga un mayor score a la mejor predicción. En consecuencia, se ha dado mayor peso a los resultados del multiple-alignment, mucho más informativos.
-Hemos contrastado nuestros resultados con los obtenidos con SelenoProfiles. Este es un método de anotación más sofisticado que utiliza perfiles de las distintas familias de selenoproteínas para encontrar secuencias homólogas en vez de realizar comparaciónes de pares de secuencias. Los resultados de ambos métodos han coincidido en 24 predicciones de un total de 31 selenoproteínas que hemos dado por buenas. De las selenoproteínas restantes, nuestro método ha conseguido predecir 4 selenoproteínas que SelenoProfiles no había reportado y SelenoProfiles ha conseguido predecir 3 selenoproteínas más que nuestro método había pasado por alto. La principal limitación de ambos métodos es que no permiten identificar nuevas selenoproteínas ya que solo permiten identificar homólogos de selenoproteínas que ya se conocían.
-Hemos comparado nuestros resultados con los resultados esperados en función de la filogénia del selenoproteoma de los vertebrados y hemos identificado algunas diferencias respecto al selenoproteoma de Gallus gallus, que es el pariente más cercano de Meleagris gallopavo del cual se ha caracterizado el selenoproteoma. Finalmente, comentar que en la búsqueda de los genes anotados de NCBI, hemos encontrado algunas diferencias. Mientras que algunos coinciden con nuestras predicciones, algunos de los genes que hemos identificado como posibles selenoproteínas no están anotados como tales en NCBI. En este caso, creemos que deberíamos analizar nuestros resultados con más precisión antes de decidir si la anotación de NCBI es incorrecta. Por otro lado, hay casos en que en la misma región del genoma, nosotros predecimos la existencia de una selenoproteína mientras que NCBI predice otra. Esto pone de manifiesto la dificultad que representa anotar correctamente las selenoproteínas y sugiere que es necesario revisar esta anotación.
Proteína maquinaria de síntesis de selenoproteínas | |
Selenoproteína | |
Homólogo con cisteína |
Misma proteína anotada en NCBI | |
Diferente proteína anotada en NCBI |