Eidolon helvum

ABSTRACT



RESUMEN

Durante la traducción del mRNA, el codón UGA es generalmente interpretado como un codón STOP. Sin embargo, en determinados tránscritos, en el extremo 3' UTR aparece una estructura en forma de stem loop, denominada elemento SECIS (Seleno Cystein Insertion Sequence), que activa la maquinaria celular necesaria para la traducción de este codón al aminoácido U. Este aminoácido, catalogado como el número 21, se denomina selenocisteína (Sec) y se encuentra en un tipo de proteínas características, las selenoproteínas. Esta doble naturaleza del codón UGA dificulta la predicción de las selenoproteínas en las diferentes especies, por lo que durante años éstas han estado mal anotadas.

En este presente estudio, hemos utilizado un conjunto de programas informáticos ya desarrollados para predecir las selenoproteínas del genoma de Eidolon helvum mediante la comparación por homología de nuestro genoma con otros genomas cuyas selenoproteínas se encontraban anotadas. En particular, hemos utilizado el genoma de la especie más cercana a la nuestra (Pteropus vampyrus) y el genoma de Homo sapiens, cuando las selenoproteínas se encontraban mal anotadas en P. vampyrus.

En concreto, hemos usado los siguientes programas bioinformáticos: BLAST, Exonerate, GeneWise, Tcoffee, SECISearch3 y Seblastian. Además, hemos creado un programa que automatizaba los distintos comandos necesarios para analizar cada proteína.

Los resultados obtenidos muestran la predicción y anotación de 21 selenoproteínas, 8 homólogos de cisteína y 7 proteínas de maquinaria conservadas en Eidolon helvum. Estos resultados concuerdan con el selenoproteoma de Pteropus vampyrus.


ABSTRACT

During the mRNA translation, the UGA codon is generally regarded as a STOP codon. However, in some transcripts, a stem-loop shaped structure named SECIS (Seleno Cystein Insertion Sequence) appears in the 3' UTR region. This structure activates the celular machinery required for the translation of this codon into an U aminoacid. This aminoacid, the 21th, is called selenocysteine (Sec), and It is found in selenoproteins only.
This double role of the UGA codon complicates the selenoprotein prediction in most species. As a consequence, those proteins have been poorly annotated for years.

In this study, we have taken advantage of some already designed informatic programmes to predict and annotate the selenoproteins, the cysteine homologous proteins and the machinery proteins necessary for the selenoprotein's synthesis found in Eidolon helvum, a megabat species. In order to do that, we have compared by homology E. helvum's genome against other genomes in which the selenoproteins were already characterised. Concretely, we have used preferentially the Pteropus vampyrus genome, as It is a close species to E. helvum, and the Homo sapiens genome when the selenoproteins characterised in Pteropus vampyrus were poorly annotated.

In particular, we have used those bioinformatic programmes; BLAST, Exonerate, GeneWise, Tcoffee, SECISearch3 and Seblastian. In addition, we have created a programme that analyses automatically every protein.

Our results show the prediction and annotation of 21 selenoproteins, 8 cysteine homologues and 7 machinery proteins which are preserved in Eidolon helvum. These results are in agreement with those found in the Pteropus vampyrus selenoproteome.