Resum
L'objectiu d'aquest projecte és determinar totes les selenoproteïnes existents en el genoma de Chrysochloris asiatica. Les selenoproteïnes són aquelles proteïnes que incorporen una selenocisteïna (abreviada com a SeC o U i considerada l'aminoàcid 21) a la seqüència del seu gen. La SeC és codificada per el codó UGA, que normalment funciona com a codó Stop i això en dificulta l'anotació per part de les eines bioinformàtiques. Només en el cas de les selenoproteïnes el codó es recodifica per una selenocisteïna, això està mediat per la presència d'una estructura característica anomenada SECIS (Seleno Cystein Insertion Sequence) en l'extrem 3' del gen.
Per tal d'assolir l'objectiu es compararà el genoma adjudicat amb el genoma d' Homo sapiens i el d' Echinops telfairi: en l'humà s'han pogut caracteritzar correctament les selenoproteïnes - i aquestes estan molt conservades en vertebrats - i l' E.telfairi és l'animal amb selenoproteïnes identificades més proper al nostre talp. Per tal que el projecte sigui més complert es determinaran també les proteïnes de la maquinària de síntesi de selenoproteïnes i els elements SECIS. Per realitzar-ho es faran servir diferents programes bioinformàtics com el tBLASTn, Exonerate, GeneWise, T_coffee o SECISearch.
Els resultats mostren que en C. asiatica s'hi conserven moltes selenoproteïnes humanes i que aquestes coincideixen en alt grau amb les d'E.telfairi. Succeeix el mateix amb les proteïnes necessàries per la seva síntesi. Un aspecte a destacar és la dificultat de cerca de proteïnes en el genoma de E. telfairi , ja que la qualitat de l'anotació de proteïnes és menor que en humans i en molts casos només se'n troben fragments.
Resumen
El objetivo de este proyecto es determinar todas las selenoproteínas existentes en el genoma de Chrysochloris asiatica. Las selenoproteínas son proteínas que incluyen una selenocisteína (considerada el aminoácido 21 y abreviada como SeC o U) en la secuencia de su gen. Ésta es codificada por el codón UGA: éste habitualmente funciona como codón Stop y esto dificulta su anotación cuando usamos herramientas bioinformáticas. Únicamente en el caso de las selenoproteínas el codón se recodifica por una selenocisteína, esto está mediado por la presencia de una estructura característica llamada SECIS (Seleno Cystein Insertion Sequence) en el extremo 3' del gen.
Para alcanzar nuestro objetivo, se comparará el genoma que se nos ha asignado con el genoma de Homo sapiens y el de Echinops telfairi: el genoma humano tiene caracterizadas correctamente las selenoproteínas - que se encuentran muy conservadas en vertebrados - y E. telfairi es el animal con selenoproteínas identificadas más próximo filogenéticamente a nuestro topo. Para completar el trabajo también se determinaran las proteínas de maquinária de síntesis de selenoproteínas y los elementos SECIS presentes en el genoma. Para realizar la comparación, se usaran programas bioinformáticos como tBLASTn, Exonerate, GeneWise, T_coffee o SECISearch.
Los resultados muestran que en C.asiatica se conservan muchas selenoproteínas humanas y que estas coinciden en alto grado con las de E.telfairi. Lo mismo sucede con las proteínas necesarias para su síntesis. Destaca la dificultad para encontrar proteínas en el genoma de E. telfairi , debido a que su calidad de anotación de proteínas es menor que en humanos y en muchos casos sólo encontramos fragmentos.
Abstract
The aim of this project is to determine all selenoproteins which are present in the genome of Chrysochloris asiatica. Selenoproteins are proteins that include a selenocysteine - abbreviated as SeC or U and considered the 21th amino acid - in their sequence. Selenocysteine is encoded by the UGA codon, which usually is interpretated as a stop codon, difficulting a correct annotation when bioinformatics tools are used. Only in the case of selenoproteins, codon is recoded by a selenocysteine, this is mediated by the presence of a SECIS element (selenium cysteine insertion sequence) in the 3' gene extreme.
To achieve our objective, the assigned genome will be compared to Homo sapiens and Echinops telfairi genomes. These species have been chosen because in humans selenoproteins have been well characterized - and these remain highly conserved in vertebrates - and because E.telfairi is the mole most recent ancestor with analyzed selenoproteome. To complete the project we will also determine whether there are any synthesis machinery proteins of selenoproteins and SECIS elements. In order to compare these genomes, we will use bioinformatics programs such as tBLASTn, Exonerate, GeneWise, T_coffee or SECISearch.
Results show that most of human selenoproteins are conserved in C. asiatica genome and these have high similarity to those in E. telfairi. The same occurs when we compare synthesis machinery proteins. However, it is quite difficult to find valid SECIS elements in E. telfairi genome. That is because its protein anotation quality is worst than that in humans and in many cases we find genome fragmented.