Laie Abelló, Laura Angelats, Elena Armenteros, Alba Ayneto, Reyes Balcells

resum

Les selenoproteïnes són proteïnes que han incorporat l´aminoàcid selenocisteïna (Sec-U) i que contenen una seqüència d´inserció de selenocisteïna (element SECIS) a l´extrem 3´ del gen. Sec-U està codificat pel codó UGA, el qual també és un codó de finalització de la traducció. Per tant, molts dels genomes seqüenciats no han tingut en compte l´existència de l´aminoàcid Sec-U i no han estat ben anotats.
Aquest estudi té com a objectiu identificar les selenoproteïnes del genoma de Leishmania mexicana. Com que aquest és un genoma no ensamblat i dividit en contigs hem necessitat d´una altra espècie amb una alta homologia amb el nostre genoma per realitzar l´estudi. L´espècie que hem escollit és Leishmania major, una altra espècie del gènere Leishmania que té el genoma ja ensamblat i presenta un 95% d´homologia. El procediment que hem seguit ha estat analitzar, primerament, el genoma de L.major i posteriorment, el de L.mexicana per tal de poder realitzar a continuació un estudi comparatiu que ens permeti identificar les selenoproteïnes en L.mexicana.
A causa de la quantitat de dades generades i de la necessitat que qualsevol experiment científic sigui reproduïble, hem trobat oportú automatitzar el procés. Per fer això possible, hem creat i utilitzat diversos scripts en llenguatge PERL i hem utilitzat diverses comandes de UNIX que hem fet constar en aquest treball.

abstract

The Selenoproteins are proteins that have incorpored the selenocistein aminoacid (Sec-U), and have a selenocistein insertion sequence (SECIS element) in the 3' extreme of the gen. Sec-U is codified by UGA codon, which is also a STOP codon. Because of that, there are several sequenced genomes in which the existance of the Sec-U aminoacid has not been reported, for this reason the genomes are not anoted with selenoproteins.
The object of this project is to identify the selenoproteins in the Leishmania mexicana genome. As this genome it is not ensamblated, and it is divided by contigs, it was necessary to use another species which has higth homology with our genome.
The chosen species is Leishmania major, another species of the genus Leishmania, whose genome is ensambled anr which has 95% homology. The procedure followed analized, firstly, the Leishmania major genome, and after that, analized the Leishmania mexicana genome. Finally, we carried out a comparative study to allow us to identify the selenoproteins in L.mexicana.
Because of the amount of data generated and the necessity to have an experiment which can be reproduced, we found it appropiate to automatisize the process. To make this possible, we have created and used a variety of scripts in PERL language, and we have used different commands in UNIX, which are included in this project.

e-mail de contacte: treballsde4t@gmail.com