resum
Les selenoproteïnes són proteïnes que han incorporat l´aminoàcid selenocisteïna (Sec-U) i que contenen una seqüència d´inserció de selenocisteïna (element SECIS) a l´extrem 3´ del gen. Sec-U està codificat pel codó UGA, el qual també és un codó de finalització de la traducció. Per tant, molts dels genomes seqüenciats no han tingut en compte l´existència de l´aminoàcid Sec-U i no han estat ben anotats.
Aquest estudi té com a objectiu identificar les selenoproteïnes del genoma de Leishmania mexicana. Com que aquest és un genoma no ensamblat i dividit en contigs hem necessitat d´una altra espècie amb una alta homologia amb el nostre genoma per realitzar l´estudi. L´espècie que hem escollit és Leishmania major, una altra espècie del gènere Leishmania que té el genoma ja ensamblat i presenta un 95% d´homologia. El procediment que hem seguit ha estat analitzar, primerament, el genoma de L.major i posteriorment, el de L.mexicana per tal de poder realitzar a continuació un estudi comparatiu que ens permeti identificar les selenoproteïnes en L.mexicana.
A causa de la quantitat de dades generades i de la necessitat que qualsevol experiment científic sigui reproduïble, hem trobat oportú automatitzar el procés. Per fer això possible, hem creat i utilitzat diversos scripts en llenguatge PERL i hem utilitzat diverses comandes de UNIX que hem fet constar en aquest treball.