Abstract
Selenoproteins are a type of protein that contain a rare amino acid, selenocysteine (Sec or U). The codon coding for Sec is UGA, which is also a STOP codon. SECIS elements (Sec insertion sequence), localised in the 3'-UTR region allow the differential reading and prevent translation from being stopped. This unique characteristic of the genetic code makes it especially difficult to anotate selenoproteins by using bioinformatic tools.
The aim of this project is to anotate the selenoproteins and machinery proteins present in the genome of Struthio camelus australis, or southern ostrich, by using bioinformatic programmes such as tBLASTn, exonerate or T-Coffee. In order to achieve this, Homo sapiens and Gallus gallus protein sequences were compared with the Southern ostrich genome, since the Homo sapiens genome is the best anotated genome and Gallus gallus the closest phylogenetic species in the database. Next, SECIS elements and homologous proteins in other species were searched in order to confirm the results.
At last, 17 selenoproteins, 5 cysteine homologues and 10 machinery proteins have been found in the ostrich genome.
Resum
Les selenoproteïnes són un tipus de proteïnes que contenen un aminoàcid poc comú, la selenocisteïna (Sec o U). La Sec està codificada per el codó UGA, que també és un codó de terminació de la transcripció. La diferència entre les dues lectures la fa l'element SECIS (Sec insertion sequence), localitzat a la regió 3'-UTR del gen i que evita que pari la traducció.
Aquesta característica singular del codi genètic fa que sigui especialment difícil anotar les selenoproteïnes utilitzant eines bioinformàtiques.
L'objectiu d'aquest treball és el d'anotar totes les selenoproteïnes i proteïnes de maquinària presents al genoma de Struthio camelus australis, o estruç de coll blau, mitjançant programes informàtics com tBLASTn, exonerate o T-Coffee. Per fer-ho s'han comparat les seqüències de proteïnes de Homo sapiens i Gallus gallus amb el genoma de l'estruç de coll blau, sent aquestes les més ben anotades i les més properes a la nostra espècie respectivament. A continuació s'han buscat elements SECIS i proteïnes homòlogues en altres espècies per corroborar els resultats.
Finalment s'han trobat 17 selenoproteïnes, 5 homòlegs amb cisteïna i 10 proteïnes de la maquinària al genoma de l'estruç.