Abstract
Selenoproteins are proteins that contain a particular amino acid: selenocysteine, also known as the 21st amino acid. The codon that encodes for selenocysteine is the same as the STOP codon (UGA), which makes it more difficult to annotate the selenoproteins in a new genome. The presence of a 3-D structure known as SECIS (Selenocystein Insertion Sequence) in the 3'-UTR position allows the decoding of UGA codon to a selenocystein.
The aim of this project is to annotate all the possible selenoproteins of the Weddell Seal (Leptonychotes weddellii) genome. To accomplish this, we've compared Leptonychotes weddellii's genome, it's selenoprotein's sequences, it's homologous cysteins and the it's selenoprotein biosynthesis machinery against a known sequence/es. In our case, againts Homo sapiens, and Odobenus rosmarus due to it's phylogenetical proximity very to the Weddell Seal. To acomplish the alignment we have used sequence alignment bioinformatic tools such as tBLASTn, exonerate, t-coffee, among others.
Besides aligning the queries against the Leptonychotes weddellii genome, we searched for SECIS elements in the 3'-UTR region of the mRNA in order to validate the presence of selenoproteins in this genome.
Resum
Les selenoproteïnes són proteïnes que contenen un aminoàcid particular, la selenocisteïna (Sec), també conegut com a l'aminoàcid 21. El codó que codifica la selenocisteïna és igual que el codó STOP (UGA), fet que fa molt difícil l'anotació de les selenoproteïnes en un nou genoma. El que fa que el codó UGA es tradueixi a una selenocisteïna és la presència d'una estructura tridimensional coneguda com a element SECIS a la posició 3'-UTR de la proteïna.
El nostre objectiu en aquest treball ha estat, precisament, el de anotar totes les selenoproteïnes possibles en el genoma de la foca de Weddell (Leptonychotes weddellii). Per fer-ho, hem comparat les seqüències de les selenoproteïnes, proteïnes homòlogues en cisteïna i proteïnes de síntesi de selenoproteïnes humanes amb el genoma de Leptonychotes weddellii mitjançant eines bioinformàtiques d'alineament de seqüències (tBLASTn, exonerate, t-coffee). També hem comparat les seqüències de les selenoproteïnes de morsa (Odobenus rosmarus) conegudes degut a la proximitat filogenètica d'aquesta amb l'organisme estudiat.
Per constatar la presència de les selenoproteïnes a més d'alinear el genoma de Leptonychotes weddellii amb les proteïnes model i així descartar que UGA es tracti d'un codó STOP, hem buscat la presència d'elements SECIS a la zona 3'-UTR del mRNA.