Resum
L'objectiu d'aquest projecte és la recerca del selenoproteoma en el genoma de Mustela putorius furo, que ha estat seqüenciat recentment, utilitzant exclusivament eines bioinformàtiques. Això permetrà entendre millor les relacions filogenètiques entre espècies, així com l'evolució i funció d'aquesta família de proteïnes.
Les selenoproteïnes són un tipus de proteïnes que incorporen a la seva seqüència un aminoàcid anomenat selenocisteïna (Sec), que correspon a l’aminoàcid 21 i s’anomena amb una lletra U. Estructuralment és molt similar a la cisteïna (Cys), però en lloc d'un sofre, conté un àtom seleni. Aquest aminoàcid és codificat pel codó TGA el qual és, normalment, un codó de terminació de la traducció. Per tant, això provoca una dificultat en l'anotació d'aquesta família de proteïnes. La recodificació del codó ve donada per la presència de una estructura tridiemensional a la regió 3' UTR anomenada element SECIS (SElenoCystein Insertion Sequence).
Per a realitzar la cerca hem utilitzat varies eines bioinformàtiques, com SelenoDB, tBLASTn, Exonerate, Genewise o T-coffee. Un cop trobades les regions candidates a codificar per una selenoproteïna, hem buscat elements SECIS. També s'ha indentificat la maquinària necessària per la síntesi de d'aquestes proteïnes i els homòlegs en cisteïna.
Els resultats obtinguts ens indiquen que el genoma de Mustela putorius furo conté 24 selenoproteïnes com en la majoria de mamífers, d’un set total de 28. El proteoma de la fura consta de les selenoproteïnes GPx1, GPx2, GPx3, GPx4, GPx6, DI1, DI2, DI3, Sel15, SelH1, SelH2, SelI, SelK, SelM, SelN, SelO, SelS, SelT, SelW1, TR1, TR2, TR3, SelP, SelR1; els homòlegs en cisteïna GPx5, GPx7, GPx8, SelW2, MsrA, SelR2, SelR3; l’homòleg en altres aminoàcids SPS1; i la maquinària eEFSec i SBP2. Pel que fa a SelH1, SelH2, SelO i SelW1, no hem pogut descriure amb precisió els seus elements SECIS. Finalment, no hem pogut demostrar la presència de SPS2, mentre que podem afirmar l’absència de SelV.
Abstract
The aim if this project is the research of Mustela putorius furo's selenoproteome, using exclusively bioinformatic tools. The genome of this mustelid has been recently sequenced. This work will help on the understanding of the filogenetic relationships among different species, as well as the evolution and function of this protein family.
Selenoproteins are proteins which incorporate selenocistein (Sec), the 21th aminoacid and it is represented by the symbol U. Structuraly, Sec is very similar to cistein (Cis), but instead of sulfur, it has a selenium atom. This aminoacid is coded by the TG codon, which normaly is an indicator of translation termination; making it very difficult to do a proper anotation of this protein family. The recodification of the UGA codon is caused by a three-dimensional structure located at the 3’ ending non translated (UTR) of the selenoproteins genes, the SElenoCystein Insertion Sequence (SECIS Element).
To develop this project we have used some bioinformatic tools like SelenoDB, tBLASTn, Exonerate, Genewise or T-coffee. Once we found the genome regions that may codify for selenoproteins, we have looked for the SECIS elements. The selenoprotein synthesis machinery and cistein homologues have also been identified.
The results obtained conclude that Mustela putorius furo's genome comprises 24 selenoproteins like most mammals do, from a total set of 28. Ferret's proteome has the selenoproteins GPx1, GPx2, GPx3, GPx4, GPx6, DI1, DI2, DI3, Sel15, SelH1, SelH2, SelI, SelK, SelM, SelN, SelO, SelS, SelT, SelW1, TR1, TR2, TR3, SelP, SelR1; the cistein homologues GPx5, GPx7, GPx8, SelW2, MsrA, SelR2, SelR3; the other amino acid-containing homologs SPS1; and the Selenium molecular machinery eEFSec i SBP2. We have not been able to find the SECIS elements for SelH1, SelH2, SelO i SelW1. Finally, we have not been able to demonstrate the presence of SPS2, while we can assert the absence of SelV.
Tornar a l'inici de la pàgina