Candidat 1

A partir d'un dels elements SECIS trobats es va procedir a ampliar la seqüència nucleotídica i a cercar un possible marc de lectura amb el programa Expasy. Es va trobar una possible proteïna que començava en la mateixa regió on s'havia detectat l'element SECIS i s'allargava cap a 3'UTR.

El resultat obtingut va ser el següent:


5'3' Frame 1 N K V V H Met Met Y K Met Met I H F H Q F H I T W Met K R R C R K N N A Q K L V E S V F Y D N N I F V A F S F F I G L T E Y P L E I Stop A Stop W L E A R C F E Y F V H S S Y S Met P F N T R F I Met F T Y Met Y I F F C F T Stop N Stop T I V A Stop A L T H I R N Y T Y V Y I H T V R I D L P R L F P F S E K L K Q K N E K K I I I S N A T L E S P Y V S Y I S T V R N S K I F C L R F F F Stop S V D N N I I L A T K Y F A Y L Y V Y C F I Stop Stop I N I K R S I Y T I I Y A N L A I Y A H I F S I


En observar de prop els resultats, es va veure que els dos Stop marcats en negreta corresponien a codons TGA. Així, podia ser que la proteïna real s'allargués 36 residus més fins al següent Stop (en cursiva). A partir de la proteïna obtinguda, es va realitzar un pBLAST contra la base de dades del NCBI però no es va aconseguir cap resultat significatiu.

Per tal de determinar si ens podriem trobar davant d'una proteïna no anotada encara en Plasmodium, vam optar per buscar seqüències homòlogues a la detectada en el PlasmoDB.

Utilitzant les seqüències amb score prou alt, en aquest cas les de P. yoelii i P. chabaudi, es va realitzar un alineament múltiple amb el programa T-Coffee.

Es va observar que les tres seqüències eren altament homòlogues a partir de l'element SECIS, lloc on es trobava la possible selenoproteïna. A continuació es va procedir a traduir aquestes seqüències i a realitzar un nou alineament.

Aquest va ser el resultat obtingut:


CLUSTAL FORMAT for T-COFFEE Version_5.05 [http://www.tcoffee.org], CPU=0.22 sec, SCORE=60, Nseq=3, Len=219 

berghei         NKVVHMMYKMMIHFHQFHITWMKRRCRKNNAQKLVESVFYDNNIFVAFSFFIGLTEYPLE
yoelii          NKVVQMMYKMMIHFHPFHITWMKRRCRKNNVHKLVENIFYDNNLFVAFSFFIGLIEYPLE
chabaudi        NKVVQMMYKMMIHSPPFRIIWMKRRCKKNNANKLVENVFYDNNLFVAFSFFIGL-SYVLE
                ****:********   *:* ******:***.:****.:*****:********** .* **

berghei         IUAUWLEARCFEYFVHSSYSMPFNTRFIMFTYMYIFFCFTNTIVAALTHIRNYTYVYIHT
yoelii          IUAUULEARCFEYFMHISYSLPFNTRFIICTYMYIFFLF---------------------
chabaudi        IUAUWLEVRFFEYIVHISYRLPFNTRFIMFTYVYIFFCFTNIITTALTHMGMYTC-TVCA
                **** **.* ***::* ** :*******: **:**** *                     

berghei         VRIDLPRLFPFSEKLKQKNEKKIIISNATLESPYVSYISTVRNSKIFCLRFFFSVDNNII
yoelii          ----------------------------------------------------YIKPNNSY
chabaudi        LICQGNFLFLKNNKKNVKNMKKKLLYQIRLQNCHASAICRV-------------------
                                                                            

berghei         LATKYFAYLYVYCFIINIKRSIYTIIYANLAIYAHIFSI
yoelii          LGTHAYKKLYI-CIYTRCVHSAKVISFLK---------T
chabaudi        ---------------------------I----------R

Veiem com la seqüència es manté força conservada i que els Stop que podrien correspondre a selenocisteïna es mantenen en les tres espècies. També s'observa una pèrdua d'homologia després del Stop (TAA) predit en les nostres seqüències.

Per tal de determinar la part inicial de la proteïna, es va realitzar un alineament amb les tres espècies ja esmentades utilitzant la seqüència 5' del contig de P. berghei. El resultat obtingut mostra que la proteïna començaria en la regió prèviament alineada ja que no troba cap patró de conservació igual upstream. També vam procedir a traduir la seqüència inmediatament anterior als residus obtinguts en l'alineament mitjançant el programa Expasy. Després de fer això, vam observar que pocs residus abans apareixia un codó Stop. Per tant, la proteïna començaria en una de les metionines que conté el nostre alineament.

Per últim, es va intentar determinar l'estructura 3D de l'element SECIS predit mitjançant el programa SECISearch online.

Aquí podem veure l'estructura predita (clic a la imatge per ampliar en una nova finestra):



Cal remarcar que, encara que el programa hagi estat capaç de predir un element SECIS, aquest no supera el score recomanat.

Els resultats obtinguts durant l'anàlisi semblen indicar que podríem trobar-nos devant d'una selenoproteïna. Si aquest fos el cas, aquesta contindria un element SECIS en l'interior de la seva seqüència proteica, més concretament en la seva regió inicial, i no en 3' UTR. Aquesta particularitat també s'ha observat en altres espècies d'eucariotes unicel·lulars.


Aquí podeu descarregar tota la documentació referent al Candidat 1.