SEL 4
Sel 4 és la quarta selenoproteïna específica del gènere Plasmodium, de la qual no se'n troben homòlegs en altres espècies. La seva identificació és molt recent i, per tant, encara no se'n coneix la funció.
Per tal d'identificar-la en el genoma de P.vivax vam partir de l'homòleg en P.falciparum (obtingut en la base de dades PlasmoDB), i vam fer un TBLASTN.
El TBLASTN en el genoma de P.vivax usant Sel 4 de P.falciparum com a query va donar el següent resultat:
Figura 1. Resultats TBLASTN |
Descarrega't l'arxiu |
A partir de saber quin és el contig que conté el gen en qüestió (ctg_6877), de tallar-ne un fragment adequat i de fer-ne la cadena complementària (comanda fastarevcomp) vam poder predir l'estructura gènica amb el GeneWise (aquí):
falciparum 1 MDTNENMKNVKDMMSFTTKNIIYIFIGISLLIFIYKILKKNKKDAEVKR MD N K + +T KN+I + +G++ I+IYK+++ K+ +E KR MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKR subseq(975000,3 1542 agaggaagcgagggtcagaagaccgtggagtacatataaccaagtgtaa tagtgaacccagtattctaattttttgtccttttaattgagagtcatag gcgggcgtcagagtagacatgcgaggctattatttgcgatagatgatgg falciparum 50 NNEISIKMKLSREKQLQELDKEMMINKEKMKEQNIKKNEEKKKDADQAK N+EI KMK+SREK+LQEL+KEMM NK+KM EQ K +++K K D K NSEIDKKMKMSREKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDK subseq(975000,3 1689 aagagaaaaatagaaccgtgagaagaacaaagcgaagggaagagtgtga agataaatatcgaagtaataaattcaaaatgaataagaaaaaactacaa tcaataggagaggaggaagaaaggttagggcaggcgatcaataaatgca falciparum 99 PKLGSKDNSSFNHLNDYSNYYRPSLKNRFYNNRKSXR PK SK+NSSF+H D SNYYRPS++NR+ R PKPDSKNNSSFSHFRDLSNYYRPSIRNRL-------R subseq(975000,3 1836 cacgtaaatttactagttattactaaaat c cacacaaacctgatgatcaaagcctgagt g caatcgctggccttgtaacccggcaatga c
Com podem observar en l'alineament, la U de P.falciparum coincideix amb un gap del contig de P.vivax. Això ens va fer dubtar de si realment Sel 4 es manté com a selenoproteïna en aquesta espècie de Plasmodium en concret. Per aclarir-ho, vam usar el programa SECISearch, que ens va trobar un SECIS probable (score 20,81) a una distància raonable del final de la proteïna predita pel GeneWise.
Figura 2. SECIS de sel 4 |
Aquest descobriment ens va impulsar a seguir investigant per trobar la selenocisteïna en l'homòleg de P.vivax.
Per resoldre-ho, vam allargar la seqüència del genoma de P.vivax a partir del final de la proteïna predita pel GeneWise fins a trobar un TGA i, al cap de pocs residus, un altre codó stop (concretament, un altre TGA). Amb aquesta proteïna hipotètica allargada vam fer un TBLASTN contra els mRNA de P.vivax, i vam obtenir el següent:
ref|XM_001616651.1| Plasmodium vivax SaI-1 Length=1141 Score = 341 bits (874), Expect = 6e-95, Method: Compositional matrix adjust. Identities = 164/165 (99%), Positives = 164/165 (99%), Gaps = 0/165 (0%) Frame = +3 Query 1 MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKRNSEIDKKMKMS 60 MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKRNSEIDKKMKMS Sbjct 555 MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKRNSEIDKKMKMS 734 Query 61 REKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDKPKPDSKNNSSFSHFRDLSNYYR 120 REKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDKPKPDSKNNSSFSHFRDLSNYYR Sbjct 735 REKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDKPKPDSKNNSSFSHFRDLSNYYR 914 Query 121 PSIRNRLREKLUHECDVSPSWGAHVHTHGCRHAQQSTHTHIYICI 165 PSIRNRLREKL HECDVSPSWGAHVHTHGCRHAQQSTHTHIYICI Sbjct 915 PSIRNRLREKL*HECDVSPSWGAHVHTHGCRHAQQSTHTHIYICI 1049
Per tant, com que la U de la proteïna hipotètica queda alineada amb un asterisc in frame (que simbolitza un codó stop enmig de la pauta de lectura), considerem que:
Tot seguit, vam fer un alineament amb T-COFFEE de les seqüències de Sel 4 en P.vivax i P.falciparum, per tal de veure'n la similaritat:
Sel 4 falciparum MDTNENMKNVKDMMSFTTKNIIYIFIGISLLIFIYKILKKNKKDAEVKRNNEISIKMKLS Sel 4 P. vivax MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKRNSEIDKKMKMS ** * .*.: :*.**:* :.:*:: :*:***::::.*: :*.***.**. ***:* Sel 4 falciparum REKQLQELDKEMMINKEKMKEQNIKKNEEKKKDADQAKPKLGSKDNSSFNHLNDYSNYYR Sel 4 P. vivax REKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDKPKPDSKNNSSFSHFRDLSNYYR ***:****:**** **:**.** * :::*.* *. *** .**:****.*:.* ***** Sel 4 falciparum PSLKNRFYNNRKSU------------------------------R Sel 4 P. vivax PSIRNRLREKLUHECDVSPSWGAHVHTHGCRHAQQSTHTHIYICI **::**: ::
Com podem observar, la U de cada espècie queda alineada amb un residu diferent. Això ens va fer hipotetitzar un alineament més adequat, afegint simplement un gap de dos residus en la Sel 4 de P. vivax:
Sel 4 falciparum MDTNENMKNVKDMMSFTTKNIIYIFIGISLLIFIYKILKKNKKDAEVKRNNEISIKMKLS Sel 4 P. vivax MDRVGNKAPAKGVDLLTVKNVILLVLGVTAFILIYKFMRHRKRVSEFKRNSEIDKKMKMS ** * .*.: :*.**:* :.:*:: :*:***::::.*: :*.***.**. ***:* Sel 4 falciparum REKQLQELDKEMMINKEKMKEQNIKKNEEKKKDADQAKPKLGSKDNSSFNHLNDYSNYYR Sel 4 P. vivax REKRLQELEKEMMANKQKMSEQVNKGDDKKDKALDSDKPKPDSKNNSSFSHFRDLSNYYR ***:****:**** **:**.** * :::*.* *. *** .**:****.*:.* ***** Sel 4 falciparum PSLKNRFYNNRKSU------------------------------R Sel 4 P. vivax PSIRNRLRE--KLUHECDVSPSWGAHVHTHGCRHAQQSTHTHIYICI **::**: ::
Tot seguit, vam fer un Exonerate per tal de predir l'estructura del gen de P.vivax que codifica per Sel 4:
Figura 3. Resultats Exonerate (.gff) |
Finalment, vam intentar comprovar l'homologia de funció de Sel 4 en P.vivax i P. falciparum buscant si tenen dominis proteics en comú mitjançant el programa InterProScan.
Figura 4. Dominis Sel 4 en P.falciparum (esquerra) i en P.vivax (dreta) |
Com podem veure en la figura 4, ambdues espècies tenen els mateixos dominis, però no són prou específics com per poder especular cap funció (ja que només ha trobat un domini de pèptid senyal i un altre de regió transmembrana).
Així doncs, l'estructura de Sel 4 i el seu element SECIS queda definida així:
Figura 5. Esquema de Sel 4 |