La cerca de selenoproteïnes en
I. multifiliis ha estat especialment complexa. El blast ens reportava tres hits no molt bons, però acceptables tenint en compte la mida de la nostra query. En tots tres hits, la selenoproteïna de la query (marcada com a X), s'alineava amb un codó STOP en la regió genòmica. Vam decidir analitzar aquesta seqüencia del genoma a través del GeneWise i l'Exonerate, per tal de veure si aquesta regió era codificant i podia codificar una selenoproteïna homòloga a la nostra query. Els resultats d'aquests programes per tots tres hits eren confusos perquè l'Exonerate ens mostrava un alineament amb una proteïna predita que tenia molts codons STOP en la seva seqüència (codons codificats per TAA i TAG i sempre un per TGA, que era el què creiem que codificava la selenocisteïna)
(veure exemple) mentre que el GeneWise ens mostrava una proteïna predita molt curta corresponent a la seqüència entre dos d'aquests codons STOP
(veure exemple). A més, el fet que l'Exonerate ens mostrés tots aquests codons STOP en l'alineament (quan teòricament detecta regions codificants) i sobretot, que la seqüència d'aminoàcids després de l'STOP estigués tant conservada (si la proteïna es trunqués en l'STOP no tindria sentit que aquests aminoàcids estiguessin tan conservats entre espècies), ens va fer buscar en la bibliografia informació addicional sobre l'organisme
Ichthyophthirius multifiliis.
Vam trobar, que igual que altres protistes himenostomats, I. multifiliis utilitza un codi genètic diferent, on els dos codons TAA i TAG, que normalment codifiquen per STOP, codifiquen específicament per glutamina (Q) (Clark et al., 1992, 1999). Al analitzar el resultat de l'Exonerate, veiem com efectivament aquests codons STOP del mig de la proteïna predita estan tots codificats per TAA i TAG. Així doncs, per analitzar correctament els resultats, el que vam fer va ser canviar tots aquests codons del fastasubseq per CAA, que és un dels codons codificants de glutamina del codi genètic. Els resultats mostrats a la taula i que es discuteixen a continuació ja han sigut modificats abans d'analitzar-los.
Com hem dit, en I. multifiliis obtenim tres hits que alineen la selenocisteïna de la query amb un codó STOP de la seqüència analitzada. A més, tots tres hits pertanyen a contigs diferents
(veure blast).
El hit 1 ens mostra un alineament idèntic en genewise i exonerate, predint una proteïna igual de llarga que la query amb un codó stop codificat per TGA enmig d'aquesta. La proteïna predita per aquests dos programes (si canviem el codó STOP per l'aminoàcid U corresponent a la selenocisteïna), té la seqǜencia següent:
>gi|340502159|gb|GL984205.1|:subseq(128994,14689) Ichthyophthirius multifiliis
SIPEPVKNFQCNKHAQFDVLIEYCGSUGYHNTFEFTKNCITMAYPNAQIEKKVIPGYTQCFEIYVNGK
Per analitzar la validesa d'aquesta selenoproteïna predita, hem realitzat un alineament amb la query pel programa T-COFFEE, i el resultat és òptim: un alineament amb un score de 100
(veure T-COFFEE).
Per últim, hem fet un blast sobre el conjunt de proteïnes no redundants
(veure blastp). Tot i que els hits obtinguts no són molt significatius, el hit amb menor e-value correspon a la selenoproteïna W1 de Chlamydomonas reinhartii. És possible que aquest resultat signifiqui que aquesta selenoproteïna de I. multifiliis encara no ha estat descrita.
El hit 2, una vegada corregits els errors derivats de l'ús del codi genètic especial del que hem parlat, ens reporta altra vegada una predicció idèntica amb tots dos programes. Tots dos ens alineen la selenocisteïna de la query amb un codó STOP de la seqüència. La seqüència d'aquesta selenoproteïna predita pels dos programes serà la següent:
>gi|340505517|gb|GL983811.1|:subseq(0,30000) Ichthyophthirius multifiliis
TLPAEVNQFQTDKNLTFDVYVHYCGSUSGNSQFRYTQEIIKKVYPNANVIGESSDNCGGCLDIFVNGK
El resultat del T-COFFEE entre aquesta proteïna predita i la query és molt bo altre cop
(veure T-COFFEE). Creiem, doncs, que aquests resultats ens informen que és possible que I. multifiliis contingui també una selenoproteïna (SelW) en aquest contig.
Per últim, el hit 3 ens donava un resultat de l'exonerate i el genewise on la seqüència del fastasubseq estava traduïda amb una pauta de lectura reversa i complementària, el que significa que la proteïna (o almenys la seqüència que els programes ens han seleccionat) es troba en la cadena reverse
(Exonerate no corregit). Aquest fet ha complicat bastant la correcció dels codons STOP per glutamines, ja que si normalment corregíem els codons TAA i TAG per CAA, en aquest cas havíem de buscar al fastasubseq codons TTA i CTA i canviar-los per TTG. El resultat final, però, ha sigut el desitjat
(exonerate corregit).
Una vegada corregits els errors, l'Exonerate i el GeneWise no ens donaven resultats tan positius com en els dos hits anteriors. L'exonerate no ens alineava tota la query sencera, sinó que alineava des de l'aminoàcid 12 de la query fins al 65 (sobre 68 totals). Tot i això, la selenocisteïna de la query estava present en el resultat alineada amb un codó STOP (TGA) de la seqüència de l'organisme. El genewise ens predia una proteïna molt curta, degut a que l'alineament començava a partir de la selenocisteïna. Com que el resultat del genewise no incloïa la selenocisteïna, la selenoproteïna predita ha de tenir la mateixa seqüència que la del fastatranslate realitzat a partir de l'exonerate:
>gi|340508766|gb|GL983129.1|:subseq(0,30000) Ichthyophthirius multifiliis
NMDNQIKVMVEYCGSUGYKPSFNNLSNSIKNSFSQIVIEGKAIAGNTGCFEVYI
Tot i que és més curta que les dues anteriors, l'alineament d'aquesta proteïna amb la query mitjançant T-COFFEE presenta un score molt elevat (98)
(veure T-COFFEE) en les regions comunes entre totes dues. Curiosament, aquesta proteïna predita és la que dóna millors hits al fer un blastp contra la base de dades de proteïnes no redundants, tots hits corresponents a selenoproteïnes W d'altres organismes
(veure blastp).
Cal dir, a més, que al analitzar els elements SECIS presents en el fastasubseq d'aquest hit, hem trobat un possible resultat positiu a uns 200pb en direcció 3' del hit. Aquest element SECIS podria ser el necessari per incorporar la selenocisteïna a la proteïna, tot i que cal tenir en compte que és un element SECIS amb un score molt baix i que ha estat predit amb un patró poc estricte
(veure SECIS).
En resum, els nostres resultats ens fan pensar que és possible que existeixin tres selenoproteïnes homòlogues a SelW en el genoma de I. Multifiliis.
Tornar a dalt »