Discussió
Selenoproteïnes:
Utilitzant la bibliografia, vam veure que la proteïna Sel3 és exclusiva de Plasmodium. Com esperàvem, doncs, no l'hem trobat en cap dels nostres protists. En quant a la resta de selenoproteïnes que se'ns van assignar (DI1, DI2 i DI3), hem observat que en totes les regions d'aminoàcids on estava compresa la selenocisteïna es solia mantenir l'expressió regular [TS]UPP[FS], tant en els protists estudiats com en els organismes superiors amb què els hem comparat. Els aminoàcids serina (S) i treonina (T) són molt semblants, ambdós polars i sense càrrega, i només tenen un metil de diferència present a la treonina. Aquesta poca diferència podria explicar la versatilitat observada en aquesta posició anterior a la U. En quant a l'altra posició variable, la fenilalanina (F) i la serina (S) sí que són molt diferents, ja que la fenilalanina conté un anell aromàtic, tot i que cap de les dues té càrrega. Podria ser que aquesta posició no fos tan estricta com l'altra.
Les espècies de les què hem obtingut les seqüències de DI1, DI2 i DI3 van ser: Homo sapiens, Mus musculus, Gallus gallus, Xenopus laevis i Danio rerio.
En el protist N. gruberi, hem trobat dues proteïnes homòlogues amb selenocisteïna a la dels organismes superiors. Amb DI1, vam obtenir un bon hit en el BLAST (e-value de 1e-12) que no incloïa la selenocisteïna; però tot i això, vam decidir continuar amb el procés per tal de veure si es tractava d'una regió conservada, que pogués indicar la presència de la selenoproteïna en ancestres. En l'alineament múltiple (t-coffee), vam confirmar que l'alineament entre seqüències no era complet, sinó que només es mantenia un fragment. En el cas de DI2 (e-value 1e-05) i DI3 (e-value 4e-09), l'alineament múltiple amb t-coffee sí que incloïa la selenocisteïna i, per tant, les considerem homòlogues de les proteïnes de les espècies comparades. El motiu trobat en DI2 i DI3 és TUPPF.
En P. pallidum, el cas de DI1 és una mica diferent: hem trobat dos codons UGA, que ja aparèixen en el BLAST (e-value 9e-13). A l'hora de fer l'alineament múltiple, el primer queda perfectament alineat amb les selenocisteïnes de totes les seqüències query, mentre que l'altre no. Per això, considerem que el segon podria correspondre a un codó STOP, que es podria tractar d'un canvi recent evolutivament, ja que la regió posterior al STOP (no codificant) presenta un bon alineament amb les queries, però amb algunes variacions.
Per DI2, també vam obtenir un bon hit en el BLAST (e-value 4e-10), i en realitzar el t-coffee vam observar que es tractava d'un homòleg amb cisteïna. En aquesta, la seqüència era TCIPF, és a dir, la primera prolina de l'expressió regular estava substituïda per una isoleucina. Com que no tenim més homòlegs amb cisteïna, però, no sabem si aquest canvi és habitual en aquests casos o es tracta d'una situació concreta.
La cerca de DI3 en aquest genoma va donar com a resultat un BLAST amb e-value de 7e-11, i el t-coffe ens va indicar que es tractava d'un homòleg amb selenocisteïna amb un alineament satisfactori.
T. trahens va ser l'últim dels protists en el que vam identificar selenoproteïnes. En els tres casos, DI1, DI2 i DI3 (amb un e-value de 2e-12, 2e-11 i 9e-15 respectivament), vam trobar homòlegs amb selenocisteïna. Cal dir que amb T. trahens vam obtenir diversos hits amb e-value petit i en diferents contigs, però vam decidir treballar amb el hit que donés l'e-value més baix. Ara bé, en DI1 i DI2 l'expressió regular de la seqüència era SUPPF en comptes del TUPPF que havíem observat en els altres protists.
Maquinària:
A l'hora de buscar les seqüències query de la maquinària per la síntesi de selenoproteïnes, vam intentar establir un ampli ventall d'organismes. Per això, la nostra primera intenció era agafar Mus musculus i Homo sapiens com a representants de mamífers, Danio rerio (zebrafish) com a peix, Xenopus sp. com a amfibi, Caenorhabditis elegans com a nemàtode i Drosophila melanogaster com a insecte. Ara bé, vam comprovar que no totes les seqüències de proteïnes de la maquinària estaven disponibles per a totes aquestes espècies. Així doncs, en cada cas vam emprar les seqüències disponibles. Per exemple, per a secp43 només vam trobar la seqüència en Mus musculus, per això, a l'hora de fer l'alineament amb el t-coffee el vam fer comparant tots els protists amb una sola seqüència query. En el cas de tRNAsec, vam buscar la seva seqüència en tRNAscan i no en va trobar cap. Tanmateix, per a la resta de proteïnes de maquinària (sps2, sbp2, pstk, SecS i eEFsec) sí que vam trobar seqüències en organismes superiors.
Les tres espècies on hem trobat selenoproteïnes també presenten tota la maquinària, amb l'excepció de T. trahens on no es troba la proteïna pstk. Ara bé, altres protists on no hem trobat les selenoproteïnes estudiades sí que tenen maquinària, cosa que ens fa pensar que podrien tenir altres selenoproteïnes en el seu genoma.
Seguint amb pstk, s'ha detectat en 5 de les 14 espècies de protists estudiades. Mirant l'arbre filogenètic dels protists, observem que tres d'ells (P. tricornutum, P.ultimum i S.parasitica) provenen del mateix ancestre, mentre que la resta (P.pallidum i N.gruberi) es troben molt més allunyats entre sí. Els alineaments múltiples són satisfactoris, excepte en els casos de P. pallidum (que presenta una regió amb un alineament més mediocre) i S. parasitica (on s'observa un indel, és a dir, una inserció o deleció que no podem distingir). Creiem, doncs, que és més probable que pstk s'hagi delecionat durant les diverses especiacions al llarg del temps que no pas que hagi aparegut diverses vegades en diferents espècies (evolució divergent, no convergent). Això podria indicar que la funció de pstk és redundant, i que altres proteïnes de la maquinària de síntesi de selenoproteïnes podrien tenir la mateixa funció, o també que podria haver-hi una altra proteïna de maquinària que desconeixem.
C. muris i C. parvum són les dues espècies pertanyents al gènere Cryptosporidium que hem estudiat i, alhora, són les úniques on no hem trobat SecS. Deduïm que aquesta proteïna ha desaparegut en aquest gènere. En la resta de protists, on aquesta proteïna està present, els alineaments múltiples són tots excel·lents excepte el de S. parasitica, que té un alineament menys acurat.
La proteïna sps2 es troba present en la majoria d'organismes, excepte A. taiwanensis, E. siliculosus i els dos membres del gènere Cryptosporidium. Aquests dos últims i A. taiwanensis són bastant propers evolutivament, cosa que podria suggerir que el gen s'ha eliminat en un punt anterior a la divisió d'aquestes espècies. Pel que fa a E. siliculosus, en trobar-se més llunyà evolutivament, podem pensar que ha patit també la deleció d'aquest gen de forma individual. Aquesta hipòtesi es veu recolzada pel fet què en tots els protists estudiats pertanyents a la mateixa branca evolutiva (és a dir, que sorgeixen del mateix node d'especiació) que E. siliculosus sí que trobem sps2, sempre amb alineaments correctes menys en el cas de S. parasitica, on només uns 30 aminoàcids estan ben alineats.
La proteïna sbp2 no s'ha identificat en els protists A. taiwanensis, B. hominis, E. siliculosus i H. arabidopsidis. A l'arbre filogenètic observem que B. hominis, E. siliculosus i H. arabidopsidis sorgeixen els tres del mateix node d'especiació, indicant que la deleció podria tenir un origen anterior. Ara bé, la resta de protists estudiats d'aquesta branca (com, per exemple, P. ultimum o S. parasitica) sí que tenen aquesta proteïna, així que es podria tractar d'una recuperació del gen o bĂ© de diferents delecions. El cas d'A. taiwanensis sí que el considerem com un fenomen de deleció aïllat, en trobar-se tan lluny evolutivament de les altres tres espècies. Ara bé, en aquest cas hem detectat que cinc dels protists on si que vam identificar sbp2 han donat com a resultat regions de les seqüències mal alineades. Aquestes espècies són: C. owczarzaki, N. gruberi, P. tricornutum, S. parasitica i T. trahens. No queda clar com tractant-se d'una proteïna tan important en aquest procés (recordem que és l'intermediari entre l'element SECIS i eEFsec) es pot produir tanta variació en la seqüència.
En quant a secp43 i eEFsec, les hem identificat en totes les espècies de protists estudiades excepte en A. taiwanensis en el cas de secp43 i H. arabidopsidis en el cas de eEFsec. Creiem, per tant, que les delecions d'aquestes proteïnes es tracten de fets singulars. Secp43 dóna bons alineaments amb una petita regió central més variable. Els alineaments de eEFsec, en canvi, han resultat molt irregulars, sobretot en una regió central. Una hipòtesis per a aquesta gran variabilitat seria que aquesta regió no formés part dels dominis d'unió amb sbp2 i tRNA, o bé que les variacions observades en sbp2 i eEFsec estiguessin relacionades ja que haurien evolucionat conjuntament.