CHELONIA MYDAS

DISCUSSIÓ

Preàmbul

Per a la identificació de selenoproteïnes es va partir de proteïnes model d'Anolis carolinensis i Pelodiscus sinensis donada la seva proximitat filogènica amb Chelonia mydas. No obstant, les millors prediccions s'han obtingut amb Anolis carolinensis. Pel contrari, Pelodiscus sinensis sovint generava anotacions més problemàtiques. En els moments en que cap d'aquests dos genomes generava anotacions correctes i sorgien problemes en les prediccions, es procedia a comparar-ho amb les proteïnes d'Homo sapiens, ja que és el genoma més ben anotat. Per últim, també s'han utilitzat puntualment altres genomes com Danio rerio o Xenopus tropicalis per tal d'identificar selenoproteïnes que no estaven presents en els genomes anteriors, ja que l'objectiu principal sempre ha estat identificar el màxim nombre de selenoproteïnes en Chelonia mydas.

Selenoproteïnes en Chelonia mydas

Iodotironina deiodinases 1, 2 i 3

Les iodotironina deiodinases són selenoproteïnes que tenen com a funció la biosíntesi d’hormones tiroïdals. En són conegudes tres proteïnes d’aquesta família en mamífers, però en Chelonia mydas la presència d’aquestes era desconeguda. La predicció resulta en la troballa de totes tres, conservant la selenocisteïna i els elements SECIS en la regió 3’UTR de cadascun dels tres gens. El programa BLAST per cadascuna de les proteïnes dóna tres hits significatius en tres scaffolds diferents, els quals corresponen als tres gens de la subfamília, però el hit més significatiu es diferencia sempre en els tres casos. Així doncs, es va poder discernir entre els tres gens predits. L’alineament de les proteïnes DI1 i DI2 en Chelonia mydas és molt bo amb la query d'Anolis carolensis.

La tercera proteïna, DI3, va ser trobada utilitzant la query d’Homo sapiens ja que aquesta no es trobava ni en Anolis carolensis ni en Pelodiscus sinensis. A més, la DI3 va aparèixer sense introns, i al principi es va pensar que potser es podria tractar d’un pseudogen format per retrotransposició. Aquest supòsit va resultar ser fals ja que segons la literatura, DI3 és la única selenoproteïna que segueix un patró sense introns mentre la resta són multiexòniques [4]. Una altra cosa interessant a comentar sobre la DI3 és que en un principi es va utilitzar una query anotada com a selenoproteïna en Pelodiscus sinensis que no presentava cap subfamília associada. Després de fer la predicció de DI3 amb la query d'Homo sapiens s'ha pogut determinar que la regió de l'alineament obtinguda amb aquesta DI “none” de Pelodiscus sinensis és la mateixa.

Per acabar de confirmar la seva existència com a tres proteïnes independents, s'ha realitzat un alineament múltiple. Així doncs, el genoma de Chelonia mydas conté tres selenoproteïnes homòlogues a les tres deiodinases que trobem a la resta de vertebrats.


Glutatió peroxidases

La glutatió peroxidasa és una proteïna que s'encarrega de protegir l'organisme de l'efecte degradant dels hidroperòxids formats de forma endògena. Es tracta d'un enzim que catalitza la reacció d'oxidació del glutatió al glutatió disulfur, oxidant d'aquesta manera el peròxid d'hidrogen i produint aigua [7].

Es tracta de la família més àmplia de selenoproteïnes en vertebrats. En humans es troben 8 Gpx homòlogues, de les quals 5 són selenoproteïnes (GPx1, GPx2, GPx3, GPx4 i GPx6) i la resta són homòlogues en cisteïna. D'acord amb la filogènia, existeixen tres famílies evolutives en la família de les Gpx: GPx1/GPx2, GPx3/GPx5/GPx6 i GPx4/GPx7/GPx8 [8]. La GPx7 i la GPx8 van evolucionar a partir del GPx4-like ancestor, mentre que la GPx5 i la GPx6 van aparèixer com resultat de la multiplicació en tàndem de la GPx3. La GPx1, GPx2 i GPx3 són sub-clades de la Gpxs tetramèrica [9].

En l'estudi es va intentar trobar totes les selenoproteïnes presents a Chelonia mydas, emprant com a querys les seqüències proteiques d'Anolis carolinensis, Pelodiscus sinensis i d'Homo sapiens.

Totes les glutatió peroxidases són molt semblants les unes amb les altres, per la qual cosa es va realitzar un BLAST per cadascuna, i en cada cas es va seleccionar el hit amb el millor score. Posteriorment es va comprovar la regió millor alineada per cada query.

Es va començar per Anolis carolinensis on es troben 6 GPx diferents: GPx2 i GPx3 (selenoproteïnes), GPx4 i GPx8 (homòlogues en cisteïna), i dues que no pertanyen a cap subfamília (una selenoproteïna i una homòloga en cisteïna). En el cas de Pelodiscus sinensis també n'hi ha 6: GPx2 i GPx3 (selenoproteïnes), GPx7 (homòloga en cisteïna) i tres que no pertanyen a cap subfamília (una selenoproteïna i dues homòlogues en cisteïna).

Després de realitzar les diferents cerques, es van trobar al genoma de Chelonia mydas les selenoproteïnes GPx2 i Gpx3, que coincideixen tant amb les d'Anolis carolinensis com amb les de Pelodiscus sinensis. També es van trobar les proteïnes homòlogues en cisteïna GPx7 i GPx8, però no van aparèixer la GPx1, GPx4, GPx5 i GPx6. Les selenoproteïnes GPx que no pertanyien a cap subfamília - tant les d'Anolis carolinensis com les de Pelodiscus sinensis - s'alineaven cadascuna adequadament amb una regió diferent del genoma.

L'absència de la GPx5 i de la GPx6 era d'esperar, ja que únicament estan presents en mamífers placentaris. Es tracta de les glutatió peroxidases evolutivament més recents, les quals es creu que són resultat de la duplicació en tàndem de la GPx3 a la branca filogenètica dels mamífers placentaris[4].

D'altra banda, la GPx4 i la GPx1 estan presents en tots els vertebrats, per la qual cosa es va continuar amb la cerca d'aquestes mitjançant la utilització de querys d'origen humà. En el cas de la GPx4, quan es va emprar la query d'Anolis carolinensis, la seqüència del genoma presentava un codó stop al seu inici, per la qual cosa no era vàlida. En canvi, quan es va utilitzar la query humana es va trobar una regió genòmica que alineava gairebé a la perfecció, i a més a més es tractava de la mateixa posició on s'alineava la selenoproteïna que no pertanyia a cap subfamília de Pelodiscus sinensis.

Posteriorment, es va realitzar la cerca de la GPx1 utilitzant la query humana i, en aquest cas, també va donar un alineament bastant bo. Novament la regió genòmica coincidia amb la regió que alineava amb la selenoproteïna que no pertanyia a cap subfamília d'Anolis carolinensis.

Finalment, es va realitzar un alineament múltiple per tal d'assegurar la presència de totes les selenoproteïnes trobades al genoma de Chelonia mydas, i que la seva posició en aquesta era diferent per a cadascuna d'elles.

Per tant, sembla que Chelonia mydas conté en el seu genoma la seqüència de les selenoproteïnes GPx1, GPx2, GPx3 i GPx4, que es troben en tots els vertebrats. A nivell funcional, es creu que aquestes tenen un paper antioxidant en diferents localitzacions i compartiments ceŀlulars. La GPx1 actua al citosol i al mitocondri, mentre que la GPx2 ho fa a l'epiteli intestinal i la GPx3 es troba en plasma. Aquestes tres selenoproteïnes actuen, per tant, en fase aquosa mentre que la GPx4 aparentment protegeix les membranes de processos oxidatius [10].

Tioredoxina reductases

Constitueixen el sistema tioredoxina, un sistema de regulació redox present a tots els organismes vius. Les diferents TrxR utilitzen diferents mecanismes per catalitzar la reducció de les tioredoxines, que presenten un lloc actiu conservat en tots els organismes (Cys-Gly-Pro-Cys). L'organisme model que hem usat per comparar aquesta família de proteïnes és Pelodiscus sinensis, que presenta tres tioredoxines reductases diferents:

TR1 i TR2

TR1 és una proteïna citosòlica que forma part del sistema tioredoxina, mentre que TR2 es troba al mitocondri. En la nostra predicció, ambdues selenoproteïnes es troben presents a Chelonia mydas, obtenint un alineament quasi perfecte amb la query de Pelodiscus sinensis utilitzada.

TR3

És una proteïna que forma part del sistema tioredoxina, però en aquest cas és específica de teixit testicular. En la nostra predicció la selenocisteïna és present a Chelonia mydas, obtenint un alineament quasi perfecte amb la query de Pelodiscus sinensis utilitzada, tot i que l'alineament va ser incapaç d'alinear els primers 56 aminoàcids de la proteïna. Per tal d'assegurar-nos no perdre cap exó es van utilitzar scaffolds més llargs i també un exonerate amb l'opció exhaustive, però tot i així va ser impossible alinear aquests primers aminoàcids. Per tant, es pot concloure que o bé s'han perdut aminoàcids a la proteïna de Chelonia mydas o el seu genoma està mal assemblat en aquesta regió.

Sel15

Trobem un homòleg de Sel15 al genoma de Chelonia mydas, ja que trobem un bon alineament amb un alt grau d'identitat iniciat amb metionina utilitzant la query d'Homo sapiens. A més, la selenocisteïna es troba conservada a la mateixa posició i també hem estat capaços de predir l'element SECIS en el seu 3'UTR.

SelH

La selenoproteïna H, com d'altres selenoproteïnes identificades, conté un motif CxxU (indicatiu de la seva activitat redox). Així, s'ha observat la relació entre la selenoproteïna H i les funcions detoxificants i antioxidants [7]. Amb el blast només s'obté un hit significatiu, la predicció del qual dóna una selenoproteïna de 79 aminoàcids amb dos exons, i la selenocisteïna a la quarta posició. Per tant, trobem un homòleg de SelH en el genoma de Chelonia mydas. La predicció de l'element SECIS no ha estat possible en aquest cas ja que el programa SecisSearch3 necessita un cert marge de nucleòtids (aproximadament 6000) per trobar aquestes estructures a les regions UTR. En el cas de SelH, l'scaffold limita la selecció del nombre de nucleòtids necessari i es perd l'UTR on hauria d'estar el SECIS.

SelI

La selenoproteïna I és una proteïna transmembrana, la funció molecular de la qual encara no està ben definida tot i que es creu que pot estar involucrada en processos de biosíntesi de fosfolípids [4]. En la predicció sembla que la selenocisteïna es conserva al nostre genoma problema; no obstant, l'alineament no ha trobat els darrers aminoàcids de la proteïna, fet que es pot donar degut a que o bé aquests últims aminoàcids s'han perdut, que hi ha gran variabilitat en aquesta regió o que hi hagi un mal assemblatge del genoma.



SelK

La selenoproteïna K és una proteïna de membrana del reticle endoplasmàtic i la seva funció és desconeguda. Tot i això, es considera que està implicada en la defensa antioxidant i la regulació de calci al reticle endoplasmàtic. La proteïna predita amb la query d'Anolis carolinensis donava un alineament parcial ja que a l'hora d'alinear només ho feia correctament un fragment molt curt, el qual no incloïa la selenocisteïna. Per aquest motiu vam decidir repetir la predicció amb Homo sapiens, el qual mostrava el mateix hit significatiu i un alineament de baixa qualitat. Afegint la comanda exhaustive a l'exonerate, es va aconseguir obtenir una proteïna més extensa, que alineva a l'inici amb Met, però finalitzava just abans de la selenocisteïna. Per tant, es va haver de forçar el programa per tal d'arribar al codó stop de la proteïna mitjançant la modificació de l'últim exò en tres nucleòtids per tal d'alinear la selenocisteïna. Un cop fet això, la predicció es va realitzar correctament, amb la posició de la selenocisteïna conservada i un alineament d'identitat molt elevada. Per tant, trobem una proteïna homòloga a SelK en Chelonia mydas.

SelM

És una proteïna que es troba al citoplasma, reticle endoplasmàtic i aparell de Golgi i es creu que pot funcionar com a thiol-disulfide oxidoreductasa participant en la formació de ponts disulfur. En la nostra predicció aparentment sembla que la selenocisteïna és present a Chelonia mydas, obtenint un alineament quasi perfecte amb la query d'Anolis carolinensis.

SelN

No s'ha aclarit la funció d'aquesta proteïna, però el seu dèficit s'ha relacionat amb diverses malalties neuromusculars hereditàries anomenades SEPN1. La predicció resultant dóna una selenoproteïna més curta que la query però que conté la selenocisteïna. La pèrdua del final de la proteïna es pot produïr possiblement com a conseqüència d'una baixa qualitat en l'assemblament del genoma.


SelO

La selenoproteïna O no està gaire estudiada, però se sap que conté un motiu CxxU que indica que la seva funció està relacionada amb les reaccions redox i les propietats antioxidants. Es va escollir com a query la SelO d'Homo sapiens ja que en les altres espècies analitzades les SelO eren proteïnes homòlogues en cisteïna (tot i que s'ha comprovat que aquestes també són proteïnes homòlogues en cisteïna en Chelonia mydas). L'alineament mostra la presència de selenocisteïna, però hi ha una pèrdua d'aminoàcids al principi de la proteïna. Aquesta pèrdua es pot donar per dos factors principals; un assemblatge pobre del genoma problema o bé que es tracti d'una regió d'alta variabilitat, de tal manera que és impossible obtenir un bon alineament.

SelP i SelPb

SelP és una proteïna que està involucrada en processos d'equilibri redox. Aquesta proteïna conté dos dominis: un domini N-terminal amb una redox box (contenint una selenocisteïna) i un domini C-terminal que conté múltiples selenocisteïnes (nombre que depèn de l'espècie) [8]. En el cas de la família SelP, Anolis carolinensis té dues selenoproteïnes anotades a SelenoDB (que són SelP i SelPb, les quals contenen una selenocisteïna cadascuna). La predicció va sortir força bé, un bon alineament amb la selenocisteïna conservada al genoma problema. En mamífers, en canvi, la família SelP només presenta una proteïna i aquesta conté el domini amb múltiples selenocisteïnes, el qual no es troba a la query d'Anolis carolinensis. Així doncs, utilitzant la SelP humana com a query, ha estat possible trobar aquest domini de múltiples selenocisteïnes en el genoma de Chelonia mydas. Tot i així, l'exonerate no era capaç de trobar la regió central de la proteïna i per tal de predir-la sencera s'ha utilitzat el programa Seblastian. Aquest programa ha donat un bon alineament amb la query i també ha predit la presència d'una redox box (en relació a la funció de la proteïna) i de dos SECIS, tal i com era d'esperar.

Així doncs, Chelonia mydas conté un homòleg de la SelP, el qual conté 14 selenocisteïnes, 4 més que la SelP humana i 3 més que Gallus gallus (la query que ha fet servir Seblastian). Per últim, és possible que la seqüència aminoacídica de SelP d'Anolis carolinensis no estigui completa a SelenoDB, ja que no conté el domini amb les múltiples selenocisteïnes. També s'ha pogut predir SelPb, la qual és una duplicació de SelP freqüent en vertebrats, amb l'element SECIS i un bon alineament. SelPb es troba a Chelonia mydas però no a Homo sapiens, ja que aquesta es perd en els mamífers placentaris [4].



SelR1

La selenoproteïna R1 – també coneguda com a methionine-R-sulfoxide reductase B1 (MsrB1) - és una proteïna de la família Msr, les quals catalitzen la reducció de la metionina oxidada en resposta a un increment de ROS. La proteïna ha estat predita amb la query extreta d'Homo sapiens i no s'han trobat SECIS, tot i que segons SelenoDB aquest hauria de ser-hi.

SelS

La selenoproteïna S ha estat predita al genoma de Chelonia mydas amb un bon alineament i amb la selenocisteïna conservada com a penúltim aminoàcid de la seqüència. Tot i així, el programa és incapaç de trobar el principi de la proteïna i, per tant, alinear amb metionina. Tant la predicció amb Anolis carolinensis com amb Homo sapiens resulta amb la falta dels primers 70 aminoàcids de SelS. D'aquesta manera, tot i que trobem l'homòleg d'aquesta, sembla ser que hi ha un problema d'assemblatge del genoma, més que una pèrdua de la seqüència.

SelT

La selenoproteïna T és una proteïna que es troba a l'aparell de Golgi i al reticle endoplasmàtic, tot i que hi ha indicis que també es pot trobar al citosol. A nivell de teixits és especialment abundant als testicles. A la nostra predicció aparentment sembla que la selenocisteïna és present a Chelonia mydas, obtenint un alineament quasi perfecte amb la query d'Anolis carolinensis utilitzada.



SelW

La selenoproteïna W és una proteïna citoplasmàtica que juga un rol com a antioxidant dependent de glutatió. A més, també participa en processos d'equilibri redox i en miopaties per dèficits de seleni. En la nostra predicció sembla que la selenocisteïna és present a Chelonia mydas, obtenint un alineament quasi perfecte amb la query d'Anolis carolinensis utilitzada.

SelV, SelJ, SelL i Fep15

Per tal de trobar el màxim nombre de selenoproteïnes possible en el genoma problema, es va realitzar la predicció per a altres entitats del selenoproteoma de vertebrats que, a priori, no hauria de contenir el genoma de Chelonia mydas. Concordant amb la bibliografia, essent SelV exclusiva de mamífers placentaris, no va donar cap hit significatiu. Tampoc hi va haver cap significància en les prediccions de SelJ i SelL, presents en peixos; ni de Fep15, la qual trobem en Xenopus laevis.

Proteïnes de la maquinària

A part dels elements SECIS i del t-RNA que codifica per a Sec, és necessària l’acció cooperativa d’una sèrie de factors proteics per a l’expressió de les selenoproteïnes. En procariotes això s’aconsegueix a partir dels productes gènics de SelA, SelB, SelC i SelD, però en mamífers el mecanisme és molt més complex i menys conegut. La maquinària d'eucariotes està formada per 7 proteïnes principals [13], les quals presenten un alt grau de conservació segons les prediccions resultants:

SBP2

Forma part d'un complex multiproteic juntament amb EFSec, SECp43 i SPS1, entre d'altres. La proteïna conté diferents dominis i un senyal d’exportació i d’importació nuclear (NES i NLS). Sembla ser que té una funció important en la incorporació de nous aminoàcids a la proteïna, ja que en absència de SBP2 no es dóna la traducció de selenoproteïnes. En la nostra predicció sembla que la proteïna és present al genoma de Chelonia mydas, obtenint un alineament quasi perfecte amb la query d'Anolis carolinensis utilitzada.



SPS1

És una proteïna implicada en la via de síntesi de selenocisteïnes, tot i que la seva funció concreta encara està en controvèrsia [13]. En la nostra predicció sembla que la proteïna és present al genoma de Chelonia mydas, obtenint un alineament quasi perfecte amb la query de Pelodiscus sinensis utilitzada tot i que ha sigut impossible alinear els últims aminoàcids.

SPS2

La funció d'aquesta proteïna és generar compostos donadors de Se (selenofosfats), necessaris per a la biosíntesi de selenocisteïnes [4], i, interessantment, forma part de la maquinària alhora que és també una selenoproteïna. En la nostra predicció sembla que una de les selenocisteïnes es conserva al nostre genoma d'interès; no obstant, l'altra selenocisteïna no s'ha pogut alinear ja que l'alineament no ha trobat ni els primers ni els darrers aminoàcids de la proteïna. Això es pot donar degut a que o bé aquests aminoàcids s'han perdut, que hi ha gran variabilitat en aquesta regió o que hi ha un mal assemblatge del genoma.

SecS

SecS és una proteïna que transforma el O-phospho-l-seryl-tRNA[Ser]Sec en selenocisteyl-tRNA[Ser]Sec utilitzant el selenofosfat com a compost donador de seleni [14]. En la nostra predicció aquesta proteïna ha estat alineada amb els genomes d'Anolis carolinensis, Pelodiscus sinensis i Homo sapiens, obtenint un bon alineament únicament amb el genoma del primer organisme. No obstant, es pot observar un fragment indeterminat a la proteïna predita del nostre genoma problema que correspon a un fragment d'aminoàcids desconeguts.



Secp43

És una proteïna nuclear que participa en la biosíntesi i regulació de selenoproteïnes mitjançant la interacció amb el Sec-tRNA en un complex multiproteic [15]. En la nostra predicció aquesta proteïna ha estat alineada amb els genomes d'Anolis carolinensis, Pelodiscus sinensis i Homo sapiens, obtenint un alineament quasi perfecte en els dos primers, mentre que en el darrer no hi ha un bon alineament degut a que hi ha una pèrdua d'aminoàcids al mig de la proteïna. Tot i així, no hem sigut capaços d'alinear la metionina.

Pstk

És un enzim que fosforila el Ser-tRNA(Sec) per a produir O-fosfoseril-tRNA(Sec) [16]. En la nostra predicció sembla que la proteïna és present al genoma de Chelonia mydas, obtenint un alineament quasi perfecte amb la query d'Anolis carolinensis utilitzada tot i que ha sigut impossible alinear els primers 8 aminoàcids.

eEFsec

Presenta una seqüència i uns dominis similars al factor d’elongació EF1A. Està implicada tant en la biosíntesi de selenocisteïnes com en la seva incorporació a la proteïna i sembla que, a més, interacciona amb la resta de components de la maquinària de síntesi d'aquestes. En la nostra predicció sembla que la proteïna és present al genoma de Chelonia mydas, obtenint un alineament quasi perfecte amb la query de Pelodiscus sinensis utilitzada.

tRNA-Sec

Per acabar de confimar l'existència d'un sistema de biosíntesi de selenoproteïnes complet, s'ha avaluat la presència de l'RNA de transferència de selenocisteïna. La query usada ha estat extreta de Transfer RNA Database, corresponent a Homo sapiens. El programa BLAST presenta un hit significatiu amb el 100% d'identitat, i per tant, aquest tRNA també és present en Chelonia mydas.

Proteïnes homòlogues en cisteïna

En un primer moment, es va seguir el procediment descrit en l'apartat Materials i Mètodes per tal d'alinear totes les proteïnes homòlogues en cisteïna dels genomes d'Anolis carolinensis i Pelodiscus sinensis amb el nostre genoma problema. Amb això es pretenia determinar la variabilitat existent entre les espècies escollides com a genoma de referència i el genoma de Chelonia mydas, amb l'objectiu d'anotar el màxim de selenoproteïnes possibles. Primerament, es van desestimar aquells alineaments que no donaven resultats informatius. Tot seguit, es va iniciar l'anàlisi de dades i es va observar que molts dels alineaments obtinguts es localitzaven a la mateixa regió genòmica del genoma problema. Per evitar extreure conclusions errònies aquests alineaments van ser exclosos, seleccionant únicament aquelles proteïnes que es mostren a la taula de proteïnes homòlogues.

Així es van excloure els alineaments de les proteïnes següents:

Anolis carolinensis: eEFsec (none 1), eEFsec (none 2), eEFsec (none 3), GPx8, GPx (none 1), SBP2 (none 1), SBP2 (none 2), SecS, SelO (none 2), SelO (none 4) i Secp43.

Pelodiscus sinensis: GPx (none 2), GPx (none 3), DI (none 2), DI (none 3), SPS (none 1), SelH (none 1), SelH (none 2).

A més a més, durant l'anàlisi també es va observar que alguns resultats d'alineaments de proteïnes sense subfamília especificada es corresponien a proteïnes amb subfamília definida d'altres organismes model. Això succeeix, per exemple, amb DI (none 2) de Pelodiscus sinensis i DI3 d'Homo sapiens, les quals alineen a la mateixa regió al genoma problema.

Respecte als resultats obtinguts, es pot destacar que SelU1 és una proteïna homòloga en cisteïna a Chelonia mydas, mentre que al genoma ancestral de vertebrats aquesta formava part del selenoproteoma. A més a més, SelU1 sí que es troba com a selenoproteïna al genoma d'Anolis carolinensis de manera que, segons els resultats, en algun ancestre comú entre aquests dos organismes la selenocisteïna va ser substituïda per una cisteïna. Un fet que recolza aquesta afirmació és que la proteïna encara presenta un element SECIS a la seva seqüència.