Astyanax mexicanus

Conclusions

L'objectiu d'aquest treball va ser identificar totes les selenoproteïnes i les proteïnes de maquinària presents en el genoma de Astyanax mexicanus. Els resultats es van obtenir a partir de la comparació del genoma del nostre organisme amb les proteïnes anotades a la base de dades de SelenoDB 2.0 d'una espècie de referència, el Danio rerio. Es va escollir aquesta espècie com a organisme de referència perquè té una elevada proximitat filogenètica, el seu genoma està ben caracteritzat i és el peix ossi amb el selenoproteoma més gran. Tot i així, també es van analitzar les proteïnes no trobades en el genoma de Danio rerio utilitzant les proteïnes anotades en el SelenoDB 2.0 d'Homo sapiens (com a espècie més llunyana amb la que comparar però millor anotada) i Takifugu rubripes.

Per una part, i tal i com esperàvem degut a l'elevat grau d'homologia, es van poder caracteritzar correctament la majoria de proteïnes a partir del genoma de Danio rerio. D'aquesta manera, podem afirmar que el genoma del nostre organisme, al igual que el de Danio rerio, codifica per a les següents proteïnes: Sel15, SELENOE, proteïnes de la família GPx (GPx1, GPx2, GPx3a, GPx3b, GPx4a, GPx4b, GPx7 i GPx8), proteïnes de la família DIO (DIO1 i DIO3a), MsrA , proteïnes de la família SelenoR (MsrB1A, MsrB2 i MsrB3), proteïnes de la família SEPHS (SEPHS1 i SEPHS2), SelH, SelI, SelJ, SelK, SelL, SelM, SelO1, proteïnes de la família SelenoP (SelP1 i SelP2), proteïnes de la família SelenoT (SelT1 i SelT1b), proteïnes de la família SelenoU (SelU2 i SelU3), proteïnes de la família SelenoW (SelW(I), SelW(II) i SelW(III)) i proteïnes de la família TXNRD (TXNRD2 i TXNRD3).

Pel que fa a la família SelenoW, ens agradaria destacar que tot i que SelW(I) no es troba present en molts peixos ossis, l'hem pogut identificar en el genoma d'Astyanax mexicanus.

Per altra banda, fer una menció especial a la família Seleno P ja que aquesta presenta un gran nombre de selenocisteïnes en les seves dues isoformes. SelP1 presenta tres selenocisteïnes i SelP2 conté 13 selenocisteïnes a un mateix exó. Tanmateix, aquest fet ens concorda amb el que esperàvem.

En quan a les proteïnes de maquinària identificades a partir de Danio rerio podem concloure que Astyanax mexicanus presenta les següents: eEFsec, PSTK, SBP2, SecS, i SECp43. Tot i així, hem pogut observar algunes diferències respecte Danio rerio. Astyanax mexicanus només presenta una de les dues isoformes de SECp43 i de SBP2. A més, la proteïna SBP2 del nostre organisme conté una selenocisteïna, mentre que la de Danio rerio conté cisteïna.

Cal comentar que ens hem trobat amb una sèrie de proteïnes les quals es troben presents en Danio rerio i no en Astyanax mexicanus. Per exemple, no s'han pogut identificar les proteïnes DIO2 i DIO3b, de manera que observem que el nostre organisme, a diferència de la majoria de peixos ossis, no presenta duplicada la selenoproteïna DIO3. Tampoc s'han pogut identificar les selenoproteïnes SelT2, SelN, SelS, SelU1A i SelO2, i s'ha vist que Astyanax mexicanus no té duplicada la selenoproteïna MSRB1, a diferència de Danio rerio.

Per altra part, vam comparar el nostre genoma amb les proteïnes d'Homo sapiens per tal de verificar que identificàvem correctament totes les selenoproteïnes i proteïnes de maquinària en Astyanax mexicanus. En quan a les selenoproteïnes, no se'n va identificar cap que no hagués estat ja identificada mitjançant l'alineament amb Danio rerio. En canvi, si que ens va ser útil comparar amb Homo sapiens a l'hora de buscar les proteïnes de maquinària. Vam poder identificar correctament en Astyanax mexicanus les proteïnes TTPA, SELENBP1 i RPL30. A més, es va poder observar com en el cas de la proteïna SELENBP1, aquesta conté una cisteïna en Homo sapiens però una selenocisteïna en Astyanax mexicanus. Aquest fet concorda amb la bibliografia consultada ja que sabem que al llarg de l'evolució dels mamífers hi ha una tendència al reemplaçament de les selenocisteïnes per cisteïnes. Tot i això, no es van poder identificar en el genoma d'Astyanax mexicanus altres proteïnes predites a partir d'Homo sapiens com: TXNRD1, GPx5, GPx6, ELAVL1, CELF1, EIF4A3 i G6PD.

Finalment, comentar que durant l'alineament amb les proteïnes de Takifugu rubripes no es va identificar cap proteïna que no hagués estat ja identificada durant la comparació amb Danio rerio i Homo sapiens. No es van identificar en el genoma d'Astyanax mexicanus les proteïnes SelU1b i SelU1c, presents en Takifugu rubipes. Aquest fet podria ser degut o bé a una aparició d'aquestes selenoproteïnes en Takifugu rubipres posterior a la separació d'Astyanax mexicanus o bé perquè aquest últim les ha perdut també posteriorment a aquesta separació.

Pel que fa a les limitacions que presenta aquest projecte, hem trobat que hi ha un conjunt d'aspectes que es podrien millorar en altres estudis futurs, els quals comentarem a continuació.

En primer lloc, com ja hem comentat en la discussió, gran part de les selenoproteïnes i proteïnes de maquinària que hem intentat predir en Astyanax mexicanus utilitzant les proteïnes anotades en Danio rerio, Takifugu rubripes i Homo sapiens en el SelenoDB 2.0 no començaven amb metionina. Aquest fet ens ha fet concloure que algunes d'aquestes proteïnes podrien no estar ben anotades en la base de dades SelenoDB 2.0. Per aquesta raó, creiem que en estudis futurs s'haurien d'intentar cercar en altres bases de dades com Uniprot o a SelenoDB 1.0 (on les selenoproteïnes s'anoten manualment).

En segon lloc, pel que fa al programa d'automatització que vam crear, creiem que es podria perfeccionar fent que ell mateix agafi els hits i les posicions per a fer l'anàlisi. També creiem que es podria automatitzar alguna funció en el programa que assigni directament un o més hits de forma segura a una proteïna tenint en compte tots els que troba en les altres proteïnes.

En tercer lloc, la interpretació dels resultats obtinguts ha estat complicada, ja que el criteri d'elecció el vam decidir nosaltres, segons el que creiem que era el més correcte a l'hora de triar els hits (e-value i llargada). Això va ser un problema en alguns casos ja que es podrien haver descartat alguns hits que podrien ser correctes i correspondre's a duplicacions d'alguna part d'una proteïna. També cal comentar que va ser difícil la interpretació de l'anàlisi d'aquells scaffolds que coincidien (amb les mateixes posicions genòmiques) en diverses proteïnes, cosa que es va haver de fer mitjançant arbres filogenètics.

En quart lloc, degut a la complexitat i quantitat de feina que porta aquest treball, creiem que hauria de començar i ser explicat amb molta més antelació per a poder tenir una millor organització i més temps per a poder realitzar-lo. Creiem que la informació que s'ha proporcionat sobre el treball prèviament a l'inici d'aquest (seminaris) és escassa i insuficient i s'agrairia una millora en aquest aspecte. També estaria bé que hi hagués una millor coordinació entre els tutors dels diversos treballs a l'hora de respondre els dubtes, ja que sembla que molts d'ells tenien opinions diferents sobre alguns dels dubtes que ens anaven sorgint mentre es realitzava el treball.

Tot i les limitacions presents en aquest projecte, el treball ens ha permès entendre quina és la funció de les diferents selenoproteïnes, així com de les proteïnes de maquinària. També ens ha permès entendre com aquestes han anat canviant al llarg de la història evolutiva de les espècies, centrant-nos més en l'evolució d'aquestes proteïnes en els peixos ossis.