DISCUSSIÓ
Com s'ha comentat a l'apartat de materials i mètodes, hem seleccionat totes les selenoproteïnes de Mus musculus i Homo sapiens i les hem cercat en el genoma de Cricetulus griseus . Per a decidir si es troben conservades, ens hem basat en l'homologia entre les proteïnes de les dues espècies. Posteriorment, s'ha repetit la cerca amb el programa Selenoprofiles per tal d'arribar a uns millors resultats i analitzar altres proteïnes existents en eucariotes, però que no han estat trobades en les nostres dues espècies model. A continuació, es troben els comentaris dels resultats obtinguts.
GPx1, GPx2, GPx3, GPx4, GPx6, GPx7, GPx8, DI1, DI2, MsrA, SBP2, Sel15, SelH, SelI, SelK, SelM, SelN, SelS, SelT, SelW2, TR1, TR2, TR3, SPS2
L'homòleg d'aquestes proteïnes de Mus musculus s'ha trobat sense problemes en el genoma de Cricetulus griseus, ja que els alineaments són bons.
GPx1, GPx2, GPx3, DI1, DI2, Sel15, SelH, SelI, SelK, SelM, SelN, SelS, SelT, TR1, TR2, SPS2
Totes aquestes proteïnes són selenoproteïnes en Mus musculus. Considerem que en el nostre cas també ho són perquè hem trobat la U alineada amb un codó stop (recordem que el codó que codifica per selenocisteïna és també un codó stop i que la majoria de programes d'anotació de genomes el reconeixen com a tal). A més a més, s'ha trobat un possible element SECIS a la regió 3' UTR.
Pel que fa als resultats del Selenoprofiles, sembla ser que recolzen que les proteïnes GPx1, GPx2, DI1, DI2, Sel15, SelH, SelI, SelM, SelN, SelS, SelT, TR1, TR2 i SPS2 predites per nosaltres són realment els homòlegs d'aquestes proteïnes en Cricetulus griseus, ja que l'alineament que ens proporciona és a les mateixes posicions del genoma on nosaltres les havíem localitzat. A més a més, l'element SECIS que nosaltres havíem trobat per GPx1 estava una mica lluny i el Selenoprofiles ha estat capaç de trobar-ne un molt més a prop, proporcionant més indicis de que GPx1 es trobi conservada.
En canvi, els resultats de SelK no són tan clars, és cert que el Selenoprofiles també va trobar la proteïna a la mateixa regió que nosaltres, però a part d'aquest alineament ens proporciona molts més que també són força bons. Aquests es troben en contigs que no van ser analitzats per nosaltres perquè els e-values no eren tan alts i corresponien a una part més petita de la proteïna. De tota manera, aquests resultats semblen suggerir que la proteïna es troba repetida en el genoma, de manera que s'hagin conservat diferents pseudogens. El Selenoprofiles no ens proporciona l'alienament de GPx3, tot i que en el blast apareix el contig on nosaltres hem localitzat GPx3, a l'hora de fer l'alineament el descarta. No obstant, considerem que l'alineament obtingut per nosaltres és molt bo i, tot i que el Selenoprofiles no ens hagi pogut confirmar els resultats, seguim creient que el més probable és que Cricetulus griseus sí que tingui GPx3.
GPx4, TR3
En Mus musculus són selenoproteïnes. En el nostre cas, els alineaments són molt bons i les Us també es troben alineades amb un codó stop. Per tant, tot i que no s'ha trobat cap element SECIS a la regió 3'UTR, ens sembla que degut a l'elevada conservació de l'homologia, sí que es troben conservades. No obstant, poden haver passat dues coses, o bé que les proteïnes es trobin conservades i que el programa no hagi estat capaç de predir els SECIS, però que aquests sí que existeixin. O, que recentment s'hagin perdut els elements SECIS i que aquestes ja no siguin selenoproteïnes funcionals, però que encara no hagin tingut temps de canviar massa. Nosaltres trobem més factible la primera opció, però amb les eines de les quals disposem, no podem descartar la segona opció.
El Selenoprofiles recolza els nostres resultats pel que fa a TR3, ja que proporciona el mateix alineament que nosaltres i en aquest cas sí que ha estat capaç de predir un element SECIS. En canvi, no ens proporciona l'alienament de GPx4, tot i que en el blast apareix el contig on nosaltres hem localitzat GPx4, a l'hora de fer l'alineament el descarta. No obstant, considerem que l'alineament obtingut per nosaltres és molt bo i, tot i que el Selenoprofiles no ens hagi pogut confirmar els resultats, seguim creient que el més probable és que Cricetulus griseus sí que tingui GPx4.
GPx6, GPx7, GPx8, MsrA, SelW2
Aquestes proteïnes són homòlegs en cisteïna en Mus musculus. Considerem que en el nostre cas també ho són perquè la C queda ben alineada amb una C en Cricetulus griseus i no es troben elements SECIS després del final del gen o, aquests es troben molt lluny.
A més a més, el Selenoprofiles alinea la proteïna MsrA en la mateixa regió on nosaltres ho vam fer, confirmant així, que allà és on es troba el seu homòleg en Cricetulus griseus. No obstant, no podem dir el mateix pel que fa a GPx6, GPx7 i GPx8, ja que no ens proporciona els alineaments, tot i que en el blast apareixen els contigs on nosaltres les hem localitzat, a l'hora de fer l'alineament els descarta. No obstant, els nostres alineaments són prou bons i seguim considerant que es troben conservades. A més a més, veiem que la família GPx és una família molt ampla i sembla ser que el Selenoprofiles les busca totes juntes, fet que explicaria perquè els resultats per aquesta família no són bons.
Pel que fa a SelW2, el Selenoprofiles tampoc ens proporciona els alineaments i, al fitxer del blast no apareix el contig on nosaltres l'hem localitzat. No sabem que ha passat amb les proteïnes de la família SelW, perquè la SelW1 tampoc l'ha buscat a la mateixa regió que nosaltres. Podria ser que la seqüència query fos força diferent, i per això els resultats hagin estat tan extremadament diferents. Tot i així, creiem que el nostre alineament és bo, per tant, ens sembla que és força possible que Cricetulus griseus tingui un homòleg de la proteïna SelW2 de Mus musculus.
SBP2
Es tracta d'una proteïna de la maquinària de síntesi de Selenoproteïnes en Mus musculus i Homo sapiens, com que l'homologia entre la proteïna de Mus musculus i Cricetulus griseus és bona, considerem que també ho és en Cricetulus griseus. No es mostren els resultats del Selenoprofiles perquè sembla ser que el programa no busca aquesta proteïna.
DI3, SelO, SelP, R1, R2, R3, SelU1, SelU2, SelU3, eEFSec
El query d'aquestes proteïnes l'hem obtingut d'Homo sapiens perquè a SelenoDB no apareixien entre les proteïnes de Mus musculus. L'alineament del query d'Homo sapiens i la seqüència aminoacídica trobada és força bo, així doncs, podem considerar que també es troben en Cricetulus griseus. A més a més, en acabat, hem fet un blastp de la proteïna obtinguda contra tots els genomes del NCBI i hem trobat que aquestes proteïnes sí que existeixen en Mus musculus, tot i que de vegades apareixen amb un altre nom, sovint "unknown protein X". Per tant, creiem que el que passa és que realment sí que estan presents en Mus musculus , però que el SelenoDB s'hauria d'actualitzar i, al NCBI algunes no estan correctament anotades, però surten perquè es troben en el genoma.
DI3, SelO, SelP, R1
Totes aquestes proteïnes són selenoproteïnes en Homo sapiens. Considerem que en el nostre cas també ho són perquè hem trobat la U alineada amb un codó stop. A més a més, s'ha trobat un possible element SECIS a la regió 3' UTR.
Pel que fa als resultats del Selenoprofiles sembla ser que aquests recolzen les nostres prediccions.
R2, R3, SelU1, SelU2, SelU3
Aquestes són homòlegs en cisteïna en Homo sapiens. Considerem que en el nostre cas també ho són perquè la C queda ben alineada amb una C en Cricetulus griseus i la resta de l'alineament també és bo.
A més a més, els resultats del Selenoprofiles recolzen que les nostres prediccions són correctes pel que fa a aquestes proteïnes i que, per tant, són realment els seus homòlegs en Cricetulus griseus.
eEFSec
Es tracta d'una proteïna de la maquinària de síntesi de Selenoproteïnes en Homo sapiens, com que l'homologia entre la proteïna d' Homo sapiens i Cricetulus griseus és bona, considerem que també ho és en Cricetulus griseus. No es mostren els resultats del Selenoprofiles perquè sembla ser que el programa no busca aquesta proteïna.
GPx4
Com es pot observar a la taula de resultats, l'alineament de la proteïna obtinguda amb la de Mus musculus és força bo (tot i que falta el principi, fet comentat més endavant). No obstant, ens va sorpendre que tan en fer l'exonerate com el genewise, només ens troba un exó o dos i el selenoDB indica que tan en Mus musculus com en Homo sapiens n'hi ha 7. Després de donar-li algunes voltes, creiem que el més probable és que s'hagin perdut els introns. A més a més, com s'ha indicat prèviament, no s'ha trobat cap element SECIS, però com que la proteïna està tan conservada, creiem que podria ser que realment sí que hi hagi SECIS i que el programa no l'hagi trobat. Per descomptat, també podria ser que realment no hi hagi SECIS, indicant doncs, que la selenoproteïna s'hauria perdut en Cricetulus griseus. En aquest cas, ho hauria fet molt recentment, explicant doncs que la proteïna es trobi tan conservada. Com que el Selenoprofiles no ens ha trobat GPx4, no ens pot ajudar a descartar cap teoria, per tant, no tenim manera de saber quina de les dues hipòtesis és la certa.
GPx5 i GPx6
En fer el blast de les proteïnes de Mus musculus amb el genoma de Cricetulus griseus, hem obtingut hits en el mateix contig i, ambdós amb el mateix e-value. Degut a això, hem analitzat les dues proteïnes per la mateixa regió del genoma. El resultat de l'exonerate mostra 4 exons de GPx5 a la cadena forward i 5 exons de GPx6 a la mateixa regió de la cadena forward. A més a més, troba 5 exons de GPx5 a la cadena reverse i, 4 exons de GPx6 a la mateixa regió de la cadena reverse. Aquests resultats, ens van portar a pensar que GPx5 es trobava a la cadena forward i GPx6 a la reverse (ja que la proteïna de Mus musculus té 5 exons). En mirar els resultats dels alineaments, veiem que cap de les dues proteïnes queda ben alineada amb la regió trobada a la cadena forward i, que totes dues queden prou bé en comparar-les amb la regió trobada a la cadena reverse. De tota manera, és GPx6 la que més ben alineada queda. Aquests resultats semblen indicar que GPx5 pot haver-se perdut i que com que és molt semblant a GPx6, els hits obtinguts realment siguin GPx6. El Selenoprofiles no ens serveix per a comprovar aquesta deducció, ja que, com passa amb altres GPx, no ha trobat aquestes proteïnes.
SPS1
Tan en Mus musculus com en Homo sapiens, la posició on hi havia la U en altres espècies, ha passat a T. En el nostre cas, la T de Mus musculus també s'alinea amb una T, per tant, SPS1 de Cricetulus griseus és homòleg en T, igual que en Mus musculus i Homo sapiens. El Selenoprofiles recolza aquest resultat, ja que ens alinea SPS1, en les mateixes posicions on nosaltres ho havíem fet.
SelV
A l'hora de fer el primer blast ja vam veure que tots els e- values eren molt baixos. No obstant, vam agafar els contigs on s'havien trobat e-values de 10-10, 10-8 i 10-7. Els alineaments són molt dolents, només s'alineen uns quants nucleòtids a partir de la posició 267 de la query. Així doncs, tot sembla indicar que la proteïna SelV d'Homo sapiens no es troba conservada en Cricetulus griseus. No es mostren els resultats del Selenoprofiles perquè sembla ser que el programa no busca aquesta proteïna.
SelW1
Amb les nostres eines vam ser capaços de trobar un bon alineament en el contig on havíem trobat el millor hit en fer el blast, però no vam ser capaços de trobar un SECIS a la regió 3'UTR. En canvi, el selenoprofiles ens ha donat un alineament amb element SECIS, però en un contig que ni tan sols ens apareixia al fitxer del blast. Com que els dos alineaments alineen una bona part de la proteïna, creiem que no val la pena descartar cap dels dos resultats. Així doncs, el més probable és que SelW1 es trobi conservada en Cricetulus griseus i possiblement amb dues còpies en regions diferents del genoma. Les diferències entre els nostres resultats i els del Selenoprofiles en aquesta família, podrien ser degudes a que les seqüències query fossin força diferents, ja que nosaltres ho buscàvem basant-nos en Mus musculus i el selenoprofiles fa servir Rattus norvegicus.
Altres comentaris
Ensamblatge del principi de la proteïna
En les instruccions del treball es demanava que es donés cada proteïna trobada començant per una Metionina, però amb les nostres eines ens ha estat impossible de fer-ho per aquestes proteïnes: GPx4, MsrA, Sel15, SPS2, R2, R3, SelN, SelO, SelU2. No obstant, gràcies al Selenoprofiles vam poder trobar el principi de les proteïnes MsrA i R3, però no de les altres.
L'alineament era bo per quasi tota la proteïna, excepte per un primer fragment. Degut a això, vam fer un blast (tblastn) del fragment no alineat de la query contra el genoma de Cricetulus griseus, però en cap cas es va trobar un hit. Per tant, no sabem què pot haver passat amb aquest fragment, possiblement el principi de la proteïna hagi canviat, però com que la resta es troba ben alineada, considerem que aquest fet no té perquè dir que la proteïna sencera s'hagi perdut. No obstant, podria ser que el problema sigui la qualitat de l'ensamblatge del genoma, que no sigui prou bona i, per això no poguem trobar aquests fragments.
Com s'ha comentat prèviament, el Selenoprofiles ens alinea les proteïnes MsrA i R3 completament, inclús el principi. En ambdós casos, aquest es trobava abans de les posicions del genòmic que nosaltres vam agafar. Per tant, això sembla explicar perquè no el vam trobar en alinear, però no tenim explicació per no haver trobat la regió en fer un blast només per l'exó no trobat, suposem que perquè l'ensamblatge dels genomes no va ser correcte.
Pel que fa a SelO, el Selenoprofiles no troba un principi de proteïna que comenci per M, però troba dos exons més al principi que nosaltres. Així doncs, es pot dir que el Selenoprofiles ha trobat més part de l'inici, però que tampoc ha estat capaç de predir la proteïna completa.
Altres proteïnes cercades pel Selenoprofiles
A part de les selenoproteïnes ja comentades, el Selenoprofiles també va buscar Fep15, FrnE, SelG, SelJ i SelL. Nosaltres no les havíem buscat perquè no s'han trobat ni en Homo sapiens ni en Mus musculus. Els resultats del Selenoprofiles indiquen que en Cricetulus griseus tampoc es troben conservades.
Cerca del tRNA de selenocisteïna
Vam voler utilitzar el programa tRNAscan-SE per cercar tRNAs de Selenocisteïna però no vam ser capaços de distingir entre els de Stop i el de Selenocisteïna perquè la notació era tRNA- Sup per ambdós. No vam poder descobrir quina era la comanda necessària per a que el programa trobés els tRNAs d'interès. No obstant, sabem que les cèl·lules d'ovari de hàmster (CHO) tenen 2 tRNAs per Selenocisteïna perquè ja han estat analitzades (per a més informació feu click aquí).
Torna a dalt