Discussió

Família TR

Aquesta família està formada per tres proteïnes: TR1, TR2 i TR3. Cada una d'elles tenia diversos hits, la majoria dels quals eren comuns. Utilitzant els valors d'e-value i la informació dels bits del BLAST, i els diferents alineaments del t-coffee, hem pogut assignar un possible hit a cada una de les proteïnes.

TR1

A la taula es pot observar a quin scaffold es troba la proteïna, en quin sentit respecte l'anotació es transcriu, les coordenades de la proteïna predites per l'exonerate i el genewise i, finalment, les coordenades i l'energia lliure dels elements secis.

En aquest cas, la proteïna TR1 es troba a l'scaffold GL861603.1 i està codificada en el mateix sentit que l'anotació (forward).

Hem obtingut la predicció d'una proteïna tan amb exonerate com amb genewise:

  • La predicció d'exonerate té 37021 nucleòtids, que inclouen sis exons i cinc introns, i una raw score de 2324.
  • La predicció de genewise té 37015 nucleòtids, que inclouen sis exons i cinc introns, i té una puntuació de 913.43 bits.

Les dues prediccions són molt similars, però la predicció de l'exonerate acaba 2 aminoàcids més tard que la predicció obtinguda mitjançant el genewise.

La proteïna d'Homo sapiens té una selenocisteïna i hem observat que aquesta es troba conservada en el tretzè exó de la nostra proteïna predita per exonerate, però no en la predita per genewise, que s'acaba a l'aminoàcid anterior. Això podria ser degut a que genewise considera el codó TGA com a codó d'stop i, per tant, acaba la predicció i no detecta la selenocisteïna. Per tant, considerarem que aquesta proteïna predita té la selenocisteïna conservada.

El programa secisSearch ha trobat dos possibles elements secis a l'extrem 3' del gen, a diferents distàncies del final del gen, però no tenim el coneixement per discriminar quin dels dos és el real. Tot i això, la presència d'aquests elements secis dóna suport a la predicció que es tracta una selenoproteïna conservada.

Considerant tota la informació anterior, es podria predir una estructura de la proteïna TR1:


TR2

A la taula es pot observar a quin scaffold es podria trobar la proteïna, en quin sentit respecte l'anotació es transcriu, les coordenades de la proteïna predites per l'exonerate i el genewise i, finalment, les coordenades i l'energia lliure dels elements secis.

En aquest cas, la proteïna TR2 es troba a l'scaffold GL841864.1 i està codificada en el sentit contrari que l'anotació (reverse).

Hem obtingut la predicció d'una proteïna tan amb exonerate com amb genewise:

  • La predicció d'exonerate té 266502 nucleòtids, que inclouen onze exons i deu introns, i una raw score de 1018.
  • La predicció de genewise té 40589 nucleòtids, que inclouen deu exons i nou introns, i té una puntuació de 345.34 bits.

Les dues prediccions inclouen la regió inicial de la proteïna query, cobrint la predicció de l'exonerate una regió una mica superior de l'inici. Les prediccions realitzades arriben fins al final de l'scffold i, per tant, podria ser que la regió que falta es trobés en un altre scaffold, que no hem pogut localitzar.

La proteïna d'Homo sapiens té una selenocisteïna com a penúltim aminoàcid. Tenint en compte que no s'ha predit aquesta regió de la proteïna en cap dels hits, no podem afirmar ni descartar la seva presència.

El programa secisSearch no ha trobat cap possible element secis a l'extrem 3' del gen, perquè aquest és l'extrem no predit d'aquesta proteïna i, per tant, no s'ha pogut buscar.

Considerant tota la informació anterior, es podria predir una estructura de la proteïna TR2:




TR3

A la taula es pot observar a quin scaffold es troba la proteïna, en quin sentit respecte l'anotació es transcriu, les coordenades de la proteïna predites per l'exonerate i el genewise i, finalment, les coordenades i l'energia lliure dels elements secis.

En aquest cas, la proteïna TR3 es troba a l'scaffold GL841599.1 i està codificada en el sentit contrari que l'anotació (reverse).

Hem obtingut la predicció d'una proteïna tan amb exonerate com amb genewise:

  • La predicció d'exonerate té 30942 nucleòtids, que inclouen sis exons i cinc introns, i una raw score de 2504.
  • La predicció de genewise té 30936 nucleòtids, que inclouen sis exons i cinc introns, i té una puntuació de 922.42 bits.

Les dues prediccions són molt similars, però la predicció de l'exonerate comença 2 aminoàcids abans que la predicció obtinguda mitjançant el genewise.

La proteïna d'Homo sapiens té una selenocisteïna, però nosaltres no l'hem poguda veure ja que les dues prediccions s'acaben en l'aminoàcid anterior. Hem buscat el final de la predicció i hem pogut observar que el següent codó és ACT, el qual codificaria per una Treonina. Tot i això, no entenem perquè els dos programes han finalitzat les seves prediccions si no hi havia un codó d'stop. Per tant, no podem concloure ni hipotetitzar si es tracta d'una selenoproteïna o no.

El programa secisSearch ha trobat un possible element secis a l'extrem 3' del gen, que donaria suport a la hipòtesi que es tracta d'una selenoproteïna, o bé podria deure's a que la selenocisteïna s'ha perdut recentment i, per tant, l'element secis encara es manté.

Considerant tota la informació anterior, es podria predir una estructura de la proteïna TR3:


Selenoprofiles

Per aquesta família de proteïnes, el programa selenoprofiles troba 3 hits diferents.

Per la proteïna que nosaltres anomenem TR1, el hit de Selenoprofiles que coincideix a la mateixa posició (com passa sovint, és el mateix scaffold però no comparteixen inici i final exactes) és el TR.20. Aquest hit té la selenocisteïna alineada. L'element secis que el Selenoprofiles prediu per aquest hit és el mateix que hem predit nosaltres, ja que es troba a la mateixa posició.

Per la proteïna que nosaltres anomenem TR3, el hit de Selenoprofiles que concorda amb la mateixa posició és el TR.9. Tot i així, tot i trobar-se en el mateix scaffold, les posicions ballen una mica entre els dos resultats.

També difereixen els resultats dels elements secis. L'element secis trobat per nosaltres comença a la posició 876118 i acaba a la posició 876028; mentre que la predicció feta per Selenoprofiles identifica l'element secis a la posició 939840 fins la posició 939935. Aquest hit té la selenocisteïna alineada (contràriament als nostres resultats), per tant, com que solapen aproximadament a la mateixa regió, podem confirmar que TR3 es tracta d'una selenoproteïna.

Pel que fa a l'altre hit trobat per Selenoprofiles per aquesta família (hit TR.31), correspondria a la proteïna que nosaltres anomenem TR2. Aquest hit del Selenoprofiles consta de 9 exons, no té cap element secis i a més no té la selenocisteïna alineada.