Família GPX

La família de les glutatió peroxidases és coneguda per actuar com antioxidants al catalitzar la reducció del peròxid d’hidrogen (H2O2) protegint les cèl·lules del dany oxidatiu. La predicció de les selenoproteïnes d’aquesta gran família ha donat els següents resultats:

GPx1

Per escollir el millor alineament dels 31 existents s’ha fet servir els criteris descrits a materials i mètodes, a més de tenir en compte la resta d’alineaments de la resta de la família de selenoproteïnes Gpxs. També s'ha de tenir en compte el que surt al t_coffee. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee al scaffold00121, amb un score de 211 i un e-value de 2e-53 al blast. Inclou dos fragments amb una identitat de més del 85%. Les posicions van des de 1424426 fins 1425290.

Aquest alineament es troba a un frame positiu, és a dir, en la cadena forward. Amb l'identificador gi|408541682|gb|JH947250.1|, el valor del score al t-coffee és de 99, amb una length de 201. La query va des de 1 fins a 196. La query alinea des de la posició 100000 fins la 100864. El transcrit és el 1-reverse.

La SEC de la query ens alinea amb un gap, que al mirar al document de l'exonerate veiem que correspon a un codó TGA, és a dir, el codó de la SEC. A més, veiem que té dos exons i un intró de 277 bp, i la SEC es troba al primer exó. Per a l'exonerate la raw score és de 887. En canvi, en el Genewise ens prediu dos exons i un intró però amb un Score de 378.15. A més, ens prediu la SEC exactament al mateix lloc que exonerate.

Per últim, cal comentar els SECIS, ja que és la clau de que la nostra proteïna sigui o no una veritable selenoproteïna. Al document generat pel seblastian obtenim dos elements SECIS. El primer d'ells té una free energy de -21.8. La posició a la que el trobem està entre 100938 – 101007, pel que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx1 té un element SECIS i una SEC, pel que és una selenoproteïna. Per últim, i per acabar de confirmar aquest fet, al mateix document del seblastian ens prediu una Gpx1 coneguda corresponent al Equus caballus.

GPx2

Per escollir el millor alineament dels 30 existents s'han fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00104, amb un score de 229 i un e-value de 7e-59 al blast. Les posicions van des de 9684822 fins 9681600.

Aquest alineament es troba a un frame negatiu, és a dir, en la cadena reverse. Amb l'identificador gi|408541699|gb|JH947233.1|, el valor del score al t-coffee és de 100, amb una length de 190. La query va des de 1 fins a 190. La query alinea des de la posició 53222 fins la 50000. El transcrit és el 1-reverse.

La SEC de la query ens alinea amb un gap, que al mirar al document de l'exonerate veiem que correspon a un codó TGA. A més, veiem que té dos exons i un intró de 2653 bp, i la SEC es troba al primer exó. Per a l'exonerate la raw score és de 941. En canvi, en el Genewise ens prediu dos exons i un intró però amb un Score de 408.11. A més, ens prediu la SEC exactament al mateix lloc que l'exonerate.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim dos elements SECIS. El primer d'ells té una free energy de -19.7. La posició a la que el trobem està entre 49713-49777, per el que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx2 té un element SECIS i una SEC, per el que és una selenoproteïna. Per últim, i per acabar de confirmar aquest fet, al mateix document del seblastian es prediu una Gpx2 coneguda corresponent al Canis lupus familiaris.

GPx3

Per escollir el millor alineament dels 29 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00130, amb un score de 145 i un e-value de 2e-33 al blast. Les posicions van des de 2252271 fins 2249245.

Aquest alineament es troba a la cadena reverse (frame negatiu). Amb l'identificador gi|408541673|gb|JH947259.1|, el valor del score al t-coffee és de 99, amb una length de 226. La query va des de 1 fins a 224. La query alinea des de la posició 108093 fins la 100000. El transcrit és el 1-reverse.

La SEC de la query ens alinea amb un gap, que al mirar al document de l'exonerate veiem que correspon a un codó TGA. A més, veiem que té cinc exons i quatre introns de: 4998 bp, 1713 bp, 402 bp i de 303 bp; i la SEC es troba al segon exó. Per a l'exonerate la raw score és de 1036. En canvi, en el Genewise ens prediu cinc exons i quatre introns però amb un Score de 423.79. A més, ens prediu la SEC exactament al mateix lloc que l'exonerate.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim cinc elements SECIS. El cinquè d'ells té una free energy de -22.8. La posició a la que el trobem està entre 99432 - 99362, per el que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx3 té un element SECIS i una SEC, per el que és una selenoproteïna.

GPx4

Per escollir el millor alineament dels 22 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00151, amb un score de 329 i un e-value de 6e-89 al blast. Les posicions van des de 7350962 fins 7351474.

Aquest alineament es troba a la cadena forward. Amb l'identificador gi|408541652|gb|JH947280.1|, el valor del score al t-coffee es de 100, amb una length de 197. La query va des de 5 fins a 197. La query alinea des de la posició 49934 fins la 50512. El transcrit és el 1-reverse.

La SEC de la query ens alinea amb un gap, que al mirar al document de l'exonerate veiem que correspon a un codó TGA. A més, veiem que té un únic exó. Per a l'exonerate la raw score és de 934. En canvi, en el Genewise també en prediu un únic exó però amb un Score de 418.23.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim sis elements SECIS. El cinquè d'ells té una free energy de -5.02. La posició a la que el trobem està entre 62839 - 62921, per el que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx4 té un element SECIS i una SEC, per el que és una selenoproteïna.

GPx5

Per escollir el millor alineament dels 29 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00130, amb un score de 97 i un e-value de 9e-19 al blast. Les posicions van des de 2252250 fins 2249278.

Aquest alineament es troba a la cadena reverse. Amb l'identificador gi|408541673|gb|JH947259.1|, el valor del score al t-coffee és de 99, amb una length de 237. La query va des de 44 fins a 231. La query alinea des de la posició 102981 fins la 100000. El transcrit és el 1-reverse.

Al document del t_coffee veiem que no hi ha cap SEC a la query, però al mirar a la query veiem una cisteïna que alinea amb un gap que al mirar al document de l'exonerate veiem que correspon a un codó TGA. A més, veiem que té quatre exons i tres introns de: 713 bp, 402 bp i de 303 bp. Per a l'exonerate la raw score és de 716. En canvi, en el Genewise també en prediu quatre exons i tres introns, però amb un Score de 283.35.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim cinc elements SECIS. El quint d'ells té una free energy de -22,8. La posició a la que el trobem està entre 99399-99329, per el que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx5 és una selenoproteïna.

GPx6

Per escollir el millor alineament dels 29 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00130, amb un score de 116 i un e-value de 1e-24 al blast. Les posicions van des de 7351001 fins 7351474.

Aquest alineament es troba a la cadena reverse. Amb l'identificador gi|408541673|gb|JH947259.1|, el valor del score al t-coffee és de 99, amb una length de 221. La query va des de 29 fins a 217. La query alinea des de la posició 102984 fins la 100000. El transcrit és el 1-reverse.

Al document del t_coffee veiem que no hi ha cap SEC a la query, però al mirar a la query veiem una cisteïna que alinea amb un gap que al mirar al document de l'exonerate veiem que correspon a un codó TGA. A més, veiem que té quatre exons i tres introns de: 1713 bp, 402 bp i de 303 bp. Per a l'exonerate la raw score es de 754. En canvi, en el Genewise també en prediu quatre exons i tres introns però amb un Score de 301.09.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim cinc elements SECIS. El quart d'ells té una free energy de -22.8. La posició a la que el trobem està entre 99405 - 99335, per el que al estar prop del fi de la nostra proteïna predita podem afirmar que la Gpx6 és una selenoproteïna.

GPx7

Per escollir el millor alineament dels 23 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00005, amb un score de 172 i un e-value de 8e-42 al blast. Les posicions van des de 8283806 fins 8306666.

Aquest alineament es troba a la cadena forward. Amb l'identificador gi|408541798|gb|JH947134.1|, el valor del score al t-coffee és de 99, amb una length de 186. La query va des de 1 fins a 186. La query alinea des de la posició 99946 fins la 122860. El transcrit és el 1-reverse i té un raw score de 844. Al document de l'exonerate veiem que hi ha tres exons i dos introns de 12720 bp i de 9637 bp. En canvi, en el Genewise el mateix nombre d'exons i d'introns, però amb un score de 370.46. Si busquem tant al t_coffee, com a l'exonerate com al Genewise no trobem cap SEC, o cap cisteïna que alinee amb un gap. El que si trobem és la cisteïna anotada a la base de dades de selenoDB 1.0, on hi ha anotada quina és l'homòloga.

Per últim, cal comentar els SECIS. Al document generat pel seblastian obtenim dos elements SECIS, ambos a una gran distància des de el final de la nostra proteïna, per el que segurament aquests elements SECIS no corresponen a aquesta predicció. Això, unit al fet de que no trobem SEC ens reforça la idea de que Gpx7 no és una selenoproteïna, sinó que és un homòleg en cisteïna.

GPx8

Per escollir el millor alineament dels 14 existents s’ha fet servir els criteris descrits a materials i mètodes. Per a aquesta selenoproteïna hem trobat el millor alineament possible respectant els resultats del t_coffee, al scaffold00005, amb un score de 101 i un e-value de 3e-20 al blast. Les posicions van des de 8283710 fins 8306666.

Aquest alineament es troba a la cadena forward. Amb l'identificador gi|408541798|gb|JH947134.1|, el valor del score al t-coffee es de 95, amb una length de 210. La query va des de 23 fins a 209. La query alinea des de la posició 87139 fins la 110056. El transcrit és el 1-reverse i el raw-score és de 520. Al document de l'exonerate veiem que hi ha tres exons i dos introns de 12720 bp i de 9637 bp. En canvi, en el Genewise el mateix nombre d'exons i d'introns, però amb un score de 208.87. Si busquem tant al t_coffee, com a l'exonerate com al Genewise no trobem cap SEC, o cap cisteïna que alinee amb un gap. El que si trobem és la cisteïna de la query alineada amb una Alanina, el que indica que Gpx8 no és un homòleg en cisteïna, ni una selenoproteïna.


Tal i com es pot observar GPx3, GPx4 i GPx5 en realitat són la mateixa proteïna ja que alineen a la mateixa regioó del genoma d'Elephantulus edwardii.



Família DI

DI1

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el segon alineament (gi|408541798|gb|JH947134.1|) amb un score de 149 i un e-value de 2e-34 ubicat al scaffold 00005 entre les posicions 10316956 i 10348711 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 5 exons i 4 introns. La nostra seqüència es troba entre les posicions 50122 → 81755 del scaffold.

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 275 aa. i un d’ells que queda desalineat és la selenocisteina.

Pel què fa al secissearch s'ha trobat dos secis. El més bo és de grau A i es troba entre les posicions 82708 – 82777. és a dir a 953 bases de distància. és una distància raonable i la free energy del secis és de -5,22.

Així doncs la DI1 és una selenoproteïna present en el genoma de l’Elephantulus edwardii.


DI2

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541766|gb|JH947166.1|) amb un score de 343 i un e-value de 9e-93 ubicat al scaffold 00037 entre les posicions 3171175 i 3182339 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 2 exons i, per tant, 1 intró. A més en el segon exó hi ha hagut 9 insercions. La nostra seqüència es troba entre les posicions 49999 → 61164 del scaffold.

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 269 aa. i un d’ells que queda desalineat és la selenocisteina.

Pel què fa al secissearch s'ha trobat dos secis. El més bo és de grau A i es troba entre les posicions 65779 – 65853. és a dir a 4615 bases de distància. és una distància raonable i la free energy del secis és de -19,37.

Així doncs la DI2 és una selenoproteïna present en el genoma de l’Elephantulus edwardii.


DI3

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|40541801|gb|JH947131.1|) amb un score de 496 i un e-value de e-139 ubicat al scaffold 00002 entre les posicions 3536774 i 35367653 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un únic exó i cap intró. La nostra seqüència es troba entre les posicions 49963 → 50788 del scaffold.

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 100 i podem veure que ens alinea 275 aa. i un d’ells que queda desalineat és la selenocisteina.

Pel què fa al secissearch s'ha trobat un secis entre les posicions 51391 – 51467. és a dir a 603 bases de distància. és una distància raonablement bona i la free energy del secis és de -8,27.

Així doncs la DI3 és una selenoproteïna present en el genoma de l’Elephantulus edwardii.



Sel15

La selenoproteïna Sel15 obtinguda està codificada en el mateix sentit que l'anotació (forward).

En el blast hem obtingut un únic alineament amb un Score = 88 i un E-value = 2 e-16, situat al scaffold 408541579|gb|JH947353.1 (224), a les posicions del genoma 4504422-4505837.

La predicció de l'exonerate ha mostrat que la proteïna predita està codificada per un gen amb 3 introns i 4 exons, extenent-se des de la posició 50000 a la 100502 del scaffold corresponent. El programa t-coffee ha permès observar que la proteïna predita alinia a partir de l'aminoàcid 27 de la nostra query i no comença per Met. Seguidament s'ha analitzat i confirmat l'alineació de la Selenocisteïna de la query amb una selenocisteïna a la proteïna predita de Elephantulus edwardii amb un score de 100.

Per altra banda, GeneWise ha predit 4 introns i 5 exons, que van de la posició 46689 a la posició 100502, alineant la proteïna predita a partir del tercer aminoàcid de la query.

Reforçant el resultat obtingut, mitjançant SeciSearch s'ha trobat un element SECI a 583 pb, el qual va des de les posicions 151085 a 151166 i té una energia lliure de -16,46, la qual confereix una estabilitat química força elevada i dóna suport a que possiblement s'ha trobat l'element SECI corresponent a Sel15.


SelH

La selenoproteïna SelH obtinguda està codificada en el mateix sentit que l'anotació (forward).

En el blast hem obtingut dos alineaments, dels quals, seguint el criteri explicat a Materials i Mètodes, hem seleccionat el hit amb Score = 65 i E-value = 2 e-18, situat al scaffold 408541519|gb| JH9471413,1 (284) entre les posicions 1257830-1257932.

La predicció de l'exonerate ha mostrat que la proteïna predita està codificada per un gen amb 1 intró i 2 exons, extenent-se des de les posicions 50000 a la 50345. El programa t-coffee ha permès observar que la proteïna predita (1-forward) alinia a partir de l'aminoàcid 32 de la nostra query i no comença amb Met. Seguidament, s'ha observat i confirmat l'alineació de la Selenocisteïna de la query amb una selenocisteïna a la proteïna predita en Elephantulus edwardii amb un score de 98.

En relació al GeneWise, ha predit el mateix número d'exons i introns, amb la diferència que inicia la predicció a la posició 50021.

Pel que fa als elements SECIs, se n'ha trobat un situat entre les posicions 51104 i 51169, a 758 pb de la proteïna predita amb una energia lliure de -14.32. Això reforça que la proteïna predita correspon a la proteïna SelH en el genoma de Elephantulus edwardii .


SelI

La selenoproteïna SelI obtinguda està codificada en sentit contrari a l'anotació (reverse).

En el blast s'han btingut diversos hits, però s'ha seleccionat el primer alineament, el qual presentava un Score = 147 i un E-value = 1e-33. La proteïna predita es situa al scaffold 408541794|gb|JH947138.1 (9) entre les posicions 7507239 i 7463556.

La predicció del exonerate ha mostrat que la proteïna està codificada per 9 introns i 10 exons que ocupen les posicions 50000 fins 95470. En quant al t-coffee, s'ha alineat la proteïna query amb la proteïna predita amb la pauta de lectura 1-forward (document del translate). L'alineament resultant presenta un score de 99 i alinea la selenocisteïna de la proteïna query amb una selenocisteïna en el genoma de Elephantulus edwardii .

Per a tenir més certesa i corroborar que les prediccions són bones, s'ha realitzat una cerca d'elements SECIs que ha detectat un element Seci entre les posicions 48714 – 48623 amb una energia lliure de -21,89. El fet de predir un element Seci pròxim a la proteïna predita reforça que possiblement s'ha localitzat la regió del genoma d'Elephantulus edwardii on es codifica la proteïna SelI.


SelK

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541662|gb|JH947270.1|) amb un score de 90 i un e-value de 3e-17 ubicat al scaffold 00141 entre les posicions 6787705 i 6787848 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un únic exó i cap intró. La nostra seqüència es troba entre les posicions 49999 → 50278 del scaffold.

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 94 aa. i un d’ells que queda desalineat és la selenocisteina.

Pel què fa al secissearch s'ha trobat un secis entre les posicions 50401- 50488. és a dir a 123 bases de distància. és una distància raonablement bona i la free energy del secis és de -6,43.

Així doncs la SelK és una selenoproteïna present en el genoma de l’Elephantulus edwardii.


SelM

La selenoproteïna SelM obtinguda està codificada en sentit contrari a l'anotació (reverse).

Mitjançant la realització del blast, segons els criteris descrits a Materials i Mètodes, s'ha seleccionat l'alineament amb un Score = 103 i un E-value = 2 e-21. La proteïna predita es situa al scaffold 408541652|gb|JH947280.1 (151), aproximadament entre les posicions 2048673-2051084.

La predicció de l'exonerate ha mostrat que SelM està codificada per 4 introns i 5 exons, els quals s'extenen des de la posició 50000 fins la posició 52889. La mateixa predicció ha estat obtinguda mitjançant GeneWise. Pel que fa al t-coffee, s'ha alineat la pauta de lectura 1-forward de la proteïna predita amb la selenoproteïna query de Mus musculus, obtenint un score de 97 i alineant les dues selenoproteïnes.

Per a donar suport a la nostra predicció, s'han cercat els elements SECIs de la proteïna predita, i s'ha trobat un element SECI que ocupa les posicions 49945 – 49873, amb una energia lliure de -30,67.


SelN

La selenoproteïna SelN obtinguda està codificada en el sentit contrari que l'anotació (reverse).

En el blast hem obtingut dos hits un d'ells amb un E-value de 4,4. Per tant, seguint els criteris de materials i mètodes hem escollit l'alineament amb Score = 100 i E-value= 2 e-25, situat aproximadament entre les posicions 4091350 I 4102407 del genoma de Elephantulus edwardii al scaffold 408541775|gb|JH947157.1 (28)

La predicció d'exonerate ens ha mostrat que la proteïna predita està codificada per un gen amb 10 introns i 11 exons i va des de la posició 49958 a la 67308. Pel que fa a Genewise, ens ha fet la mateixa predicció. En el t-coffee s'ha alineat la proteïna predita (pauta de lectura 1-forward del translate) amb la proteïna query, obtenint un score de 99 i observant un alineament entre les selenocisteines de les proteïnes alineades.

Per dir amb major certesa que possiblement s'ha trobat la selenoproteïna SelN al genoma de Elephantulus edwardii, s'ha realitzat la predicció d'elements SECIs. Un dels elements SECIs predits s'exten entre les posicions 49685 i 49606 i té una energia lliure de -14.75. La situació de l'element SECI respecte la proteïna predita (a unes 273 pb) així com una energia lliure bastant estable dóna suport a la presència d'aquesta selenoproteïna en el genoma d'Elephantulus edwardii.


SelO

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541739|gb|JH947193.1|) amb un score de 129 i un e-value de 5e-60 ubicat al scaffold 00064 entre les posicions 897649 i 891779 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 11 exons i 10 introns.

En el t-coffee que es realitzat en la pauta de lectura reverse 3 (en el programa surt amb el nom de forward 3), obtenim un alineament amb un score de 93 i podem veure que ens alinea 710 aa. Presenta 1 selenocisteïna.

No s'ha trobat element secis.

Així doncs la SelO és una selenoproteïna present en el genoma de l’Elephantulus edwardii.


SelP

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541724|gb|JH947208.1|) amb un score de 130 i un e-value de 1e-28 ubicat al scaffold 00079 entre les posicions 9932125 i 9923781 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 4 exons i 3 introns. Es pot observar que a més de les 10 selenocisteïnes ja presents en la query, en el nostre genoma n’hi ha quatre més ocupant les posicions de les cisteïnes en les posicions 344(aa), 346 (aa), 300(aa) i 302(aa) de la query. La nostra seqüència es situa entre les posicions 58344 -> 49894 del scaffold.

En el t-coffee realitzat en la pauta de lectura reverse 1 (en el programa surt com a forward 1), obtenim un alineament amb un score de 93 i podem veure que ens alinea 385 aa. Presenta 14 selenocisteïnes.

S'han trobat dos secis. El primer es pot considerar el millor de tots en termes de distancia i free energy (-15,7). Es troba entre les posicions 49265 – 49201.

Així doncs la SelP és una selenoproteïna amb 14 selenocisteïnes presents en el genoma de l’Elephantulus edwardii (4 més que en Mus musculus).


SelR1 (Mus musculus)

Al Blast s’han obtingut molts alineaments possibles, però seguint el procediment explicat a materials i mètodes, ha estat el primer hit el seleccionat, amb un score de 223 i un e-value de 2e-57.La SelR1 està situada a l’scaffold 140 (gi|408541663|gb|JH947269.1) i està codificada al en el mateix sentit que l’anotació, és a dir a la cadena forward.

La predicció de l’Exonerate demostra que la proteïna predita està codificada per un gen que només té un exó i cap intró, ocupant les posicions 49999 fins 50344. Aquest fet queda confimat pel GeneWise, que en prediu la mateixa quantitat amb un score de 243.71 bits.

El programa TCoffee ha permès observar que la proteïna predita alinea des de l’inici amb la query, de manera que comença per metionina. A més a més, es confirma l’alineació de la selenocisteïna de Mus Musculus amb la predita a Elephantulus Edwardii, tenint un score de 99.

Per tenir més certesa i corroborar que les prediccions són bones, s’ha realitzat una cerca d’elements SECIs que ha detectat un element SECI de grau A entre les posicions 50646 i 50717,a 302 pb de la proteïna predita, tenint una energia lliure de -18,63.

El fet de predir un element Seci pròxim a la proteïna predita reforça que possiblement s'ha localitzat la regió del genoma d'Elephantulus edwardii on es codifica la proteïna SelR1.

Com les selenoproteïnes R2 i R3 de mus musculus no començaven per metionina a la selenodatabase 2.0, es va decidir fer les de homo sapiens.


SelR2 (Human)

Al Blast s’han obtingut molts alineaments possibles, però seguint el procediment explicat a materials i mètodes, ha estat el tercer hit el seleccionat, amb un score de 102 i un e-value de 1e-20. La SelR2 està situada al scaffold 54 (gi|408541749|gb|JH947183.1) i està codificada en el mateix sentit que l'anotació, és a dir, la cadena forward.

La predicció de l'Exonerate mostra que la proteïna predita està codificada per un gen amb tres exons i dos introns, ocupant les posicions 417.878 fins la 428.720, fet que discerneix de la predicció del GeneWise, que prediu tres introns amb un score de 283.69 bits, predint les posicions 99997 fins la 1428720.

El programa Tcoffee permet observar que la proteïna predita, no alinea a partir del primer animoàcid de la nostra query i a més a més és un mal alineament, però té un score de 90. També cal dir que a la SelenoDB 1,0 no és troba la proteïna i a la SelenoDB 2,0 no hi ha presència de selenocisteïna i està classificada com a una homòloga. No es pot concloure que s'hagi anotat al genoma d'Elephantulus edwardii aquesta proteïna.

Per tal de corroborar que no es tracta d'una selenoproteïna, s'ha dut a terme la predicció d'elements Seci. Aquest, ha confirmat que no es tracta d'una selenoproteïna.


SelR3 (Human)

Seguint el procediment explicat a materials i mètodes, l'alineament escollit al Blast ha estat el quart. L'score i l'e-value de la proteïna corresponen a 100 i 5e-20 respectivament, estant situada al scaffold 47 (gi|408541756|gb|JH947176.1) i codificada per la cadena forward, és a dir, en el mateix sentit que l’anotació.

A l’Exonerate, es prediu la proteïna en un gen amb 6 exons i 5 introns, estenent-se de les poscions 99999 fins la 319670. Aquest fet es confirma amb el GeneWise, que en prediu la mateixa quantitat amb un score de 359.68 bits, diferenciant-se les posicions en una: l’inici a 100000 fins a 319670.

El TCoffee permet observar que la proteïna predita alinea a partir del primer animoàcid de la nostra query amb un score de 99. A més a més, la nostra query era un homòlog en treonina i al realitzar el TCoffee s'ha vist que no alinea amb el genoma estudiat, per tant, no s'ha anotat cap selenocisteïna ni és cap homòleg .

Pel que fa als elements SECIs, tot i que no s’ha predit cap selenoproteïna, s’ha trobat un element Seci de grau B amb una energia lliure de -11,64 de la posició 269.041 fins la 269.116 de la cadena reversa. Això reforça que la proteïna predita al genoma d’ Elephantulus edwardii no conté selenocisteïna.


SelS (Mus musculus)

En referència al mètode d’elecció descrit a materials i mètodes, va ser el primer alineament l’escollit dels obtinguts al Blast en aquest cas. L’score és de 64 i l’e-value de 4e-09 i la proteïna es troba a l’scaffold 319 (gi|408541484|gb|JH947448.1) i a la cadena directa (forward). L’Exonerate prediu 6 exons i 5 introns de la posició 49999 a la 68106, de la mateixa manera que el GeneWise, donant-los un score de 253.33 bits i situant-la de la posició 50000 a la 68106.

La millor alineació del TCoffee, no ha obtingut la alineació de la selenocisteïna ja que el seu codó ha estat interpretat com a un stop i no contiua amb l’alineació. A més, com la predicció al TCoffe en la proteïna de Mus Musculus no comença amb Metionina, s’ha decidit fer-ne la comparació amb Homo Sapiens.

L’element Seci predit és de grau A tot i que la seva energia interna és de -5.42. La posició d'aquest respecte els exons és de 338 posicions (exons: 49.999 – 68.106, SECI: 68.444 – 68.524 4).


SelS (Human)

En aquest cas, només hi ha un únic alineament amb un e-value suficientment bo per a ser considerat. Aquest és de 7e-09 i l’score obtingut de 63.5. La proteïna està situada al scaffold 319 (gi|408541484|gb|JH947448.1|) i està codificada per la cadena directa, és a dir, en el mateix sentit que l'anotació.

La predicció amb l’Exonerate mostra una proteïna codificada per 6 exons i 5 introns de les posicions 84952 a la 103065 i en l'alineació es veu que que ho fa partir del segon aminoàcid de la nostra query i, per tant, no comença per Met. Al GeneWise dóna la mateixa quantitat d'introns, donant-los un score de 262.92 bits.

Com en el cas anterior, el millor score al TCoffee no interpreta el codó de la selenocisteïna com a tal sinó com a un codó stop. No obstant, l’Exonerate confirma que es tracta d’una selenoproteïna ja que sí alinea la selenocisteïna a la proteïna predita de Elephantulus edwardii.

Per dir amb major certesa que possiblement s'ha trobat la selenoproteïna SelS al genoma de Elephantulus edwardii, s'ha realitzat la predicció d'elements SECIs. L’element SECI predit és de grau A tot i que l’energia interna és de -5.42. La posició d’aquest respecte els exons és de 332 posicions (exons: 84.953-103.065 SECI:103.397-103.477).


SelT

La proteïna SelT obtinguda està codificada en el mateix sentit que l'anotació (forward).

La proteïna predita correspon al quart hit del blast, corresponent a un alineament al scaffold 408541634|gb|JH947298,1 (169) a les posicions 7375892-7394158 amb un score=94 i un scaffold=169.

Mitjan&ccdil;ant la predicció del exonerate, s'ha observat que la proteïna SelT està codificada per 4 introns i 5 exons, ocupant les posicions 49937-73066. Pel que fa al Genewise, s'han obtingut els mateixos resultats que amb l'exonerate. El t-coffee resultant d'alinear la pauta de lectura 1-forward de la proteïna predita amb la proteïna query ha donat un score de 100, alineant a la perfecció les dues proteïnes des de l'aminoàcid inicial de la query (Met) i mostrant l'alineament de les dues selenocisteïnes.

Per últim, s'ha proseguit amb la cerca d'elements SECIs, i s'ha identificat un element SECI de grau A predit pel programa Seblastian, situat a les posicions 73530 – 73604. A 464 bases de distància de l'últim exó.


SelU1,2,3

SEL U1

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el segon alineament (gi|408541263|gb|JH947669.1|) amb un score de 114 i un e-value de 5e-24 ubicat al scaffold 00540 entre les posicions 241450 i 280458 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut 5 exons i 4 introns. La nostra seqüència es troba entre les posicions 49999 → 89008 del scaffold.

En el t-coffee que s’ha realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 227 aa. Així i tot no trobem cap selenocisteina en la seqüència.

No s'ha trobat cap element secis.

Tot i així hem buscat i comparat la seqüència de la query amb la de la proteïna de zebrafish i hem pogut comprovar que es tracta d'una proteïna homòloga en cisteïna.

Així doncs la SelU1 és una proteïna present en el genoma de l’Elephantulus edwardii homòloga en cisteïna respecte zebrafish.

SEL U2

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541344|gb|JH947588.1|) amb un score de 83 i un e-value de 3e-14 ubicat al scaffold 00459 entre les posicions 233201 i 211180 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 6 exons i 5 introns. La nostra seqüència es situa entre les posicions 72599 -> 49999 del scaffold

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 98 i podem veure que ens alinea 224 aa. No presenta cap selenocisteina.

No s'ha predit cap element secis.

Així doncs la SelU2 no és una selenoproteïna però és una proteïna que es troba present en el genoma de l’Elephantulus edwardii.

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541344|gb|JH947588.1|) amb un score de 83 i un e-value de 3e-14 ubicat al scaffold 00459 entre les posicions 233201 i 211180 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 6 exons i 5 introns. La nostra seqüència es situa entre les posicions 72599 -> 49999 del scaffold

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 98 i podem veure que ens alinea 224 aa. No presenta cap selenocisteina.

No s'ha predit cap element secis.

Així doncs la SelU2 no és una selenoproteïna però és una proteïna que es troba present en el genoma de l’Elephantulus edwardii.

SEL U3

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541758|gb|JH947174.1|) amb un score de 133 i un e-value de 8e-30 ubicat al scaffold 00045 entre les posicions 15101558 i 15098909 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 8 exons i 7 introns. La nostra seqüència es situa entre les posicions 52649 -> 49569 del scaffold.

En el t-coffee que es realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 100 i podem veure que ens alinea 262 aa. No presenta cap selenocisteïna.

No s'ha predit cap element secis.

Així doncs la SelU3 no és una selenoproteïna present en el genoma de l’Elephantulus edwardii. Tot i així sí que existeix la proteïna en el genoma.


Sel15

La selenoproteïna Sel15 obtinguda està codificada en el mateix sentit que l'anotació (forward).

En el blast hem obtingut un únic alineament amb un Score = 88 i un E-value = 2 e-16, situat al scaffold 408541579|gb|JH947353.1 (224).

La predicció de l'exonerate ha mostrat que la proteïna predita està codificada per un gen amb 3 introns i 4 exons, extenent-se des de la posició 50000 a la 100502 del scaffold corresponent. El programa t-coffee ha permès observar que la proteïna predita alinia a partir de l'aminoàcid 27 de la nostra query i no comen&ccdil;a per Met. Seguidament s'ha analitzat i confirmat l'alineació de la Selenocisteïna de la query amb una selenocisteïna a la proteïna predita de Elephantulus edwardii amb un score de 100.

Per altra banda, GeneWise ha predit 4 introns i 5 exons, que van de la posició 46689 a la posició 100502, alineant la proteïna predita a partir del tercer aminoàcid de la query.

Refor&ccdil;ant el resultat obtingut, mitjan&ccdil;ant SeciSearch s'ha trobat un element SECI a 583 pb, el qual va des de les posicions 151085 a 151166 i té una energia lliure de -16,46, la qual confereix una estabilitat química for&ccdil;a elevada i dóna suport a que possiblement s'ha trobat l'element SECI corresponent a Sel15.


SelW1 i W2

SelW1

No s'ha predit cap proteïna SelW1 en el genoma de Elephantulus edwardii . En el blast realitzat es mostra com el major hit té E-value = 0,006 i un Score = 42, No s'ha proseguit amb la predicció d'aquesta selenoproteïna doncs s'han desestimat els valors obtinguts.

SelW2

La proteïna W2 de Mus musculus utilitzada com a query és un homòleg en Cys. Per tant, la proteïna SelW2 predita en Elephatulus edwardii resulta també ser un homòleg en Cys i està codificada en sentit contrari a l'anotació (reverse).

El blast de la SelW2 de ratolí contra el genoma d'Elephantulus edwardii ha resultat en la selecció del hit que alinia al scaffold 408541726|gb|JH947206.1. (077).

En relació a l'exonerate, s'ha predit que SelW2 en Elephantulus edwardii està codificada per 3 introns i 4 exons, extenent-se per les posicions 50000 – 51085. La predicció amb GeneWise ha estat la mateixa. Seguidament, el t-coffee ha alineat la proteïna predita amb la pauta de lectura forward-1 amb la query inicial, resultant en un score de 100 i l'alineament de les Cys homòlogues.

Per reforçar els resultats de la predicció, s'han predit els elements SECIs. Donant suport a la predicció, no s'ha trobat cap element SECI, doncs s'està treballant amb homòlegs de Cys.


MsRA

L’alineament escollir en aquest cas ha estat el primer, ja que el seu score i e-value són de 103 i 1e-20 respectivament. La proteïna està a l’scaffold 38 (gi|408541765|gb|JH947167.1|), formant part de la cadena directa.

A l’Exonerate, tot i que la proteïna comença per metionina, l’alineació predita s’inicia a l’aminoàcid 46 i prediu 5 exons i 4 introns, a les posicions 31.643 fins la 669.353 Aquestes dades no són les mateixes que les obtingudes amb el geneWise, que prediu 5 introns. Això es dóna pel fet que les posicions que ha predit aquest són diferents a les de l'Exonerate, sent aquestes 49.952 fins la 669.353.

L’alineació obtinguda pel TCoffee és la corresponent al quart transcrit obtingut a partir de la quarta pauta de lectura, sent aquest pràcticament perfecte i tenint un score és de 100. Al ser maquinària no s’ha obtingut cap selenociteïna i, per tant, no ha estat necessària la cerca d’elements SECI.


TR

TR1

Seguint el procediment explicat a materials i mètodes, l'alineament escollit ha estat el segon dels obtinguts al Blast. L'score i l'e-value d'aquestes corresponen a 150 i 2e-34 respectivament. La proteïna es troba a l'scaffold 68 (gi|408541735|gb|JH947197.1) i la predicció de la proteïna es troba a la cadena directe, és a dir, en el mateix sentit a l'anotació.

Amb l'Exonerate s'han predit una proteïna codificada per 13 exons i 12 introns, extenent-se de les posicions 94554 fins la 144904. Aquestes dades no són les mateixes que les obtingudes amb el geneWise, que prediu 14 exons i 13 introns. Això es dóna pel fet que les posicions que ha predit aquest són diferents a les de l'Exonerate, sent aquestes 93.200 fins la 144.898.

Pel que fa a la predicció amb el Tcoffee, tot i que no comença alineant pel primer aminoàcid sinó pel 105, el score obtingut és de 100 al corresponent a la quarta pauta de lectura. A més a més, es confirma que és una selenoproteïna ja que a l'Exonerate alinea la selenocisteïna amb la de Mus Musculus.

Per dir amb major certesa que possiblement s'ha trobat la selenoproteïna Tr1 al genoma de Elephantulus edwardii, s’ha realitzat la predicció d'element SECI. L’element SECIs predit és de grau A, tenint una energia lliure de -6.41 i trobant-se 280 posicions upstream dels exons (exons: 94.554-144.904, SECI: 145.111-145.184).


TR2

Al Blast, l'alineament escollit en aquesta selenoproteïna ha estat el segon, amb un score i un e-value de 102 i 6e-20 respectivament. En aquest cas, la proteïna es troba a l'scaffold 89 i la predicció de la proteïna es troba a la cadena reversa i l'Exonerate en prediu 15 exons i 14 introns, igual que el GeneWise, amb un Score 737.39 bits.

Al Tcoffee, l'score més alt és de 99, sent el quart transcrit corresponent a la quarta pauta de lectura i la alineació amb la proteïna de Mus Musculus confirma que és una selenoproteïna, ja que també alinea amb una selenociteïna.

Per dir amb major certesa que probablement s'ha trobat la selenoproteïna Tr2 al genoma de Elephantulus edwardii, s’ha realitzat la predicció d'element SECI. L'element SECI predit és de grau A i la seva energia lliure és de -23.79. La posició d'aquest respecte els exons és d'unes 1.200 posicions (exons:142.560-50-156, SECI: 48.877 – 48.806).


TR3

L'alineament escollit en aquesta selenoproteïna, igual que en el cas anterior, ha estat el segon. El seu score era de 139 i l’e-value de i 9e-31 respectivament. En aquest cas, la proteïna es troba a l'scaffold 161 (gi|408541642|gb|JH947290.1) i la predicció de la proteïna es troba a la cadena reversa.

L'Exonerate en prediu 16 exons i 15 introns de la posició 126636 a la 49999, de la mateixa manera que el GeneWise, que prediu 15 introns de les posicions 126636 a la 50006 amb un score de 1018.45 bits. A més a més, l'alineació amb la proteïna de Mus Musculus confirma que és una selenoproteïna, ja que també alinea amb una selenociteïna.

Al Tcoffee, l'score més alt és de 99, sent el quart transcrit corresponent a la quarta pauta de lectura i observant un alineament entre les selenocisteines de les proteïnes alineades.

L'element SECI predit és de grau A i la seva energia lliure és de -15.97. La posició d'aquest respecte els exons és d'unes 1.200 posicions (exons:142.560-50-156, SECI: 49.813- 49.735).

Com es pot apreciar, la predicció obtinguda de les tioredoxin reductases confirma que són selenoproteïnes, les tres amb selenocisteïna.



Maquinària

SeCp43

Al blast s’han obtingut molts alineaments, però s’ha s’eleccionat el primer hit, el qual té un score de 456 i un e-value de e-127 i es troba a l’scaffold 166 (gi|408541637|gb|JH947295.1), estant codificada al mateix sentit de l’anotació, és a dir, a la cadena forward.

A l’exonerate, la predicció resultant de la proteïna mostra que aquesta està codificada per un sol exó i cap intró, extenent-se de les posicions 99999 a la 100848, fet confirmat pel GeneWise, que en prediu la mateixa quantitat amb un score de 647.43 bits, tot i que la posició que en prediu aquest es diferencia d’una posició: 100000 a la 100848.

El TCoffe permet observar que la proteïna predita alinea des del primer aminoàcid, sent aquest la metionina. A més a més, té un score de 99 i l’alineació és pràcticament perfecta.

Com es tracta de maquinària, no conté cap selenocitesïna i, per tant, no s’ha fet la predicció d’element SECIs.


SBP2

Al blast s’han obtingut quatre alineaments i, seguint els criteris explicats a materials i mètodes s’ha escollit el primer alineament, amb un score i un e-value de 143 i 6e-32 respectivament. La proteïna es troba a l’scaffold 429 (gi|408541374|gb|JH947558.1) i està codificada en sentit contrari a l’anotació (cadena reversa).

La predicció d'exonerate ens ha mostrat que la proteïna predita està codificada per un gen amb 4 exons i 3 introns i s’estén de la posició 62363 a la 51599.En aquest cas, la predicció amb el GeneWise també és diferent, ja que troba 4 introns donat que les posicions no són les mateixes s'nicia a la 54.663 fins la 50.000.

Al t-coffee s'ha alineat la proteïna predita (pauta de lectura 1-forward del translate) amb la proteïna query, obtenint un score de 99, tot i que els primers aminoàcids no els alinea.

En aquest cas, també es tracta de maquinària i no s’ha obtingut cap selenociteïna de manera que no ha estat necessària la cerca d’elements SECI.


Pstk

En aquesta proteïna, l’alineació escollida ha estat la primera seguint el procediment descrit a materials i mètodes. L’score i l’e-value del Blast han estat de 160 i 1e-37 respectivament. La proteïna es troba a l’scaffold 6 (gi|408541797|gb|JH947135.1) i a la cadena reversa.

A l’Exonerate, tot i que no comença la predicció amb metionina, prediu 5 exons i 4 introns, de la mateixa manera que el GeneWise, donant-los un score de 453.60 bits.

Al TCoffee, el millor score en la alineació és de 99 i correspon al quart transcrit, originat a partir de la quarta pauta de lectura. Val a dir que és un alineament molt bo i que al ser maquinària de síntesi de selenoproteïnes és esperable l’absència de selenociteïna. és per això que no s’ha buscat cap element SECI.


eEFSec1, 2

Hem usat les eEFSec1 i 2 d'humans degut a que a la base de dades SelenoDB2.0 la proteïna eEF de mus musculus no començava per metionina.

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el primer alineament (gi|408541642|gb|JH947290.1|) amb un score de 393 i un e-value de e-107 ubicat al scaffold 00161 entre les posicions 6461554 i 6761064 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 4 exons i 3 introns.

En el t-coffee realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 436 aa. No presenta selenocisteïnes.

Així doncs la eEFSec és una proteïna que forma part de la maquinària de transcripció de l’Elephantulus edwardii i no presenta selenocisteines.

Com es pot comprovar a la taula de resultats eEFSec1 i eEFSec2 alineen al mateix lloc i per tant es tracta de la mateixa proteïna.

Així doncs, eEFSec és una única proteïna present en Elephantulus edwardii.


SeCS

Seguint els criteris descrits a materials i mètodes, en el document blast hem identificat el segon alineament (gi|408541552|gb|JH947380.1|) amb un score de 133 i un e-value de 4e-29 ubicat al scaffold 00251 entre les posicions 361516 i 407522 com a l’alineament bo per a aquesta proteïna.

En l’exonerate hem obtingut un 11 exons i 10 introns. La nostra seqüència es troba entre les posicions 50000 → 96006 del scaffold.

En el t-coffee realitzat en la pauta de lectura forward 1, obtenim un alineament amb un score de 99 i podem veure que ens alinea 497 aa.

Pel què fa al secissearch s'ha trobat un secis. El m´s bo ´s de grau A i es troba entre les posicions 51193-51269. ´s a dir no ´s un secis bo ja que s'ha predit nemig de la seqüència.

Així doncs la SecS ´s una proteïna present en el genoma de l’Elephantulus edwardii que forma part de la seva maquinària. No ´s una selenocisteïna.


SPS1,2

SPS1

La proteïna de Mus musculus utilitzada com a query és un homòleg en Treonina. La proteïna SPS1 predita en Elephatulus edwardiiresulta també ser un homòleg en Treonina i està codificada en sentit contrari a l'anotació (reverse).

Primer de tot, en el blast s'han obtingut diferents hits, dels quals el tercer alineament és el que ha generat la proteïna predita. Aquest alineament presenta un Score = 150 i un E-value= 2e-34 i es troba al scaffold 408541664|gb|JH947268.1 (139).

S'han predit, mitjan&ccdil;ant exonerate, 7 introns i 8 exons situats entre les posicions 50000 i 74374 (relatives del scaffold). L'alineament de la proteïna predita (pauta de lectura 1-forward) amb la query de Mus musculus ha generat un tcoffee amb Score=100 i alineament de la Treonina homòloga amb una Treonina de Elephantulus edwardii. Per tant, s'ha predit la proteïna SPS1, la qual resulta ser un homòleg en T. No hem obtingut un resultat bo amb el GeneWise tal com es pot observar a la taula de resultats

Per tal de donar pes a la nostra predicció, s'ha comprovat que SPS1 no tingui cap element SECI mitjan&ccdil;ant la predicció d'aquestes estructures secundàries i així ha estat: la predicció d'elements SECIS per Seblastian no ha generat cap SECI que pugués ser atribuit a aquesta proteïna (per la posició així com l'energia lliure del mateix).

SPS2

La selenoproteïna SelT obtinguda està codificada en el mateix sentit que l'anotació (forward).

La proteïna predita s'ha obtingut a partir de la selecció del primer hit del blast, el qual presenta Score = 622 i E-value = e-176 i es troba al scaffold 1408541617|gb|JH947315.1. (0186).

Mitjan&ccdil;ant exonerate, s'ha predit un sol exó que ocupa les posicions d'entre 49961 i 51286 del scaffold mencionat del genoma d'Elephantulus edwardii. La predicció de Gene Wise ha estat exactament la mateixa.L'alineament de la proteina predita (pauta de lectura 1-forward) amb la query de Mus musculus alineava amb un score=99 les dues seqüències i més concretament, la selenocisteïna de la query amb una selenociseïna de la proteïna predita. La mateixa predicció ha estat obtinguda mitjançant GeneWise

Per a dir amb major precisió que s'ha predit SPS2 en Elephantulus edwardii s'ha realitzat la pertinent cerca d'elements SECIs i s'ha confirmat l'existència d'un element SECI a les posicions 51828 – 51901, amb una energia lliure de -20,15.




Blastp

A totes les proteïnes comentades en aquesta discussió hem procedit a fer un Blast contra el conjunt no redundant de les proteïnes caracteritzades de diverses espècies, que hi ha a la base de dades del NCBI. Aquest Blast el fem amb la nostra selenoproteïna predita contra altres proteïnes del NCBI, pel que és un Blastp.

No totes les proteïnes predites alineen perfectament amb selenoproteïnes del NCBI, algunes alineen amb menor score que altres. Altres, com la família de les Gpx prediuen selenoproteïnes de la mateixa família, però que no es corresponen a la Gpx que s'està contrastant.

Altres, en canvi, obtenen uns alineaments molt bons, on el valor del e-value és de 0.0, que correspon a un valor menor d'aproximament 1e-250, és a dir, és un alineament excel·lent.

D'altra banda, hi ha algunes proteïnes predites, com selW, que no és una selenoproteïna, sinó un homòleg, i que prediu per a una proteïna que és migration and invasion enhancer 1 (MIEN1) en diverses espècies. MIEN1és una petita proteïna transmembrana involucrada en la metàstasi.

La conclusió d'aquesta cerca és que a partir de les selenoproteïnes predites a Elephantulus edwardii podem trobar proteïnes ja caracteritzades pel que les nostres selenoproteïnes són vàlides i estan ben predites.


Torna a dalt .