Discussió
Discussió per a la família GPx
Albugo laibachii
En el cas d'aquest protista, hem obtingut mitjançant tBLASTn 8 hits estadísticament significatius. El dos primers són els següents:
HIT REGIÓ INICI FINAL e-value hit0 gi|325182752|emb|FR824077.1| 135483 135082 5e-36 hit1 gi|325182752|emb|FR824077.1| 135028 134939 5e-36 hit2 gi|325184927|emb|FR824116.1| 5825 6253 2e-24 hit3 gi|325185083|emb|FR824119.1| 42371 42811 7e-19 hit4 gi|325186653|emb|FR824160.1| 10566 10096 5e-18 hit5 gi|325182478|emb|FR824073.1| 15212 15655 1e-11 hit6 gi|325187621|emb|FR824191.1| 15164 14586 6e-07 hit7 gi|325189739|emb|FR824273.1| 25566 26144 6e-07
Al veure aquests resultats podem dir que els dos primers hits (hit0 i
hit1) es troben a la mateixa regió genòmica. El primer alinea des de la
posició 39 a la 166 de la query, i el segon des de la posició 167 a la
196. En aquests resultats veiem que la selenocisteina de la nostra query
està alineada amb una cisteina, de manera que sospitem que hem trobat
un homòleg amb cisteïna de la selenoproteïna humana.
Seguidament, correm un exonerate i veiem com la Sec (Unk) s'alinea amb una Cis. De manera que ens reafirmem en la nostra sospita. A més, amb l'expansió duta a terme mitjançant exonerate ens adonem que els hits 0 i 1 formen part de la mateixa seqüència, ja que els resultats d'exonerate són idèntics. Hem arribat a la conclusió que les dues seqüències que obteníem al tBLASTn eren diferents exons de la mateixa proteïna i que, de fet, no ho hauriem de considerar com a dons hits diferents. El T-Coffee ens acaba de confirmar l'alineament i ens dóna un score elevat (97) amb una cobertura elevada de la query, de manera que podem hipotetitzar que el hit1 de A. laibachii té un gen que codifica per un homòleg de la selenoproteïna GPx amb cisteïna. No s'observem elements SECIS vàlids.
Pel que fa al hits 2 observem que la selenocisteïna de la query s'alinea amb cisteïna (exonerate i T-Coffee). A més, amb el SECISsearch trobem elements SECIS vàlids:
scaffold_57:subseq(63595,50000):[22945,23037] AATGATGGCA TTAGTAT GTACATTATGTA ATGAA GCTATCATTA AA TATAAAGATGGA CAATATGTT CGAA TTGGT GAACCAA CGGAAGCTGC scaffold_57:subseq(63595,50000):[23601,23701] CACGGGATGT TGGTATC TTTACCAAGGATG ATGAT TTAAAAGGTA AA T CAT TTACTG GTG CAG AATTTTTTCA TGGAT CCATTTC GGATGA AGAACGTGCT
El hit3, tot i que té un e-value significatiu al blast, no se n'obté annotació a l'exonerate i l'annotació al GeneWise és molt curta. De manera que no s'ha tingut en compte per a l'anàlisi.
El hit4 alinea la selenocisteïna de la query amb una serina al genoma del protista a exonerate i genewise, i amb un gap al T-Coffee. No s'han trobat elements SECIS.
El hit5 no dóna annotació amb exonerate i no s'ha tingut en compte a l'anàlisi.
Els hits 6 i 7, alineen la Sec de la query amb una Cis en el genoma del protista. Al exonerate veiem que són seqüències idèntiques, però com que es troben en regions genòmiques diferents, amb bastanta distància, considerem que són duplicacions recents. No s'han observat elements SECIS vàlids.
Hem realitzat un alineament múltiple entre els hits 0, 2, 3, 4, 6 i 7, per veure les diferències entre ells. El primer hit és el que té la cobertura més llarga, i és el hit0. Tots menys el hit4 són homòlegs de la selenocisteïna GPx humana amb cisteïna. El hit4 té una serina en aquest lloc. A tots els hits els falta una part de la regió 3' en relació a la query, possiblement perquè no s'ha recuperat el primer exó. A tots, excepte al hit1 els falta una part relativament gran a la regió 5' (també en relació a la query).
Hem realitzat un blastp contra la base de dades no redundant del NCBI. Els hits 0, 2, 6 i 7 ja estaven annotats. Com s'havia comentat en els resultats de exonerate, hem vist que les nostres annotacions dels hits 6 i 7 són idèntiques, però que estan ren regions cromosòmiques diferents. A continuació podreu trobar els links al blastp: hit0, hit2, hit3, hit4, hit6, hit7
En l'anàlisi de la maquinària hem trobat seqüències corresponents a eEF-Sec, Sec p43 i tRNA-Sec.