Discussió
Discussió per a la família GPx
Fragilariopsis Cylindrus
Els resultats obtinguts en el tBLASTn de la proteïna GPx humana
contra el genoma de F.cylindrus, obtenim 7 hits estadísticament
significatius.
HIT REGIÓ INICI FINAL e-value hit0 scaffold_3 1604627 1604902 6e-09 hit1 scaffold_13 562484 562918 8e-08 hit2 scaffold_57 83595 84029 4e-07 hit3 scaffold_15 1321969 1321520 1e-05 hit4 scaffold_6 1657533 1657877 1e-05 hit5 scaffold_5 1088678 1089067 3e-05 hit6 scaffold_5 1313152 1312814 3e-05 hit7 scaffold_50 47097 47486 8e-05
El hit0 alinea la selenocisteïna de la query amb una cisteïna en el genoma del protista (exonerate i T-Coffee). No s'han trobat elements SECIS vàlids.
El hit1 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). En l'anàlisi mitjançant SECISsearch no s'han trobat elements SECIS.
El hit 2 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). A més, s'han trobat elements SECIS a una distància prou petita (menys de 5kb) com per ser utilitzada perquè el codó UGA sigui entès com una selenocisteïna.Tot i això, comparant els exonerate d'ambdos hits (1 i 2), ens hem adonat que s'assemblen molt i hem deduit que possiblement un podria ser una duplicació relativament recent de l'altre. Aleshores, entenem que la duplicació s'hauria produït sense la part del genoma on es troba l'element SECIS.
>scaffold_57:subseq(63595,50000):[22945,23037] AATGATGGCA TTAGTAT GTACATTATGTA ATGAA GCTATCATTA AA TATAAAGATGGA CAATATGTT CGAA TTGGT GAACCAA CGGAAGCTGC >scaffold_57:subseq(63595,50000):[23601,23701] CACGGGATGT TGGTATC TTTACCAAGGATG ATGAT TTAAAAGGTA AA T CAT TTACTG GTG CAG AATTTTTTCA TGGAT CCATTTC GGATGA AGAACGTGCT
El hit3 no es recupera al fer un alineament mitjançant exonerate, per aquest motiu l'hem analitzat mitjançant GeneWise. No obstant, en aquest annotació no s'inclou la selenocisteïna de la query perquè la seqüència recuparada resulta massa curta. Per tant, ja no l'utilitzem per a l'anàlisi següent. El mateix passa amb el hit6.
El hit4, en el blast surt alineat amb una part de la query que no inclou la selenocisteïna, però al fer exonerate s'alinea una selenocisteïna de la query amb una selenocisteïna en el genoma protista. No s'han trobat elements SECIS.
El hit5 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). No s'han torbat elements SECIS.
El hit7 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). En l'anàlisi mitjançant SECISsearch no s'han trobat elements SECIS.
Hem realitzat un alineament múltiple dels hits 0, 1, 2, 4, 5 i 7. Tots excepte el hit0 (Cis) alineen la selenocisteïna de la query amb una selenocisteïna i amb regions conservades al voltant. A tots els falta una part grossa de la regió 5', i als hits0, hit1 i hit2 també de la regió 3'. De manera que podem hipotetizar que el genoma de F.cylindrus conté una seqüència homòloga amb Cis de la GPx humana, una selenoproteïna GPx que està duplicada, i dues selenoproteïnes GPx més (però que tenen un e-value, que tot i ser significatiu, no és gaire baix).
Hem realitzat un blastp contra la base de dades no redundant del NCBI. El hit0, 1, 2, 4, 5 i 7 no estaven anotats, però tot i això surten molts hits contra la selenoproteïna GPx. És a dir, cap de les annotacions que obtenim és de F. cylindrus. No obstant, com que les nostres annotacions de F. cylindrus són curtes, podria ser que només es tractés d'un domini molt conservat. Podeu veure els resultats del blastp a continuació: hit0, hit1, hit2, hit4, hit5 i hit7.
En l'anàlisi de la maquinària, hem trobat les seqüències de tots els elements analitzats: eEF-Sec, Pstk, SBP2, Sec p43, SLA/LP, SPS2 i tRNA-Sec.