Discussió


Discussió per a la família GPx


Fragilariopsis Cylindrus


Els resultats obtinguts en el tBLASTn de la proteïna GPx humana contra el genoma de F.cylindrus, obtenim 7 hits estadísticament significatius.

HIT		REGIÓ		INICI		FINAL		e-value	
	
hit0		scaffold_3	1604627		1604902		6e-09			
hit1		scaffold_13	562484		562918		8e-08				
hit2		scaffold_57	83595		84029		4e-07			
hit3		scaffold_15	1321969		1321520		1e-05		
hit4		scaffold_6	1657533		1657877		1e-05			
hit5		scaffold_5	1088678		1089067		3e-05		
hit6 		scaffold_5	1313152		1312814		3e-05			
hit7		scaffold_50	47097		47486		8e-05			

El hit0 alinea la selenocisteïna de la query amb una cisteïna en el genoma del protista (exonerate i T-Coffee). No s'han trobat elements SECIS vàlids.


El hit1 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). En l'anàlisi mitjançant SECISsearch no s'han trobat elements SECIS.


El hit 2 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). A més, s'han trobat elements SECIS a una distància prou petita (menys de 5kb) com per ser utilitzada perquè el codó UGA sigui entès com una selenocisteïna.Tot i això, comparant els exonerate d'ambdos hits (1 i 2), ens hem adonat que s'assemblen molt i hem deduit que possiblement un podria ser una duplicació relativament recent de l'altre. Aleshores, entenem que la duplicació s'hauria produït sense la part del genoma on es troba l'element SECIS.


>scaffold_57:subseq(63595,50000):[22945,23037] 
AATGATGGCA TTAGTAT GTACATTATGTA ATGAA GCTATCATTA AA TATAAAGATGGA CAATATGTT CGAA TTGGT
GAACCAA CGGAAGCTGC 
>scaffold_57:subseq(63595,50000):[23601,23701] 
CACGGGATGT TGGTATC TTTACCAAGGATG ATGAT TTAAAAGGTA AA T CAT TTACTG GTG CAG AATTTTTTCA
TGGAT CCATTTC GGATGA AGAACGTGCT 

El hit3 no es recupera al fer un alineament mitjançant exonerate, per aquest motiu l'hem analitzat mitjançant GeneWise. No obstant, en aquest annotació no s'inclou la selenocisteïna de la query perquè la seqüència recuparada resulta massa curta. Per tant, ja no l'utilitzem per a l'anàlisi següent. El mateix passa amb el hit6.


El hit4, en el blast surt alineat amb una part de la query que no inclou la selenocisteïna, però al fer exonerate s'alinea una selenocisteïna de la query amb una selenocisteïna en el genoma protista. No s'han trobat elements SECIS.


El hit5 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). No s'han torbat elements SECIS.


El hit7 alinea la selenocisteïna de la query amb una selenocisteïna en el genoma del protista (exonerate i T-Coffee). En l'anàlisi mitjançant SECISsearch no s'han trobat elements SECIS.


Hem realitzat un alineament múltiple dels hits 0, 1, 2, 4, 5 i 7. Tots excepte el hit0 (Cis) alineen la selenocisteïna de la query amb una selenocisteïna i amb regions conservades al voltant. A tots els falta una part grossa de la regió 5', i als hits0, hit1 i hit2 també de la regió 3'. De manera que podem hipotetizar que el genoma de F.cylindrus conté una seqüència homòloga amb Cis de la GPx humana, una selenoproteïna GPx que està duplicada, i dues selenoproteïnes GPx més (però que tenen un e-value, que tot i ser significatiu, no és gaire baix).


Hem realitzat un blastp contra la base de dades no redundant del NCBI. El hit0, 1, 2, 4, 5 i 7 no estaven anotats, però tot i això surten molts hits contra la selenoproteïna GPx. És a dir, cap de les annotacions que obtenim és de F. cylindrus. No obstant, com que les nostres annotacions de F. cylindrus són curtes, podria ser que només es tractés d'un domini molt conservat. Podeu veure els resultats del blastp a continuació: hit0, hit1, hit2, hit4, hit5 i hit7.


En l'anàlisi de la maquinària, hem trobat les seqüències de tots els elements analitzats: eEF-Sec, Pstk, SBP2, Sec p43, SLA/LP, SPS2 i tRNA-Sec.