METODE:
 

Conversió dels arxius dels EST del EST2 genome en arxiu GFF per visulaitzar-los juntament amb les prediccions de gens i les proteïnes del Blast P

 fgrep Exon BG715977.txt | gawk '{ print $6, "BG715977", "EST", $4, $5, $2, "+", "." ,"BG715977"}' > BestEST2genome.gff

 fgrep Exon AA625207.txt | gawk '{ print $6, "AA625207", "EST", $4, $5, $2, "-", "." ,"AA625207"}' >> BestEST2genome.gff
 .....

Per a cada EST del EST2genome . Arxiu final : BestEST2genome.gff

Enrera


Per tal d'obtenir l'arxiu en gff per després poder còrrer el program gff2ps primer es va intentar el program Parseblast utilitzat anteriorment, però el format del Blast2sequence no el reconeix el Parseblast, es va utilitzar el program ObtainSimilarity per extreure les posicions,  a partir de les quals es va poder obtenir obtrenir els arxius en format gff.  Comandes:
 

Gen 2:
./ObtainSimilarityBlast.sh < Blast2seq.gen2 | gawk '{ print "AC090953", "ProteinaGen2","CDS", $4, $5, $6, "+", ".", "gi|18555932"}' > Blast2seq.gen2.gff
 

Gen 4:
./ObtainSimilarityBlast.sh < Blast2seq.gen4 | gawk '{ print "AC090953", "ProteinaGen4","CDS", $2, $3, $4, "-", ".", "gi|14603463:32-280"}' > Blast2seq.gen4.gff

Gen 5:
./ObtainSimilarityBlast.sh < Blast2seq.gen5cds | gawk '{ print "AC090953", "ProteinaGen5","CDS", $2, $3, $4, "+", ".", "gi|14249885"}' > Blast2seq.gen5.gff
 

Per tal de poder ser visualitzat es va executar el el gff2ps conjuntament amb les prediccions del Geneid i del Genscan.

./gff2ps_v0.97b AC090953.geneid.gff AC090953.genscan.gff  Blast2seq.gen4.gff Blast2seq.gen5.gff Blast2seq.gen2.gff > Proteina.ps
 

Visualització dels Resultats.

Enrera.