METODE:Conversió dels arxius dels EST del EST2 genome en arxiu GFF per visulaitzar-los juntament amb les prediccions de gens i les proteïnes del Blast P
fgrep Exon BG715977.txt | gawk '{ print $6, "BG715977", "EST", $4, $5, $2, "+", "." ,"BG715977"}' > BestEST2genome.gff
fgrep Exon AA625207.txt | gawk '{ print $6, "AA625207", "EST", $4, $5, $2, "-", "." ,"AA625207"}' >> BestEST2genome.gff
.....Per a cada EST del EST2genome . Arxiu final : BestEST2genome.gff
Per tal d'obtenir l'arxiu en gff per després poder còrrer el program gff2ps primer es va intentar el program Parseblast utilitzat anteriorment, però el format del Blast2sequence no el reconeix el Parseblast, es va utilitzar el program ObtainSimilarity per extreure les posicions, a partir de les quals es va poder obtenir obtrenir els arxius en format gff. Comandes:
Gen 2:
./ObtainSimilarityBlast.sh < Blast2seq.gen2 | gawk '{ print "AC090953", "ProteinaGen2","CDS", $4, $5, $6, "+", ".", "gi|18555932"}' > Blast2seq.gen2.gff
Gen 4:
./ObtainSimilarityBlast.sh < Blast2seq.gen4 | gawk '{ print "AC090953", "ProteinaGen4","CDS", $2, $3, $4, "-", ".", "gi|14603463:32-280"}' > Blast2seq.gen4.gffGen 5:
./ObtainSimilarityBlast.sh < Blast2seq.gen5cds | gawk '{ print "AC090953", "ProteinaGen5","CDS", $2, $3, $4, "+", ".", "gi|14249885"}' > Blast2seq.gen5.gff
Per tal de poder ser visualitzat es va executar el el gff2ps conjuntament amb les prediccions del Geneid i del Genscan.
./gff2ps_v0.97b AC090953.geneid.gff AC090953.genscan.gff Blast2seq.gen4.gff Blast2seq.gen5.gff Blast2seq.gen2.gff > Proteina.ps