Predicció de gens amb la seqüència extesa sense emmascarar



Per descartar la possibilitat que aquests exons inicials en els dos trànscrits de la proteïna kiaa1092 no s'hagin predit degut a que es troben en una regió emmascarada s'ha procedit a fer la predicció de gens en la seqüència extesa sense emmascarar. Els resultats de la predicció es mostren a continuació:

A continuació s'han guardat aquests resultats en els fitxers expAC091491nomasc.geneid.gff i expAC091491nomasc.genscan. Seguidament s'han convertit els outputs del genscan a format gff amb el programa gff2ps_v0.98c amb la següent comanda:

    - gawk 'BEGIN{OFS="\t"}$2 ~ /Term|Intr|Init/ {print "Seq_sense_emmascarar", "genscan", $2, start=($4<$5 ? $4 : $5), end=($5<$4 ? $4 : $5),$13,$3,$7, $1}' expAC091491nomasc.genscan | sed 's/\.[0-9][0-9]$//' > expAC091491nomasc.genscan.gff
Finalment visualtizarem els resultats de la nova predicció juntament amb els ESTs, els dos transcrits de la proteïna i els repeats:



Fig 13. Podem observar que les prediccions tant de geneid com de genscan han variat molt: es prediuen molts més exons tant en forward com en reverse però cap d'ells correspon als exons first dels dos trànscrits. Això pot ser degut a que aquests exons es troben molt allunyats del segon exó del nostre gen de tal manera que com que s'ha trobat un exó inicial més proper la predicció del genscan i el geneid queda tancada.