Predicció de gens


Per tal de determinar l'existència de gens en la seqüència a estudiar es van fer servir diversos programes de predicció de gens i es van obtenir les següents prediccions:
  1. Output de l'Overview MIT Genscan Server
  2. Output de l'IMIM Geneid Server
  3. Output del GrailEXP
  4. Output del FGenesH

Les dades provinents del Geneid presentaven el format gff mentre que les dades del Genscan, el GrailXP i el FGenesH van ser passades a aquest format mitjançant diferents comandes d'awk.

Aquests arxius en format gff es van passar a un únic arxiu en format ps utilitzant el programa gff2ps i posteriorment a png mitjançant una altra comanda per tal de visualitzar-lo:

Mapa 2. Prediccions gèniques


Observant aquest mapa podem dir que tots quatre programes han coincidit a l'hora de predir un gen al voltant de la posició 17.000 en reverse tot i que la seva longitud varia segons el programa utilitzat.

Per contra, hi ha grans diferències en les prediccions dels diferents programes en la resta de la seqüència. Concretament, el programes Geneid i Genscan prediuen dos gens, tot i que difereixen en la seva longitud i localització (p.e. el gen 3 predit per Genscan englobaria totes les altres prediccions en forward); i Grail en prediu set, tot i que un d'ells presenta tres variants. A diferència de tots els altres programes, FGenes prediu quatre gens en forward i dos gens més en reverse

En la següent taula s'han anotat els diferents gens predits per cada programa, la seva direcció i les coordenades d'inici i final de cadascun:

Taula 2. Coordenades de les prediccions

Programa Gen predit Direcció Inici Final
Genscan
1
2
3
reverse
forward
forward
75.601
80.994
92.227
6.474
86.821
483.933
Geneid
1
2
3
4
reverse
forward
forward
reverse
84.558
136.706
365.207
482.806
17.179
258.717
447.000
482.559
FGenes
1
2
3
4
5
6
7
reverse
reverse
forward
reverse
forward
forward
forward
84.632
137.028
155.409
294.987
311.693
396.798
438.272
18.040
117.053
258.791
274.813
392.398
433.142
452.874
Grail
1
2
3
4
5
6
7.1
7.2
7.3
8
9
reverse
reverse
forward
forward
forward
forward
forward
forward
forward
reverse
reverse
18.717
55.029
136.543
237.167
265.029
299.109
374.164
374.164
374.164
151.760
482.765
17.128
19.753
137.071
259.323
265.509
299.499
452.133
442.114
452.133
151.545
482.559


Posteriorment es va realitzar un altre mapa que contenia les regions repetitives representades en una única línia, mitjançant una altra comanda d'awk, i les quatre prediccions obtingudes anteriorment:

Mapa 3. Prediccions gèniques i repeticions


Observant el mapa podem dir que les prediccions de gens donades pels diferents programes coincideixen amb aquelles regions on la densitat de seqüències repetitives és menor, la qual cosa suporta una adequada predicció gènica.