ÍNDEX:
- Introducció
- Predicció de gens in silico
- Descripció del programa
- Condicions d'ús
- Resultats
- Link al servidor de PREGEN
- Materials
- Referències
INTRODUCCIÓ:
La predicció de gens en seqüències d'ADN és una part fonamental a resoldre del problema d'anotar el genoma de qualsevol organisme. Utilitzant mètodes estadístics i computacionals es pot tractar aquest problema exclusivament a l'ordinador.
Actualment en un gran nombre de programes de predicció d'estructures de gens en seqüències genòmiques d'eucariotes superiors la predicció d'exons no està acoblada amb l'ensamblatge de gens. Per una banda, una gran quantitat d'exons candidats és predita i puntuada a partir dels caràcters establerts en la seqüència d'ADN. Per l'altra, els gens candidats són ensamblats a partir del grup de seqüències dels exons predits amb una pauta de lectura compatible i que no se superposen.
En aquests programes, la puntuació dels gens predits es calcula en funció de les puntuacions dels exons ensamblats i el gen candidat amb més puntuació és l'assumit com al que té més probabilitat de ser codificat per a la seqüència d'ADN problema.
PREDICCIÓ DE GENS IN SILICO :
PREGEN permet predir el gen en la cadena + que es formarà a partir d'un conjunt d'exons.
Donat un conjunt d'exons dins d'un fitxer de text en format GFF en construeix un altre (en el mateix format) que conté la predicció del gen.
El gen predit és el producte d'ensamblar les diferents combinacions possibles dels exons introduïts que maximitzen la suma de les puntuacions dels exons. El programa, considerant funcions additives de les puntuacions dels gens, a partir de certs algoritmes (basats en PROGRAMACIÓ DINÀMICA) determinarà el gen candidat amb més puntuació.
El programa es basa en el fet que, mentre es va escrutant el conjunt d'exons predits, el gen amb màxima puntuació que acaba en un exó donat es pot obtenir afegint aquest exó al gen de màxima puntuació d'entre tots els que acaben en l'exó anterior compatible (pauta de lectura, no solapament, strand...).
DESCRIPCIÓ DEL PROGRAMA:
Existeixen diferents mètodes per l'ensamblatge de gens a partir d'un conjunt d'exons; però, com hem dit anteriorment, l'algoritme principal del nostre programa es basa en la tècnica de PROGRAMACIÓ DINÀMICA segons la qual el gen que es prediu amb màxima puntuació que acaba en un exó donat es pot obtenir afegint aquest exó al gen de màxima puntuació d'entre tots els que acaben en l'exó anterior compatible. A més a més, aquest programa emmagatzema i renova/revisa el millor gen possible a mesura que escruta el conjunt d'exons predits ordenats per posició creixent d'acceptor.
Si vols descarregar el programa clica aquí:
CONDICIONS D'ÚS:
Executant el nostre programa des del LINUX l'usuari haurà d'introduir aquesta comanda:
./pregen.pl         exons.gff         parametres.txt
- Fitxer exons.gff:
Conté els exons predits prèviament en un altre programa de predicció d'exons(com Geneid, Genescan o Predictor). Les dades que s'inclouen seran les que utilitzarà el nostre programa per predir el millor gen. Aquest fitxer pot prendre qualsevol nom mentre tingui el format i l'extensió .gff (format GFF).
- Fitxer parametres.txt:
Es tracta d'un fitxer de text que l'usuari haurà de crear que descriu els tipus d'exons que es poden concatenar i també conté les distàncies màxima i mínima que hi pot haver entre els diferents tipus d'exons.Un exemple de fitxer seria el següent:
Els dos primers paràmetres de cada fila corresponen als tipus d'exons que es poden concatenar, upstream i downstream respectivament (el segon tipus d'exó després del primer). La tercera posició fa referència a la distància mínima que pot haver-hi entre els dos exons. L'últim valor representa la distància màxima que hi pot haver entre els dos exons. Cada paràmetre s'ha de separar del següent per un sol espai!! (en l'exemple hi ha més d'un espai perquè quedi més clar).
Si l'usuari vol utilitzar el servidor del programa PREGEN simplement haurà d'introduir aquests dos fitxers allà on se li demanen.
En els dos casos el resultat del programa sortirà per la pantalla en format GFF.
RESULTATS:
Els resultats del nostre programa ens demostren que aquest prediu els gens amb la mateixa sensibilitat que programes com geneid i genescan però tenint en compte que només treballa amb exons de l'strand positiu.PREGEN, però, no resol el problema plantejat amb una algoritme de complexitat lineal, ni té en compte els exons predits en l'strand negatiu (-).
Malgrat això, sí que permet canviar el model de gen per cada predicció i aquest fet fa de PREGEN un programa dinàmic on l'usuari pot canviar els paràmetres de les prediccions quan vulgui; fent diferents prediccions per una mateixa seqüència.
Exemples:
- Mostra d'un fitxer d'entrada de dades amb una predicció d'exons feta amb el programa Geneid.(clica aquí)
- Resultat que obtenim amb PREGEN amb la restricció de paràmetres de l'exemple anterior. (clica aquí)
LINK AL SERVIDOR DE PREGEN:
Si vols utilitzar PREGEN clica aquí!!!
MATERIALS:
Aquest programa ha estat realitzat amb el llenguatge de programació Perl, una varietat del C. Les pàgines web han estat realitzades amb HTML. Ambdós han estat creats amb l'Emacs (editor de text del LINUX OS).
REFERÈNCIES:
Guigó, R. 1998. Assembling genes from predicted exons in linear time with dynamic programming. J. Comput. Biol. 5 (4); 681-702.
En cas de dubte o consulta podeu consultar amb les autores via correu electrònic:
nuria.noel01@campus.upf.es
anna.perez01@campus.upf.es
Barcelona, abril de 2003