Abstract

En el nostre treball analitzem la seqüència NT_024524 localitzada al cromosoma 13. Aquesta regió forma part del projecte ENCODE . L'objectiu bàsic d'aquest projecte és intentar elucidar informació sobre la identitat i la localització de proteïnes, elements funcionals ( com per exemple els promotors), i altres elements que complementin la informació que aporta el Genoma Humà ja publicat (abril del 2003).(ENCODE)

Els punts que s'han desenvolupat en les següents pàgines per a realitzar l'anàlisi són:

- Emmascarament de la seqüència amb el programa RepeatMasker . Considerem que les regions que presenten repeticions no seran codificants; aleshores, no ens interessaran alhora de predir els gens amb els programes.

- Predicció dels gens de la seqüència mitjançant els programes geneid , genscan , fgenesh i grail .

- Validar els resultats aliniant amb les bases de dades de ESTs.

- Dividir la nostra seqüència inicial en blocs que contenen les coordenades dels gens millor predits amb diferents programes. Així, per exemple, mirem les coordenades del gen 1 que prediuen genescan i geneid i delimitem aquesta subseqüència, de la qual tornarem a fer un anàlisis més exhaustiu amb els ESTs i , si s'escau, els ESTs filtrats.

- Finalment, realitzarem un estudi de les regions promotores ( 300 pdb per sobre de la regió d'inici de transcripció) amb el programa TRANSFAC