L'objectiu d'aquest treball és l'anàlisi d'una seqüència genòmica anònima, per tal d'intentar esbrinar quina és la informació biològica que aquesta conté.
Concretament es procedirà a l'anàlisi d'una regió proporcionada per al projecte ENCODE anomenada ENm003 Apo Cluster.
El projecte ENCODE (Encyclopedia Of DNA Elements), impulsat per l'Institut Nacional de Recerca Genòmica Humana (NHGRI), té com a finalitat identificar tots els elements funcionals presents en la seqüència del genoma humà.
Aquest projecte tindrà una durada de 3 anys i es desenvoluparà en 3 fases principals: la fase pilot (en la qual es troba actualment),la fase de desenvolupament tecnològic i la fase de producció.
Així doncs, partint de la informació donada pel projecte ENCODE, i mitjançant l'ús d'eines computacionals, es tractarà d'identificar els diferents elements repetitius que aquesta regió conté, així com també es tractarà d'analitzar-la exhaustivament partint de la comparació amb diferents bases de dades, per tal de conèixer quins possibles gens conté i a quines proteïnes poden donar lloc.
Es partirà d'una regió genòmica anònima, així que el que es pretè és, mitjançant la informació proporcionada pels diferents programes de predicció de gens: GENSCAN, GENEID i FGENESH, conèixer quins són els possibles gens presents en la citada regió.
Per validar aquesta predicció es procedirà a comparar els exons predits amb els ESTs humans presents en aquella regió.
La informació obtinguda permetrà, mitjançant l'ús de diferents criteris, escollir la millor predicció gènica.
A partir del gens escollits es procedirà a l'anàlisi proteïc, fent ús de bases de dades com el BLASTP. Aquest programa realitzarà un aliniament amb proteïnes ja conegudes.
Finalment, s'identificaran els dominis presents en la proteïnes que hagin tingut el millor aliniament i s'esmentaran les conclusions pertinents.