Aquest treball té com a objectiu la caracterització d'una regió anònima d'ADN procedent del projecte ENCODE mitjançant la utilització de diversos recursos en xarxa i petits programes en Perl.
Primer es va caracteritzar la seqüència determinant la localització al genoma, la longitud i la proporció de nucleòtids (contingut en G+C) d'aquesta.
Després, es van emmascarar les seqüències repetitives del contig per, posteriorment, aplicar diversos programes de predicció de gens. Un cop trobats, els possibles gens es van comparar amb diverses bases de dades de seqüències codificants (ESTs i proteïnes humans) per tal de validar aquestes prediccions.
Amb el mateix objectiu, es va procedir a predir les proteïnes presents en la seqüència anònima i a analitzar-les mitjançant la seva comparació amb bases de dades de proteïnes humanes. A més, es va utilitzar un programa d'alineament d'ESTs contra una base de dades de seqüències genòmiques per tal d'optimitzar l'alineament dels ESTs mé informatius.
Per últim, es va realitzar l'estudi de les regions reguladores dels gens predits, cercant les possibles regions promotores de cadascun d'aquests gens i es van caracteritzar les proteïnes codificades en aquests.