Abstract

En aquest treball s'analitza la seqüència AC091491 localitzada al cromosoma 3 mitjançant diferents eïnes bioinformàtiques. En primer lloc s'ha emmascarat la seqüència amb el programa RepeatMasker per tal de predir el gens mitjançant els programes de predicció de gens geneid i genscan, validant els resultats mitjançant aliniaments amb spliced ESTs. Donat que el gen predit no era complet s'ha procedit a l'extensió de la seqüència 90000 pb upstream mitjançant la base de dades UCSC Genome Bioinformatics i seguidament s'ha realitzat el mateix protocol seguit per a la seqüència original: emmascarament, predicció de gens i validació per ESTs. A continuació s'han buscat proteïnes homòlogues a la predita pels programes de predicció de gens geneid i genscan mitjançant BLAST i s'ha buscat el percentatge de similitud del hit amb major score (KIAA1092) realitzant un aliniament per parells amb CLUSTAL. Per tal de comprovar si la proteïna homòloga correspon a la predita a la nostra seqüència s'ha buscat la seva localització genòmica a partir de dades obtingudes amb Ensembl i s'ha comprovat que correspon al contig objecte del nostre estudi. Donat que cap dels exons inicials dels trànscrits trobats per la proteïna KIAA1092 es correspon amb els exons inicials predits pels programes de predicció s'ha tornat a fer la predicció de gens amb la seqüència extesa sense emmascarar per descartar la possibilitat que no s'hagin predit per trobar-se en una regió emmascarada. Finalment s'han estudiat les regions reguladores mitjançant els programes PROMO (Mar Albà) i MatInspector v2.2 basat en TRANSFAC 4.0, agafant 500 pb upstream tant del gen predit com dels trànscrits de la proteïna KIAA1092.