Conclusió

De l'anàlisi de la regió genòmica compresa entre els nucleòtids 28318016 i 28818015 del cromosoma 13 humà, podem extreure una sèrie de conclusions. En primer lloc hem estat capaçes d'identificar de 7 a 9 possibles gens , en funció del programa de predicció, dels quals almenys quatre codifiquen per proteïnes conegudes.

Tanmateix, per tal de conèixer el nombre de gens predits, ha estat necessàri identificar les seqüències repetitives i emmascarar-les. Així, per exemple, el geneid ens predeia 27 gens si consideràvem la seqüència sense emmascarar , i només set amb la seqüència emmascarada. Aleshores, es pot dir que aquest pas és clau per a l'estudi posterior, doncs cal tenir en compte que el 47% del genoma humà són seqüències repetides i tan sols el 2% del total del genoma codifica per proteïnes.

En quant al contingut proteic, hem trobat que els gens 4, 5, 6 (els tres predits per geneid i genscan) i el 7 (geneid) codifiquen per alguna proteïna. Per tal d'obtenir aquesta informació, ha estat del tot imprescindible la utilització de les bases de dades de ESTs . En aquest punt, però, és important filtrar els ESTs per quedar-nos amb aquells que són realment informatius analitzant la redundància i repuntuant-los. Gràcies a aquests filtres hem pogut interpretar millor les prediccions genètiques i els més important, hem pogut validar-les. Inclús ens han permès preveure i corroborar la posible existència d'exons, que haurien estat passats per alt en els programes de predicció genètica (proteïna sis).

Els ESTs, a més, ens han permès identificar processos de splicing com succeeix en la sisena subseqüència, en què diferents ESTs soportarien un conjunt d'exons que no coincideix amb els que indiquen els programes de predicció. En aquest punt ens plantejem un estudi més concret d'aquesta regió, que ens permet descobrir la presència d'una possible proteïna validada per ESTs.

Finalment, una altre pas que hem realitzat ha estat l'estudi de la regió promotora . Això ens ha permès validar algunes de les proteïnes predites. Tanmateix, només en la proteïna quatre hem trobat una TATAbox, motiu imprescindible per a l'inici de la transcripció, fet que ens corrobora aquesta proteïna. En els altres casos, tot i que el TRANSFAC no ens ha trobat cap TATAbox, ha trobat altres motius on s'ueneixen altres factors de transcripció, i que tamé poden considerar-se indicis de la proteïna. Per exemple, en la regió promotora de la proteïna sis (receptor d'insulina), el programa citat ha trobat un motiu on s'uneix un factor de transcripció relacionat amb hormones com la insulina.

Ja per acabar, voldriem fer una valoració positiva del nostre treball. Cal dir que ens ha ajudat a desenvolupar habilitats informàtiques amb els programes d'anàlisi de seqüències genòmiques, així com també amb el sistema operatiu Linux. D'altra banda, com que el treball està d'un punt de vista biològic, que es el que ha nosaltres ens agrada, se'ns ha fet interessant.