Estudi de les regions promotores

Per tal de millorar les prediccions proteiques, i demostrar l' existència de les proteïnes trobades, duem a terme l'estudi de les regions promotores.

Al llarg del nostre treball hem identificat 4 proteïnes, amb scores prou alts i hits amb identitats importants. Sobre aquests ens hem disposat a fer l'anàlisi de la regió promotora, amb l'intenció de trobar algun promotor o motiu que ens validi la nostra hipòtesi. En tots els casos ens hem guiat per les coordenades dels exons més ben predits, i en els casos possibles, que estiguessin validats per ESTs. A donat la casualitat que en els 4 casos geneid i genscan han estat els programes amb millors prediccions, per això nom&eactue;s hem utilitzat la informació obtinguda per aquests dos.

En tots els casos hem agafat 500 nucleòtids per sobre del ATG de l'exó inicial. Aquest procès l'hem dut a terme mitjançant el programa fastachunk i per predir els motius hem utilitzat el programa MATCH.



PROTEÏNA 4


La proteïna 4 es troba en reverse i fou predita pels 4 programes de predicció de gens. Les coordenades utilitzades per dur a terme l'estudi es mostre a la següent taula:

SEQÜÈNCIA Regió Upstream
hg16_dna_261662-338899 124155-124655

Taula 1. Posicions de les seqüències
estudiades



Un cop analitzat el resultat s'evidència la presència d'una serie de motius coneguts en aquesta zona com són la TATAbox. El qual ens permet pensar que efectivament aquesta &eactue;s una regió promotora



PROTEÏNA 5


La proteïna 5 va ser predita per genscan i geneid, i de l'estudi amb blastp vam deduir que tenia un domini de Periredoxina altament conservat. Vàrem agafar la regió mostrada a la taula per fer l'estudi:

SEQÜÈNCIA Regió Upstream
hg16_dna_349269-367838 700-1050

Taula 2. Posicions de les seqüències
estudiades



El resultat obtingut també evidència que aquesta regió pot ser promotora, ja que s'obtenen certs motius . D'aquests ens fixem en els que es troben en l'strand +, i són motius d'unió de USF i HSF. No obtenim però predicci&oactue; per la TATAbox, la qual cosa ens fa dubtar de la validesa d'aquesta regió.

PROTEÏNA 6



La proteïna 6 únicament va ser predita per geneid i genscan (correspon al gen 9 predit per genscan i el 6 predit per geneid). Tot i això els exons que ambdós prediuen com a inicials es troben en unes coordenades una mica diferents, per això vam decidir d'agafar per cada una, les regions exactes que es mostren a continuació:

SEQÜÈNCIA Regió Upstream
hg16_dna_369503-500000 80400-80750
105400-105750

Taula 3. Posicions de les seqüències
estudiades



Els resultats obtinguts en la regió promotora del gen 9 predit per genscan, presenta certs motius , que ens fan pensar que també pot ser promotor. Hem de tenir en compte que aquests gens eren trobats en reverse, com en el cas de la proteïna,4, per tant ens fixem en els motius trobats en aquest strand.

El motiu més conservat és al que s'uneix C/EBP, el qual es troba entre altres cèlules, a les de fetge i múscul. Si recordem, aquesta proteïna codificava per la glicoproteïna B i pel factor de creixement de la insulina, la qual cosa ens fa pensar que ens trobem davant una bona evidència. Un altre motiu trobat és al que s'uneix el Factor de transcripció Pax4, el qual té afinitat per promotors hormonals com insulina o glucagó. El HSF és un altre motiu bastant repetit, però no hem trobat indicis de la TATAbox.Cal dir que ens ha sorprès la presència d'un motiu al que s'uneix el SRY (important en la determinació sexual), però aquest es troba en l'strand forward per això no n'hem fet cas.

En canvi els resultats obtinguts en la regió promotora del gen 6 predit per geneid, presenta HOXA3 (factor de transcripció requerit pel desenvolupament). Però no trobem cap motiu que coincideixi amb la regió promotora comentada anteriorment ni tampoc la TATAbox.

PROTEÏNA 7



La proteïna correspon al gen 7 predit per geneid per geneid.

SEQÜÈNCIA Regió Upstream
hg16_dna_369503-500000 ls 112110-112610

Taula 3. Posicions de les seqüències
estudiades


Els resultats obtinguts en aquest cas tampoc indiquen la presència de la TATAbox, però es repeteixen alguns motius ja vistos anteriorment, com HSF, C/EBP, o Cdx4 també relacionat amb desenvolupament.

En aquest cas esperàvem trobar una millor predicció del promotor, ja que la proteïna tenia una elevada identitat amb ubiquitina.