En aquest treball presentem la caracterització de l'estructura exònica, homologia, funció i expressió del gen de fusió humà MOZ-ASXH2, provinent d'una translocació. La proteïna quimèrica (o de fusió) codificada per aquest gen és una acetilhistona. Aquesta translocació està implicada en la leucèmia mieloide, ja que juga un paper important en l'hematopoiesi. El paper habitual del gen MOZ (que codifica per una histona acetil transferasa coneguda com ZNF220 o MYST3 i és membre de la família MYST - acetiltransferasses- es veu alterat a causa de la translocació i la traducció conjunta amb ASXH2, que pertany al grup dels gens Polycomb, requerits per mantenir estable la repressió dels gens homeòtics i altres loci i que normalment s'uneix al DNA per tal de regular el metabolisme de les nucleobases, nucleòsids, nucleòtids i àcids nucleics. Mentre que MOZ consta d'un sol transcript que dóna lloc a una sola isoforma, el gen ASXH2 té 2 transcripts diferents, amb un total de 2 isoformes.
La leucèmia mieloide aguda és una neoplàsia clonal del teixit hematopoiètic caracteritzada per la proliferació de cèl·lules blàstiques anormals d'estirp mieloide a la medul·la òssia i menor producció de cèl·lules hemàtiques normals, condicionant anèmia i trombopènia. Es produeix per danys genètics adquirits al DNA de les cèl·lules en desenvolupament de la medul·la òssia.
Es tracta del tipus més comú de leucèmia en adults i és també coneguda com leucèmia mielògena aguda, leucèmia mieloblàstica aguda, leucèmia granulocítica aguda i leucèmia no limfocítica aguda.
En aquesta malaltia, les cèl·lules mare de la medul·la generen un tipus de glòbuls blancs immadurs i anormals (mieloblasts). També pot succeïr que un excessiu nombre de cèl·lules mare es desenvolupin i converteixin en glòbuls vermells o plaquetes anormals. Aquests grups de cèl·lules no poden dur a terme les seves funcions habituals i s'acumulen a la medul·la i la sang, de manera que disminueix la capacitat per allotjar cèl·lules sanes i, d'aquesta manera, es possibilita el desenvolupament d'infeccions, anèmies i hemorràgies. Les cèl·lules leucèmiques es poden propagar fora de la sang fins altres parts de l'organisme com el sistema nerviós central, la pell o la geniva.
Hi ha diferents graus de Leucèma Mieloblàstica Aguda en funció del grau de maduresa de les cèl·lules canceroses i com es diferencïen de les normals.
Els factors de risc que augmenten les possibilitats de patir LMA són:
Els signes de la malaltia inclouen febre, cansament i formació fàcil d'hematomes o hemorràgies entre altres. Per tal de realitzar el diagnòstic es realitzen diferents proves: examen físic, consideració dels antecedents, recompte sanguini complet, estudis de la química de la sang, biòpsia de la medul·la òssia...
La incidència és d'1.5 casos per 100.000 habitants/any. La seva freqüència augmenta amb l'edat. Comprèn el 80% de les leucèmies agudes en adults i 15-20% de les d'infants. És la leucèmia més freqüent en nounats.
Com a tractament es duu a terme una teràpia de suport (mantenir l'hemoglobina en les concentracions necessàries, administració de plasma, ...) juntament amb un tractament específic (quimioteràpia citotòxica, transplant de medul·la òssia, ..).
Fent una cerca de la proteïna quimèrica en la base de dades del Pubmed, hem obtingut un sol article relacionat amb una malaltia provocada per la translocació t(2;8)(p23;p11). En data de publicació d'aquest article (Oct. 2003) no hi havia cap referència publicada d'aquesta translocació, de manera que es va arribar a la conclusió que aquest va ser el primer cas trobat o almenys reportat.
En aquest article, s'estudia el cas d'un infant amb sindrome mielodisplasic el qual va començar a desenvolupar els símptomes 17 mesos després de ser tractat per una leucèmia mieloblàstica aguda. Un cop es va fer el diagnòstic de la síndrome, és va fer un anàlisi del cariotip, i es va detectar una nova translocació t(2,8)(p23;p11.2). A més a més, es va fer un FISH el qual va suggerir un rearranjament del gen del zing finger de la leucèmia monocítica (MOZ) localitzat a la regió 8p11 del cromosoma 8, però no es va poder identificar el gen de la regió 2p23 del cromosoma 2.
El FISH, és va realitzar fent una hibridació amb les regions 3' i 5' del gen MOZ marcades amb SpectrumOrange i SpectrumGreen respectivament. Per tal d'identificar el cromosoma 2, és va marcar una molècula amb FITC específica per la detecció del centròmer del cromosoma 2.
Com podem veure en la figura de la dreta extreta de l'article, veiem que la molècula marcada amb FITC ens indica on hi ha els 2 cromosomes 2. A més a més, veiem les senyals obtingudes pel marcatge de les regions 5' i 3' del gen MOZ. Observant detalladament les imatges, veurem que hi ha senyal del gen MOZ en els 2 cromosomes 8 tal i com es d'esperar, però el que crida l'atenció i demostra la translocació del gen MOZ, és el senyal que s'obté en un cromosoma 2, de la regió 3' del gen MOZ.
Per tal de saber de quina proteïna es tracta la seqüència que ens van cedir per fer aquest treball, vam utilitzar el programa tblastn de la pàgina del BLAST. El tblastn és un programa que compara una seqüència proteica amb una base de dades. El resultat serà una pàgina amb els diferents alineaments significatius de la proteïna amb diverses seqüències genòmiques. Mitjançant aquest resultat i valorant els scores obtinguts, podrem saber en quin gen (o quins, en aquest cas) està codificada la proteïna. A partir d'aquí obtindrem la seqüència genòmica.
Un cop sabem quins gens codifiquen per la proteïna quimèrica (MOZ-ASXH2), fem una cerca al Genome Browser de la pàgina del UCSC i a Ensembl. En el cas de Ensembl, no trobem informació sobre aquesta proteïna com a quimèrica, però a la pàgina del UCSC, obtenim com a resultat una pàgina que ens porta a les seqüències dels dos gens per separat. En aquesta pàgina, podem veure en quin cromosoma es troba cada gen, on comença i on acaba, i un link cap a la pàgina de l'estructura genòmica del gen MOZ i un altre a la pàgina pel gen ASXH2.
Per obtenir les seqüències genòmiques, les dels transcrits i proteiques de cada gen, vam fer una cerca a Ensembl dels 2 gens per separat, i, a partir d'aquï vam, exportar-les en format FASTA.
Per tal de determinar si aquests gens tenen ortòlegs en altres espècies s'han obtingut les dades d'Ensembl, que proporcionava un percentatge d'homologia que es corresponia amb l'obtingut amb Biomart. A més a més, mitjançant el programa Clustalw s'han pogut realitzar els respectius arbres filogenètics.
Abans de fer cap mena d'anàlisi s'han obtingut les següents seqüències:
Per tal de realitzar l'estudi de l'estructura genòmica s'ha dut a terme una recerca a Ensembl (www.ensembl.org) dels dos gens per separat (MOZ i ASXH2), ja que com a gen de fusió no apareix. D'aquesta manera s'ha pogut obtenir informació sobre la localització cromosòmica, el nombre i tipus d'exons, el nombre de transcripts i isoformes associades, etc.
Estudi per separat dels dos gens:
MOZ
El gen MOZ està situat al cromosoma 8 (p11).
Aquest gen té un transcrit (ENST00000265713) constituït per 1 exó no codificant (el primer) i 16 codificants, dels quals el primer i el darrer tenen una porció no codificant. El transcript té una longitud de 7850bps, que donen lloc a 2004 aminoàcids. La llista dels exons en ordre es mostra a continuació (mitjançant els seus ID d'Ensembl):
ID exó | Codificant |
ENSE00001247926 | NO |
ENSE00001247940 | Part |
ENSE00000818786 | SÍ |
ENSE00000692308 | SÍ |
ENSE00000692307 | SÍ |
ENSE00000692300 | SÍ |
ENSE00000818785 | SÍ |
ENSE00001128473 | SÍ |
ENSE00001128468 | SÍ |
ENSE00000692227 | SÍ |
ENSE00000818794 | SÍ |
ENSE00000692210 | SÍ |
ENSE00000818792 | SÍ |
ENSE00000692156 | SÍ |
ENSE00000692153 | SÍ |
ENSE00001040899 | SÍ |
ENSE00001247935 | Part |
ASXH2
El gen ASXH2 està situat al cromosoma 2 (p23).
ENST00000336112: constituït per 12 exons codificants, dels quals el primer i l'últim tenen una porció no codificant. El transcript té una longitud de 8886bps, que donen lloc a 1434 aminoàcids. La llista dels exons en ordre es mostra a continuació (mitjançant els seus ID d'Ensembl):
ID exó | Codificant |
ENSE00001401940 | Part |
ENSE00001383622 | SÍ |
ENSE00001365879 | SÍ |
ENSE00001390760 | SÍ |
ENSE00001332890 | SÍ |
ENSE00001332886 | SÍ |
ENSE00001332883 | SÍ |
ENSE00001375542 | SÍ |
ENSE00001332882 | SÍ |
ENSE00000962989 | SÍ |
ENSE00000962990 | SÍ |
ENSE00001358750 | Part |
ENST00000272341: constituït per 7 no exons codificants (els 7 primers) i 6 codificants, dels quals el primer té una porció no codificant. El transcript té una longitud de 3781bps, que donen lloc a 918 aminoàcids. La llista dels exons en ordre es mostra a continuació (mitjançant els seus ID d'Ensembl):
ID exó | Codificant |
ENSE00001419152 | NO |
ENSE00001423868 | NO |
ENSE00001428609 | NO |
ENSE00001430729 | NO |
ENSE00001402784 | NO |
ENSE00001406188 | NO |
ENSE00001410931 | NO |
ENSE00001415520 | Part |
ENSE00001332882 | SÍ |
ENSE00000962989 | SÍ |
ENSE00000962990 | SÍ |
ENSE00000962991 | SÍ |
ENSE00001332893 | SÍ |
Si observem les identificacions dels diversos exons en cadascun dels transcrits del gen ASXH2, podem veure que hi ha només 3 exons en comú. Això és un indicatiu que els dos transcrits es formen per splicing alternatiu. Observant les seqüències exòniques dels gens MOZ i ASXH2, podem veure que els gens que estan canviats formen part tant de la regió codificant com de la no codificant. Això ens pot portar a pensar que les dues proteïnes resultants tenen una seqüència aminoacídica diferent, i per tant que les dues proteïnes tinguin una estructura i/o funció diferent. Per tal de comprovar si l'splicing alternatiu altera la seqüència de la proteïna, fem un aliniament de les dues seqüències aminoacídiques, i observem el resultat obtingut:
En aquest gràfic les seqüències es representen de la següent manera:
Analitzant aquestes dades, podem veure que la seqüència 1 és més llarga que la 2, però tot i així el marc de lectura no canvia. La única diferència que hi ha entre els 2 transcrits és que hi ha dues regions en la proteïna 1 no presents en la proteïna 2.
És molt probable que aquestes dues regions no siguin gaire importants per la funció de la proteïna, ja que en una es conserven i en l'altra no. En canvi, les regions comunes en totes dues proteïnes probablement contenen el centre actiu d'aquesta.
Informació de la proteïna quimèrica
S'han dut a terme alineaments de la proteïna quimèrica contra els diferents transcrits per separat, de manera que es pogués observar clarament quins dels dos gens es transcriu primer i quin després i quin dels dos transcrits d'ASXH2 és l'encarregat de donar lloc a la proteïna.
Els resultats es mostren a continuació:
Com es pot observar a la Figura 1, el transcrit al qual dóna lloc el gen MOZ és el que es tradueix en primer lloc per donar la proteïna.
A més a més, a la Figura 2, en el que es mostra l'alineament entre la proteïna quimèrica i el transcrit ENST00000272341 d'ASXH2, s'observa que hi ha una sèrie de bases que són presents a la proteïna quimèrica però que no apareixen en aquest transcrit. D'aquesta manera, es dedueix que aquest transcrit no és el que acaba donant lloc a la proteïna quimèrica juntament amb el produït per MOZ. En canvi, en la Figura 3 es mostra com el transcrit ENST00000336112 sí que dóna lloc a tots els aminoàcids provinents del gen ASXH2 que conformen la proteïna quimèrica.
D'aquesta manera, doncs es pot afirmar que la proteïna quimèrica dels gens MOZ-ASXH2 es forma a partir de l'únic transcrit del gen MOZ i del transcrit ENST00000336112 del gen ASXH2.
Conservació en altres espècies
Imatge | Espècie | Tipus | ID | % d'identitat |
Aedes aegypti | 1 to many | AAEL011106 | 9 | |
Anopheles gambiae | 1 to many | ENSANGG00000027310 | 8 | |
Bos taurus | 1 to 1 (apparent) | ENSBTAG00000004015 | 89 | |
Canis familiaris | 1 to 1 (apparent) | ENSCAFG00000005632 | 83 | |
Cavia porcellus | 1 to 1 | ENSCPOG00000011695 | 65 | |
Ciona intestinalis | 1 to many | ENSCING00000008187 | 7 | |
Ciona savignyi | 1 to many | ENSCSAVG00000000237 | 7 | |
Danio rerio | 1 to 1 (apparent) | ENSDARG00000018907 | 58 | |
Dasypus novemcinctus | 1 to 1 | ENSDNOG00000012153 | 68 | |
Drosophila melanogaster | 1 to many | CG11290 | 25 | |
Echinops telfairi | 1 to 1 | ENSETEG00000017730 | 87 | |
Erinaceus europaeus | 1 to 1 | ENSEEUG00000000481 | 75 | |
Felis catus | 1 to 1 (apparent) | ENSFCAG00000012952 | 58 | |
Gallus gallus | 1 to 1 | ENSGALG00000003641 | 83 | |
Gasterosteus aculeatus | 1 to 1 (apparent) | ENSGACG00000013076 | 54 | |
Loxodonta africana | 1 to 1 | ENSLAFG00000004860 | 77 | |
Macaca mulatta | 1 to 1 (apparent) | ENSMMUG00000010891 | 83 | |
Monodelphis domestica | 1 to 1 | ENSMODG00000010328 | 79 | |
Mus musculus | 1 to 1 | ENSMUSG00000031540 | 88 | |
Ornithorhynchus anatinus | 1 to 1 | ENSOANG00000000718 | 65 | |
Oryctolagus cuniculus | 1 to 1 | ENSOCUG00000000731 | 32 | |
Oryzias latipes | 1 to 1 (apparent) | ENSORLG00000015313 | 36 | |
Pan troglodytes | 1 to 1 | ENSPTRG00000020199 | 99 | |
Rattus norvegicus | 1 to 1 | ENSRNOG00000025174 | 88 | |
Saccharomyces cerevisiae | 1 to many | YOR244W | 6 | |
Takifugu rubripes | 1 to 1 (apparent) | SINFRUG00000125428 | 56 | |
Tetraodon nigroviridis | 1 to 1 (apparent) | GSTENG00031113001 | 56 | |
Tupaia belangeri | 1 to 1 | ENSTBEG00000001755 | 82 | |
Xenopus tropicalis | 1 to 1 (apparent) | ENSXETG00000016797 | 59 |
Els resultats obtinguts pel gen ASXH2 són els següents:
Imatge | Espècie | Tipus | ID | % d'identitat |
Aedes aegypti | 1 to many | AAEL011106 | 9 | |
Bos taurus | 1 to 1 (apparent) | ENSBTAG00000004015 | 89 | |
Canis familiaris | 1 to 1 (apparent) | ENSCAFG00000005632 | 83 | |
Cavia porcellus | 1 to 1 | ENSCPOG00000011695 | 65 | |
Danio rerio | 1 to 1 (apparent) | ENSDARG00000018907 | 58 | |
Dasypus novemcinctus | 1 to 1 | ENSDNOG00000012153 | 68 | |
Echinops telfairi | 1 to 1 | ENSETEG00000017730 | 87 | |
Erinaceus europaeus | 1 to 1 | ENSEEUG00000000481 | 75 | |
Felis catus | 1 to 1 (apparent) | ENSFCAG00000012952 | 58 | |
Gallus gallus | 1 to 1 | ENSGALG00000003641 | 83 | |
Gasterosteus aculeatus | 1 to 1 (apparent) | ENSGACG00000013076 | 54 | |
Loxodonta africana | 1 to 1 | ENSLAFG00000004860 | 77 | |
Macaca mulatta | 1 to 1 (apparent) | ENSMMUG00000010891 | 83 | |
Monodelphis domestica | 1 to 1 | ENSMODG00000010328 | 79 | |
Mus musculus | 1 to 1 | ENSMUSG00000031540 | 88 | |
Ornithorhynchus anatinus | 1 to 1 | ENSOANG00000000718 | 65 | |
Oryctolagus cuniculus | 1 to 1 | ENSOCUG00000000731 | 32 | |
Pan troglodytes | 1 to 1 | ENSPTRG00000020199 | 99 | |
Rattus norvegicus | 1 to 1 | ENSRNOG00000025174 | 88 | |
Takifugu rubripes | 1 to 1 (apparent) | SINFRUG00000125428 | 56 | |
Tetraodon nigroviridis | 1 to 1 (apparent) | GSTENG00031113001 | 56 | |
Tupaia belangeri | 1 to 1 | ENSTBEG00000001755 | 82 | |
Xenopus tropicalis | 1 to 1 (apparent) | ENSXETG00000016797 | 59 |
Caracterització de l'expressió
Mitjançant la funció Gene Sorter de la web d'UCSC (www.genome.ucsc.edu) s'ha trobat el patró d'expressió d'amdós gens. Cal tenir en compte el significat dels chips, és a dir, els experiments en que s'analitzen els nivells d'expressió:
El patró d'expressió d'aquest gen és en un conjunt de diferents teixits humans es mostra pels següents experiments:
Expressió màximaA més a més, mitjançant la funció Visi Gene de la mateixa pàgina web, s'han obtingut les següents imatges de l'expressió del gen MOZ:
Expressió al sistema nerviós central en un embrió de ratolí de 10,5 dies:
Secció sagital del cervell d'un ratolí de 5 setmanes:
Expressió en diferents secciones del cervell d'un embrió de ratolí de 13,5 dies:
El patró d'expressió d'aquest gen és en un conjunt de diferents teixits humans es mostra pels següents experiments:
Caracterització de les regions promotores
Per tal de caracteritzar la regió promotora, hem utilitzat dos mètodes i els hem comparat:
TF | Score | Seqüència unió | Inici | Final | p-value |
AP-1 | 2,9378 | GAAGTCA | 274 | 280 | 0,08 |
AR | 2,1172 | GAACCGC | 42 | 48 | 0,62 |
c-Myc | 3,4903 | CACGTG | 732 | 737 | 0,28 |
NF-AT1 | 3,6660 | GGAAAGT | 436 | 442 | 0,09 |
NF-KappaB | 2,4440 | AGAGTTCCC | 502 | 510 | 0,32 |
SRF | -995,7752 | CCAAGATGG | 981 | 989 | 0,32 |
YY1 | 2,9867 | ATGGCG | 986 | 991 | 0,24 |
RXR-alpha | 2,6311 | TGAAAG | 285 | 290 | 0,61 |
HIF-1 | -995,6667 | GCCCCACGT | 728 | 736 | 0,47 |
AhR | 3,5903 | GCGTGAG | 640 | 646 | 0,07 |
PU.1 | 3,9140 | GAGGAAC | 656 | 662 | 0,06 |
HNF-4 | -995,2648 | TGGCCTTT | 713 | 720 | 0,36 |
NRSF | -995,9002 | TCCAGCCCC | 678 | 686 | 0,61 |
Simplement observant els scores obtinguts a través del programa, podem dir que no esperarem que s'uneixin els factors SRF, HIF-1, HNF-4 ni NRSF, ja que el seu valor d'score és molt baix, i indica que la possible seqüència d'unió del factor conté algún nucleòtid no present mai en la seqüència del factor de transcripció, i per tant mai s'hi unirà.
Un altre criteri que podem utilitzar per saber si és probable la unió o no d'un factor de transcripció a la seqüència, és el seu p-value. Aquest valor, és un tant per u que ens indica la significància de l'score obtingut, ja que dóna el nombre de vegades que per atzar obtenim un score superior o igual al que hem obtingut pel factor de transcripció. Per tant, valors baixos de p-value, indicaran que l'score obtingut correspon a una seqüència prou conservada, com per no obtenir el valor de score simplement per atzar.
D'aquesta manera, podríem descartar la possibilitat d'unió dels factors AR, RXR-alpha, HIF-1 i NRSF. Així com podríem sospitar que els factors AP-1, NF-AT1, AhR i PU.1 tenen un valor de p-value prou baix com per ser candidats a unir-se al nostre promotor.
Pel que fa a la resta de factors de transcripció, els valors de p-value no són prou significatius com per arriscar-nos a assegurar o no la seva unió al promotor.
Per comprovar els resultats obtinguts, utilitzarem la pàgina web del PROMO, on s'ens permet seleccionar els factors humans, els llocs d'unió humans i els factors de transcripció utilitzats en el programa realitzat per nosaltres. Un cop li donem la nostra seqüència promotora, li donarem el valor de dissimilarity rate, que permetrà ajustar més o menys la nostra cerca. En la pàgina de resultats, veurem on poden unir-se els diferents factors.
Comparant aquests resultats amb els obtinguts pel nostre programa, podem veure que el PROMO ens mostra molts més possibles llocs d'unió dels factors de transcripció a la nostra seqüència promotora. Entre tots ells, podem comprovar que els factors AP-1, NF-AT1 i c-Myc s'uneixen als mateixos llocs que hem obtingut en el nostre programa, però que tot i això, nosaltres esperàvem veure la unió de Ahr i PU.1, i no és així.
A més a més, nosaltres havíem obtingut un score màxim del factor SRF de -995,7752, i no esperàvem que s'unís al promotor, però en els resultats del PROMO, veiem que ens prediu que sí que s'hi pot unir.
Per tal de veure si els resultats variaven canviant el dissimilarity ratio, el vam disminuir a valors com 10, 5 o fins i tot 1. Els resultats obtinguts van ser la disminució dels possibles llocs d'unió dels diferents factors, i a més a més desapareixien les unions dels factors amb un p-value més baix en contra del que nosaltres esperàvem. Degut a això, ens vam basar en els resultats obtinguts pel valor de dissimilarity ratio 15.
Resultats obtinguts pel promotor del gen ASXH2:
TF | Score | Seqüència unió | Inici | Final | p-value |
AP-1 | 2,1263 | AAAGTCA | 403 | 409 | 0,44 |
AR | -996,4427 | GGACTGA | 305 | 311 | 1 |
c-Myc | -995,9721 | CACCTG | 3 | 8 | 0,81 |
NF-AT1 | 2,6875 | GGAAAGG | 437 | 443 | 0,5 |
NF-KappaB | 2,7419 | AGCTTTCCC | 734 | 742 | 0,23 |
SRF | 3,5841 | CCAATATGG | 1035 | 1043 | 0,06 |
YY1 | 2,2719 | ATGGTC | 226 | 231 | 0,81 |
RXR-alpha | 2,4953 | TGAATC | 250 | 255 | 0,62 |
HIF-1 | -995,6601 | CGCGCTCGT | 945 | 953 | 0,52 |
AhR | 2,2989 | GCGTGGC | 876 | 882 | 0,7 |
PU.1 | -996,0948 | GAGGTAC | 883 | 889 | 0,97 |
HNF-4 | -995,6078 | TGGATCTT | 189 | 196 | 0,63 |
NRSF | -994,3269 | TTCAGCTCC | 672 | 680 | 0,07 |
En aquest cas, podem preveure que els possibles factors de transcripció que s'uniran a la nostra seqüència promotora són molt pocs. En primer lloc, podem observar que AR, c-Myc, HIF-1, PU.1, HNF-4 i NRSF tenen un valor d'score molt baix. Això es un primer indici que probablement no s'uniran al promotor. En segon lloc, hem de valorar els p-values dels diferents TF. Per exemple, podem veure que la majoria tenen uns valors molt alts, excepte el NRSF i el SRF. Aquests dos, serien uns bons candidats, però només el SRF ho serà, perquè té un valor d'score positiu enfront el valor d'score tant baix que té NRSF.
Finalment, per valorar els que podem esperar i els que no, farem una valoració entre l'score i el p-value, en aquest cas, podríem esperar l'AP-1, el NF-AT1, l'NF-kappaB i l'SRF.
Per comprovar els factors que s'uniran al promotor i els que no, tal com hem fet abans, utilitzem la pàgina web del PROMO, fent exactament el mateix, però ara donant-li el promotor del gen ASXH2.
Estudiant els resultats obtinguts pel promo i comparant-los amb els obtinguts pel nostre programa, podem comprovar que tant l'AP-1 com el NF-AT1 s'uneixen a la seqüència promotora en els llocs que ens ha predit el nostre programa, però l'SRF que era un molt bon candidat, no s'hi uneix, ni en la seqüència que ens ha predit el programa ni en tot el promotor. En canvi, no esperàvem que s'unís l'YY1 degut al seu p-value tant elevat, però si que ho fa, i en els llocs predits. A més, tampoc experàvem la unió del RXR-alpha al nostre promotor, però veiem que sí que s'hi uneix tot i que no ho fa en la seqüència que haviem predit.
Tot això ens demostra, que la naturalesa és molt capritxosa, i no segueix uns patrons exactes, i sense experimentar totes les possibilitats, no podem assegurar al 100% si un factor de transcripció s'uneix a un promotor o no, i a més a més tampoc podem assegurar en quin lloc ho fa.
El cas del factor de transcripció NRSF, havíem predit un lloc d'unió en tots dos promotors, que tot i tenir un score molt negatiu, tampoc ho hem pogut comprovar, perquè el promo no ens donava la opció de seleccionar aquest factor de transcripció per testar la seva unió als promotors.
Dominis i funció de la proteïna
Per tal de veure els dominis de la proteïna, vam cercar a la base de dades InterPro la ID Q76L81 corresponent a la proteïna quimèrica. En aquesta pàgina vam veure que la proteïna que estem estudiant consta de 5 dominis diferents tal i com es mostra en la figura inferior.
Per finalitzar amb l'estudi de la funció de la proteïna quimèrica, vam fer una cerca a la base de dades del geneontology, mitjançant la cerca de les identificacions que vam trobar referides a la nostra proteïna. Les diferents ontologies obtingudes en la cerca estan relacionades en la següent taula juntament amb les corresponents identificacions i links de cadascuna de les ontologies.
ID GO | Ontologia | Nom |
GO:0000786 | Component cel·lular | Nucleosoma |
GO:0005634 | Component cel·lular | Nucli |
GO:0003677 | Funció molecular | Unió a DNA |
GO:0005515 | Funció molecular | Unió a proteïna |
GO:0016740 | Funció molecular | Activitat transferassa |
GO:0008270 | Funció molecular | Unió a ions de zinc |
GO:0016568 | Procés biològic | Modificació de cromatina |
GO:0006334 | Procés biològic | Ensamblatge de nucleosomes |
GO:0006355 | Procés biològic | Regulació de la transcripció dependent de DNA |
Pàgines web:
Biomart: http://www.biomart.org/
BLAST: http://130.14.29.110/BLAST/
Clustalw: http://www.ebi.ac.uk/clustalw/
Ensembl: http://www.ensembl.org
Genome Browser: http://genome.ucsc.edu/cgi-bin/hgGateway
InterPro: http://www.ebi.ac.uk/interpro/
NCBI: http://www.ncbi.nlm.nih.gov/
Programa PROMO: http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promoinit.cgi?dirDB=TF_8.3
UCSC: http://genome.ucsc.edu/
UniProt: http://www.uniprot.org/
PubMed:http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed
GeneOntology:http://www.geneontology.org/
VisiGene:http://genome.ucsc.edu/cgi-bin/hgVisiGene?command=start
Articles:
Toshihiko Imamura, Naoki Kakazu, Shigeyoshi Hibi, Akira Morimoto, Yoko Fukushima, Ikuko Ijuin, Satoshi Hada, Issei Kitabayashi, Tatsui Abe, Shinsaku Imashuku. Rearrangement of the MOZ Gene in Pediatric Therapy-Related Myelodysplastic Syndrome With a Novel Chromosomal Translocation t(2;8)(p23;p11). Genes, chromosomes & cancer. 2003; 36:413-19.