El càncer ha esdevingut en els darrers anys una de les patologies amb més incidència en la societat occidental. Un dels principals camps d'investigació en la biomedicina és l'enfocat al diagnòstic i tractament del càncer. El desenvolupament tecnològic i el de la biologia molecular ha permès obtenir diverses eines de diagnòstic. Entre aquestes destaquem la tècnica de DNA microarrays, la qual permet caracteritzar l'expressió diferencial de gens en teixits tumorals podent, d'aquesta manera, extraure conclusions sobre quins són els gens implicats en la malaltia. Aquesta caracterització d'expressió gènica possibilita un diagnòstic fiable i relativament ràpid. D'altra banda, el coneixement d'aquests gens/proteïnes obre les portes a nous tractaments.
En el nostre projecte estudiarem l'expressió gènica diferencial en els diversos estadis del càncer de bufeta. Basant-nos en dades de DNA microarrays i emprant diverses eines informàtiques buscarem:
Per dur a terme el nostre estudi ens hem basat en dos papers:
Obtenció de la base de dades. Per trobar la bases de dades de microarrays que van fer servir en l'article citat anteriorment "Identifying distinct classes of bladder carcinoma using microarrays" vam accedir a Gene_Expression_Omnibus (GEO) a partir de la web del NCBI.
El set de dades Bladder tumor stage classification de canal simple és la corresponent al paper. A continuació vam seleccionar les mostres dels estadis tumorals Ta, T1 i T2+.
Selecció de valors d'expressió significatius. En aquest pas vam fer l'estudi estadístic basat en R-script en una web proporcionada pel tutor: nin.crg.es/cgi-bin/pMargeWeb.cgi.
Primer de tot, vam identificar les mostres corresponents a cada estadi i vam crear tres arxius: Ta-T1, T1-T2 i Ta-T2. A partir d'aquí obtinguérem els valors de p-value, el quals ens indiquen la significància de l'expressió diferencial en cada estadi. En el nostre estudi, seleccionàrem els gens amb p-values inferiors a 0,001 (p<0,001). Aquest càlcul el vam fer en una fulla Excel seguint el procediment:
Cerca del "Gene Symbol". Amb el programa EASE, a partir dels identificadors dels gens obtenim els "gene symbols" que posteriorment ens seran útils per analitzar els resultats.
El programa EASE l'hem baixat de la web de DAVID (Database for Annotation, Visualization and Integrated Discovery), hem introduït els identificadors dels gens a "Input Genes" i hem clicat a Annotate Genes. Amb aquest procediment hem obtingut informació diversa com el "gene symbol", funcionalitat, localització cromosòmica...
Agrupaments. Una de les eines més freqüentment emprades en l'anàlisi de la informació procedent dels bioxips és l'anàlisi per "clustering", on s'agrupen els gens o experiments en funció dels patrons que presenten les diferents mostres. Els mètodes de "clustering" poden ser:
En el nostre treball hem fet servir clustering jeràrquic. Primer de tot, vam accedir a la pàgina de GEPAS (Gene_Expression_Pattern_Analysis_Suite). Entràrem a:
Les funcions seleccionades foren: Log-transform en base 2 (recordem que shan de treure els valors negatius dels arxius als quals els vam assignar un valor de 10) i Standardize patterns. Això permet normalitzar les dades.
A continuació, per visualitzar l'arbre cliquem a send to cluster. La condició de Cluster que và posar són: UPGMA using correlation distance .
Funcionalitat dels gens.Per trobar informació tant de la funcionalitat com de processos biològics en els quals estan implicats els gens seleccionats vam utilitzar dues fonts:
A continuació per tal d'obtenir informació detallada de les funcions dels gens seleccionats, podem fer servir la web del NCBI
Obtenir els Representative mRNA Access. Anem a la web de SOURCE i introduïm la llista d'identificadors per tal d'aconseguir una nomenclatura gènica equivalent i poder comparar i analitzar els resultats.
Comparar dades. En el pas anteior hem obtingut arxius amb dues columnes, una amb els identificadors i l'altra amb els Representative mRNA Access corresponents. Per comparar els nostres resultats amb els de l'article necessitem fitxers on únicament tinguem un tipus d'identificador. Per això, hem realitzat les següents comandes en Shell (Unix):
A continuació ordenem les diferents llistes de gens i amb la comanda uniq agrupem els repetits per tal d'evitar sobreestimacions:
Per últim, per veure si hi ha gens coincidents entre els diferents estadis estudiats i l'article mencionat emprem les següents comandes:
Comentarem els resultats obtinguts en els dos articles estudiats i després els compararem amb els nostres.
Gene Discovery in Bladder Cancer Progression using cDNA Microarrays.
Segons l'article de Sanchez-Carbayo, els gens significativament sobreexpressats estarien relacionats amb:
Altres vies que presenten un patró d'expressió diferencial són: la regulació dels checkpoints com per exemple Cdc 16 (implicat en el punt de control de la formació del fus mitòtic) i els gens implicats en apoptosi com Bcl2.
Identifying distinct classes of bladder carcinoma using microarrays.
Comparant l'expressió gènica dels diferents estadis conclouen el següent:
Els nostres resultats.
A continuació es mostren els clusters obtinguts amb els gens amb un p-value inferior a 0,001:
Cluster progressió Ta-T1 |
Cluster progressió T1-T2 |
Cluster progressió Ta-T2 |
Tal com hem comentat anteriorment a Materials i Mètodes, mitjançant comandes en Shell vam intentar trobar gens presents tant en l'estudi de Sanchez-Carbayo com en els resultats obtinguts per nosaltres a partir del set de dades de l'altre article comentat.
Malauradament, no hem trobat gens comuns. De totes maneres, estudiarem els més significatius segons els clusters. A continuació indiquem aquests gens, la seva localització cromosòmica i la seva funció.
Gens diferencialment expressats en la progressió Ta-T1:
Sobreexpressats | Gene Symbol | Cromosoma | Funció |
---|---|---|---|
ETV6 | 12 | Factor de transcripció de la família ETS. | |
NPM1 | 5 | Fosfoproteïna nucleolar d'unió a RNA. | |
DDX3X | X | De la família "DEAD box proteins". Involucrada en: inici de traducció, splicing mitocondrial i nuclear, ensamblatge dels ribosomes. | |
RORC | 1 | Sistema immune: embriogènesi limfoide i regulació de la timopoiesis. | |
TNR | 1 | Desenvolupament embriològic. |
Reprimits | Gene Symbol | Cromosoma | Funció |
---|---|---|---|
DSC2 | 18 | Membre de la família de les cadherines. Important en les unions cèl.lula-cèl-lula. | |
VTN | 17 | Implicada en l'adhesió | |
NR4A3 | 9 | Activador de la transcripció | |
MEST | 7 | Juga un paper clau en el desenvolupament |
Gens diferencialment expressats en la progressió Ta-T2:
Sobreexpressats | Gene Symbol | Cromosoma | Funció |
---|---|---|---|
LAMA2 | 6 | Proteïna extracel.lular que regula adhesió, migració i organització cel.lular durant el desenvolupament embrionari. | |
VTN | 17 | Implicada en l'adhesió | |
MEST | 7 | Juga un paper clau en el desenvolupament | |
APOA1 | 11 | Metabolisme lipídic. Promou la sortida del colesterol des de diversos teixits cap al fetge. |
Reprimits | Gene Symbol | Cromosoma | Funció |
---|---|---|---|
CCR6 | 6 | Sistema Immune. Receptor de quimiocines de les cèl.lules T i dendrítiques. | |
AIF1 | 6 | Sistema Immune. Gens induït per citoquines i interferó. Contribueix a la resposta anti-imflamatòria. | |
TAF10 | 11 | Iniciació de la transcripció | |
JAG1 | 20 | Desenvolupament. Lligand del receptor notch 1. |
Com podem comprovar en les taules anteriors, els gens que nosaltres hem seleccionat com a més significatius tenen una funcionalitat similar als dels dos articles comentats. Així doncs, podem veure gens típicament relacionats amb els processos tumorals com la pèrdua d'adhesió, que estaria involucrada en processos de metàstasi; gens, la repressió dels quals, suposaria una pèrdua en l'eficàcia del sistema immune. També es veu alterat el metabolisme lipídic i, com era d'esperar, observem desregulació en el procés de la transcripció amb la conseqüent afectació del cicle cel.lular.
A continuació, mostrem les gràfiques obtingudes amb el FatyGO i GOCharts. A més de les funcions ja comentades anteriorment, cal destacar la importància del procés de mort cel.lular programada i l'oncogènesi. Després de la comparació amb les publicacions en les quals ens hem basat, treiem les mateixes conclusions que observant els clusters i així ratifiquem la funcionalitat dels gens diferencialment expressats en la progressió del càncer de bufeta.