Introducció i Objectius


El càncer ha esdevingut en els darrers anys una de les patologies amb més incidència en la societat occidental. Un dels principals camps d'investigació en la biomedicina és l'enfocat al diagnòstic i tractament del càncer. El desenvolupament tecnològic i el de la biologia molecular ha permès obtenir diverses eines de diagnòstic. Entre aquestes destaquem la tècnica de DNA microarrays, la qual permet caracteritzar l'expressió diferencial de gens en teixits tumorals podent, d'aquesta manera, extraure conclusions sobre quins són els gens implicats en la malaltia. Aquesta caracterització d'expressió gènica possibilita un diagnòstic fiable i relativament ràpid. D'altra banda, el coneixement d'aquests gens/proteïnes obre les portes a nous tractaments.

En el nostre projecte estudiarem l'expressió gènica diferencial en els diversos estadis del càncer de bufeta. Basant-nos en dades de DNA microarrays i emprant diverses eines informàtiques buscarem:

Amb aquesta informació intentarem extreure conclusions pel que fa a tècniques de diagnòstic i a l'ús d'aquests gens com a diana terapèutica.

Per dur a terme el nostre estudi ens hem basat en dos papers:




tornar cap a dalt



Materials i Mètodes


Obtenció de la base de dades. Per trobar la bases de dades de microarrays que van fer servir en l'article citat anteriorment "Identifying distinct classes of bladder carcinoma using microarrays" vam accedir a Gene_Expression_Omnibus (GEO) a partir de la web del NCBI.

El set de dades Bladder tumor stage classification de canal simple és la corresponent al paper. A continuació vam seleccionar les mostres dels estadis tumorals Ta, T1 i T2+.

Selecció de valors d'expressió significatius. En aquest pas vam fer l'estudi estadístic basat en R-script en una web proporcionada pel tutor: nin.crg.es/cgi-bin/pMargeWeb.cgi.

Primer de tot, vam identificar les mostres corresponents a cada estadi i vam crear tres arxius: Ta-T1, T1-T2 i Ta-T2. A partir d'aquí obtinguérem els valors de p-value, el quals ens indiquen la significància de l'expressió diferencial en cada estadi. En el nostre estudi, seleccionàrem els gens amb p-values inferiors a 0,001 (p<0,001). Aquest càlcul el vam fer en una fulla Excel seguint el procediment:

seleccionar columna----Datos----Filtro----Autofiltro----Autofiltro personalizado: "es menor que 0,001"

Amb aquesta selecció ens vam quedar amb 138 gens diferencialment expressats en Ta-T1, 9 en T1-T2 i 103 gens en Ta-T2, que seran els que analitzarem.

Cerca del "Gene Symbol". Amb el programa EASE, a partir dels identificadors dels gens obtenim els "gene symbols" que posteriorment ens seran útils per analitzar els resultats.

El programa EASE l'hem baixat de la web de DAVID (Database for Annotation, Visualization and Integrated Discovery), hem introduït els identificadors dels gens a "Input Genes" i hem clicat a Annotate Genes. Amb aquest procediment hem obtingut informació diversa com el "gene symbol", funcionalitat, localització cromosòmica...

Agrupaments. Una de les eines més freqüentment emprades en l'anàlisi de la informació procedent dels bioxips és l'anàlisi per "clustering", on s'agrupen els gens o experiments en funció dels patrons que presenten les diferents mostres. Els mètodes de "clustering" poden ser:

En el nostre treball hem fet servir clustering jeràrquic. Primer de tot, vam accedir a la pàgina de GEPAS (Gene_Expression_Pattern_Analysis_Suite). Entràrem a:

Tools---Preprocessing DNA array data files

Les funcions seleccionades foren: Log-transform en base 2 (recordem que shan de treure els valors negatius dels arxius als quals els vam assignar un valor de 10) i Standardize patterns. Això permet normalitzar les dades.

A continuació, per visualitzar l'arbre cliquem a send to cluster. La condició de Cluster que và posar són: UPGMA using correlation distance .

Funcionalitat dels gens.Per trobar informació tant de la funcionalitat com de processos biològics en els quals estan implicats els gens seleccionats vam utilitzar dues fonts:

A continuació per tal d'obtenir informació detallada de les funcions dels gens seleccionats, podem fer servir la web del NCBI

Obtenir els Representative mRNA Access. Anem a la web de SOURCE i introduïm la llista d'identificadors per tal d'aconseguir una nomenclatura gènica equivalent i poder comparar i analitzar els resultats.

Comparar dades. En el pas anteior hem obtingut arxius amb dues columnes, una amb els identificadors i l'altra amb els Representative mRNA Access corresponents. Per comparar els nostres resultats amb els de l'article necessitem fitxers on únicament tinguem un tipus d'identificador. Per això, hem realitzat les següents comandes en Shell (Unix):

cut -f2 Sanchez_NM.txt*
cut -f2 TaT1_NM.txt
cut -f2 T1T2_NM.txt
cut -f2 TaT2_NM.txt

* aquest fitxer correspon a les dades de l'article de Sanchez-Carbayo

A continuació ordenem les diferents llistes de gens i amb la comanda uniq agrupem els repetits per tal d'evitar sobreestimacions:

sort Sanchez_NM.txt | uniq > Sanchez.txt
sort TaT1_NM.txt | uniq > TaT1NM.txt
sort T1T2_NM.txt | uniq > T1T2NM.txt
sort TaT2_NM.txt | uniq > TaT2NM.txt

Per últim, per veure si hi ha gens coincidents entre els diferents estadis estudiats i l'article mencionat emprem les següents comandes:

cat Sanchez.txt TaT1NM.txt | sort | uniq -c
cat Sanchez.txt T1T2NM.txt | sort | uniq -c
cat Sanchez.txt TaT2NM.txt | sort | uniq -c


tornar cap a dalt




Resultats i Discussió

Comentarem els resultats obtinguts en els dos articles estudiats i després els compararem amb els nostres.

Gene Discovery in Bladder Cancer Progression using cDNA Microarrays.
Segons l'article de Sanchez-Carbayo, els gens significativament sobreexpressats estarien relacionats amb:

Observen una repressió remarcable de gens involucrats en:

Altres vies que presenten un patró d'expressió diferencial són: la regulació dels checkpoints com per exemple Cdc 16 (implicat en el punt de control de la formació del fus mitòtic) i els gens implicats en apoptosi com Bcl2.

Identifying distinct classes of bladder carcinoma using microarrays.

Comparant l'expressió gènica dels diferents estadis conclouen el següent:


Els nostres resultats.

A continuació es mostren els clusters obtinguts amb els gens amb un p-value inferior a 0,001:


Cluster progressió Ta-T1

Cluster progressió T1-T2

Cluster progressió Ta-T2
*Clicant a sobre de les imatges, podreu visualitzar-les.

Tal com hem comentat anteriorment a Materials i Mètodes, mitjançant comandes en Shell vam intentar trobar gens presents tant en l'estudi de Sanchez-Carbayo com en els resultats obtinguts per nosaltres a partir del set de dades de l'altre article comentat.

Malauradament, no hem trobat gens comuns. De totes maneres, estudiarem els més significatius segons els clusters. A continuació indiquem aquests gens, la seva localització cromosòmica i la seva funció.

Gens diferencialment expressats en la progressió Ta-T1:

Sobreexpressats Gene Symbol Cromosoma Funció
ETV6 12 Factor de transcripció de la família ETS.
NPM1 5 Fosfoproteïna nucleolar d'unió a RNA.
DDX3X X De la família "DEAD box proteins". Involucrada en: inici de traducció, splicing mitocondrial i nuclear, ensamblatge dels ribosomes.
RORC 1 Sistema immune: embriogènesi limfoide i regulació de la timopoiesis.
TNR 1 Desenvolupament embriològic.


Reprimits Gene Symbol Cromosoma Funció
DSC2 18 Membre de la família de les cadherines. Important en les unions cèl.lula-cèl-lula.
VTN 17 Implicada en l'adhesió
NR4A3 9 Activador de la transcripció
MEST 7 Juga un paper clau en el desenvolupament



Gens diferencialment expressats en la progressió Ta-T2:

Sobreexpressats Gene Symbol Cromosoma Funció
LAMA2 6 Proteïna extracel.lular que regula adhesió, migració i organització cel.lular durant el desenvolupament embrionari.
VTN 17 Implicada en l'adhesió
MEST 7 Juga un paper clau en el desenvolupament
APOA1 11 Metabolisme lipídic. Promou la sortida del colesterol des de diversos teixits cap al fetge.


Reprimits Gene Symbol Cromosoma Funció
CCR6 6 Sistema Immune. Receptor de quimiocines de les cèl.lules T i dendrítiques.
AIF1 6 Sistema Immune. Gens induït per citoquines i interferó. Contribueix a la resposta anti-imflamatòria.
TAF10 11 Iniciació de la transcripció
JAG1 20 Desenvolupament. Lligand del receptor notch 1.




Com podem comprovar en les taules anteriors, els gens que nosaltres hem seleccionat com a més significatius tenen una funcionalitat similar als dels dos articles comentats. Així doncs, podem veure gens típicament relacionats amb els processos tumorals com la pèrdua d'adhesió, que estaria involucrada en processos de metàstasi; gens, la repressió dels quals, suposaria una pèrdua en l'eficàcia del sistema immune. També es veu alterat el metabolisme lipídic i, com era d'esperar, observem desregulació en el procés de la transcripció amb la conseqüent afectació del cicle cel.lular.

A continuació, mostrem les gràfiques obtingudes amb el FatyGO i GOCharts. A més de les funcions ja comentades anteriorment, cal destacar la importància del procés de mort cel.lular programada i l'oncogènesi. Després de la comparació amb les publicacions en les quals ens hem basat, treiem les mateixes conclusions que observant els clusters i així ratifiquem la funcionalitat dels gens diferencialment expressats en la progressió del càncer de bufeta.


Gràfic fatyGO Ta-T1.

Gràfic fatyGO T1-T2

Gràfic fatyGO Ta-T2.

Gràfic GOCharts Ta-T1

Gràfic GOCharts T1-T2

Gràfic GOCharts Ta-T2

tornar cap a dalt




Conclusions


Realitzar aquest treball ens ha servit principalment per adonar-nos de la gran importància de les eines informàtiques en el camp de la biologia. En concret en el nostre projecte, la bioinformàtica esdevé essencial en l'anàlisi de les dades obtingudes a partir dels processos experimentals.

La tecnologia de cDNA Microarrays ens facilita la identificació de marcadors moleculars amb una significància clínica potencial tant pel que fa a diagnòstic com pel tractament. A més a més, el coneixement del perfil d'expressió gènica al llarg de l'evolució del càncer, ens permet identificar els processos cel.lulars responsables d'aquesta patologia.

Finalment hem concluït que aquests avenços obren les portes per aconseguir tractaments més eficaços i específics dels actuals.


tornar cap a dalt