Materials i Mètodes
Des del moment en què es va tenir constància de la seqüència a estudiar, es van realitzar una sèrie de passos per tal d'esbrinar a quin gen corresponia.
En primer lloc es va fer un TBLASTN amb la seqüència d'aminoàcids mitjançant la base de dades de l'ENSEMBLi un altre a partir de l'NCBI, per tal de comparar i assegurar-nos que es tractava d'una proteïna quimèrica. Així doncs, aquest primer pas va servir per veure que la seqüència proteica donada corresponia en realitat a dues parts fusionades de dues proteïnes diferents. Aquesta proteïna però no apareixia en les diferents bases de dades utilitzades ja que existeix únicament en patologia. Per aquest motiu es va optar per fer un estudi de les dues proteïnes per separat tinguent sempre present la nostra proteïna de fusió.
La informació referent a l'estructura genòmica dels dos gens de les dues proteïnes s'ha obtingut a partir de les següents bases de dades: ENSEMBL, GENOME BROWSER i GENE BANK. A partir de les quals s'ha comparat la informació obtinguda i s'han estudiat detalladament les discrepàncies presents entre elles. Es va seleccionar el Genome Browser com a font d'informació més significativa per coincidència amb l'NCBI, tot i que no es van descartar les dades obtingudes a l'Ensembl i també es van analitzar. Amb la informació dels dos gens per separat es va aconseguir determinar l'estructura genòmica completa de la proteïna de fusió.
A partir de l'NCBI es va fer servir l'opció BLASTN per trobar totes les seqüències de totes les espècies que presentéssin homologia amb la seqüència de nucleòtids del gen de fusió obtinguda a l'apartat anterior. A més a partir de l'ENSEMBL, HomoloGen i UNIGEN es van estudiar els possibles ortòlegs de les dues proteïnes wild type per comparar, completar i raonar els resultats obtinguts en l'anàlisi de la proteïna quimèrica.
Cal dir també que mitjançant el programa informàtic MEGA (Molecular Evolutionary Genetics Analysis) es van obtenir dades addicionals per comprovar o assegurar alguns dels resultats obtinguts per les bases de dades esmentades anteriorment.
L'expressió dels gens en diferents teixits o tipus de cèl·lules s'ha observat en diferents xips de microarrays presents al GENE SORTER i en imatges d'hibridació in situ obtingudes del VISIGENE.
Per una banda, a partir del GENOME BROWSER, base de dades considerada en un principi com a més significativa, s'han obtingut les regions promotores de les seqüències, que han servit per poder trobar els possibles factors de transcripció mitjançant la web del programa PROMO. Per altra banda, s'ha realitzat un programa Perl que ens ha permès obtenir i comparar els resultats pels diferents factors de transcripció.
Aquest últim apartat ha estat realitzat després de reunir informació procedent d'articles del PubMed i de la base de dades del GEN ONTOLOGY. Les corresponents referències es poden trobar al punt de referències i els respectius links als diferents apartats.