BÚSQUEDA DE SECUENCIAS PROMOTORAS

INICIO Introducción D.melanogaster D.pseudoobscura A.mellifera A.gambiae Resultados conjuntos Discusión Autores Agradecimientos

Introducción




SIN3 y ASH2 son dos factores de transcripción esenciales para el desarrollo normal de la larva o pupa en Drosophila. SIN3 es una proteína que forma parte de un complejo multiprotéico (complejo SIN3) que act´ua en eucariotas como represor de la transcripción de varios genes.
Esta actividad represora es debida a la deacetilación de histonas, lo cual da lugar a la represión de genes cercanos a las regiones hipoacetiladas.
La proteína ASH2 es codificada por un gen miembro del grupo trithorax de genes homeóticos. ASH2 también actua mediante un complejo multiprotéico que controla la transcripción produciendo cambios en la estructura de la cromatina.
La mutación de una de estas dos proteínas en Drosophila hace imposible el desarrollo embrionario de la mosca. Recientemente se han publicado dos trabajos independientes en los que se han determinado, mediante tecnicas de microarray, aquellos genes que cambian el nivel de transcripción en moscas que tienen SIN3 mutado (Lori A. Pile et. al.) y en moscas que tienen ASH2 mutado (Sergi Beltran et. al.).
De esta forma se han identificado 354 genes cuya expresión es incrementada en ausencia de SIN3 y 35 genes que disminuyen su expresión ante la falta de actividad de SIN3.
Estos genes codifican proteínas con actividades muy diversas, desde algunas que actuan en ciclo celular (fase G2) hasta proteínas que participan en vías citosólicas y mitocondriales en la generación de enrgía para la célula.
En el caso de ASH2 se han identificado 235 genes cuyos niveles de expresión cambian significativamente en la mosca mutante. Las protéinas codificadas por estos genes también tienen diversas funciones entre las cuales podemos encontrar protéinas que regulan la prolifareción celular, ciclo celular o adhesión celular.
Dado que tanto SIN3 como ASH2 actuan a nivel de la cromatina y regulan la expresión de genes esenciales para el desarrollo de la larva de Drosophila, ha sido posible identificar 22 genes que están regulados tanto por SIN3 como por ASH2 en este organismo. Se cree que estos genes pueden estar regulados por un complejo protéico formado por SIN3 y ASH2, mediante el reconocimiento de una secuencia nucleotídica situada en la región promotora de estos genes. Nuestro trabajo ha consistido en poder determinar la posible secuencia nucleotídica reconocida por el complejo protéico probablemente formado por SIN3 y ASH2.











Materiales i metodos






Trabajamos siempre en entorno linux, utilizando diversos pogramas, entre los cuales se encuentran el MEME, MATSCAN, BLAST, y CLUSALW, trabajando en algunos casos desde la linea de comando, y en otros casos via servidor web.
Seguidamente, explicaremos el procedimiento, para ver los resultados estan en los diversos apartados de resultados.
En primer termino utilizamos los 22 promotores de D.melanogaster, para ver si existía cierto motivo común en todos los promotores, el motivo obtenido, junto a su matriz, se utilizaron de la siguente manera:
El programa MATSCAN, es un scipt que localiza el motivo que nosotros administramos mediante una matriz en ciertas sequencias. Nosotros buscamos en el motivo situado en los promotores de D.melanogaster y se obtuvieron ciertos "hits" lo que demuestró la aparición como la localización del motivo en nuestras sequencias.
A continació se comprbó como en D.melanogaster había hits en ciertos genes cerca del transcription start site (TSS), lo que apoya la teoría que el motivo encontrado podría ser una zona de unión a proteiínas reguladoras.


El siguiente paso fue, obtener los promotores de los genes ortólogos para las especies Drosophila pseudoobscura, Anopheles gambiae y Apis mellifera.
La busqueda de los ortólogos se realizó de forma diferent. Para A.gambiae se utilizó el ENSEMBL, ya que su genoma esta sequenciado y anotado, además existe una opción (en ENSMART) que adem´s de mostrarte directamente los ortólogos entre D.melanogaster y A.gambiaete proprciona la secuencia deseada, por lo que la obtención de estos promotores fue relativamente fácil.
En los casos de D.pseudoobscura y A.mellifera la cosa fue más complicada debido a varios factores, entre los cuales se encuentran la tardanza en colgar los ficheros de los genomas para poder efectuar BLAST en lineas de comandos, y que los genomas estaban sequenciados pero no anotados, por lo que de lo único que disponiamos era de ficheros on-line de ciero tamaño.
Para la obtención de las regiones promotoras de los dos últimos organismos tuvimos que efectuar tBLASTx ya que el BLASTn no era lo suficientemente sensible para encontrar homologias. Para la extracción de los genes utilizamos los 600 primeros nt del cDNA de las secuencias de D.melanogaster contra todo los genemoas del reso de especies. Una vez localizabamos las sequencias supuestamente ortólogas extraimos los 2000 nt upstream del hit obtenido mediante tBLASTx.
Pero este sistema tiene dos grandes inconvenientes, el primero de ellos es que como los archivos de las seuencias no estaban ensamblados, no siempre podíamos obtener los 2000 nt de interés y nos teníamos que conformar 500-700 nt que era desde donde estaba hit, hasta el final de archivo. El segundo problema es que debido a que los genes no estan anotados, no podríamos determinar el TSS con seguridad, por lo que no podremos saber la distancia de los posibles dominios que encontremos a el TSS con toda seguridad.
Para solucionar el problema de la distancia de localozación del TSS en las sequencias promotoras de D.pseodoobscura y A.mellifera comparamos una sequencia promotora de estas dos sp. en las que presuntamente se conservaba nuestro dominio y la comparamos con los 100 primeros nt de su cDNA ortologo en D.melanogaster. Los resultados obtenidos se detallan en la parte de reslutados conjuntos.


Una vez obtenidas la secuencias de nuestros promotores se lanzó contra ellas, la matriz obtenida en el MEME de la D.melanogaster con diversos tresholds y se obtuvieron los resultados que se detallan en apartados posteriores.
Otra prueba realizada fue buscar con MEME nuevos dominios en cada una de las especies y mirar si se parecían en alguna cosa. Los resulatdos también se encuentran en el apartado de resultados conjutos.
Finalmente comparamos las secuencias de los hits de cada una de las regiones promotoras de genes ortólogos utilizando el CLUSTALW, y mirando a ver si se conservaba alguna región más pequeña en los grupos de genes ortólogos. Los resultados se encuntran también en la zona de resultados conjuntos.