PROGRAMA 1:
Creador de exon fingerprint
El objetivo de este programa es convertir los datos de una base de datos tipo UCSC (tipo RefGene), en un archivo que contenga el EXON FINGERPRINT de cada uno de los exones para cada gen.
El programa pide que se le introduzca el nombre del archivo para el que se quiere encontrar el exon fingerprint, y también el nombre del archivo donde se pretende guardar este exon fingerprint.
El formato de los archivos RefGene es el siguiente. Cada elemento de la línea está separado por tabuladores, y en orden, cada elemento corresponde a:
Por ejemplo:
NM_153709 chr1 + 6007416 6009046 6008239 6008530 2 6007416,6007826, 6007454,6009046,
Estas listas puedes encontrarlas en la base de datos de la página genome.ucsc.edu/downloads
Tal como se comenta en la introducción, el formato del exon fingerprint de un gen consiste en:
Donde el exon fingerprint indica:
El fingerprint del anterior gen sería:
NM_153709 1 3:3:291
Hay que tener en cuenta que el formato de Fingerprint describe únicamente el CDS, no tiene en cuenta los exones no codificantes. Por ello nuestro programa, utilizando como referencia las posiciones de inicio y final de región codificante, selecciona los exones que vayan a contribuir a la región codificante, definiendo si fuera necesario nuevos exones. Así, el fingerprint de nuestro ejemplo sólo consiste en un exón.
Puedes ver aquí los fingerprints de todos los genes humanos obtenidos a partir de una archivo fechado en Julio 2003.
Si quieres bajarte este programa haz click AQUí
Este programa parte de un archivo que contiene apareamientos de genes ortólogos, y selecciona aquellas líneas que contienen genes de las 2 especies, los cuales se pretende alinear.
El programa requiere la introducción del nombre del archivo que contiene los pares de genes ortólogos, y el nombre de las dos especies en latín. También hay que especificar el nombre del archivo de salida.
Este tipo de ficheros se pueden obtener de la base de datos HomoloGene y están sometidos a revisiones periódicas. Nuestros datos están obtenidos a partir de la lista a fecha del 28/01/04.
Cada línea contiene en parejas los mejores matches entre genes ortólogos de especies diferentes.
El formato de este archivo es el mismo que tendrá el archivo de salida de este programa. Aquí tenemos un ejemplo:
9606|10090|B|LL.11277 |23595|AI673149|LL.22040 |17632|AW046809|85.9
El delimitador de campo es "|".
En el servidor puedes acceder a algunas listas de parejas de ortólogos ya realizadas con este programa. Para ir al servidor haz click AQUÍ . Como ejemplo, aquí presentamos los emparejamientos sólo de Homo sapiens y Mus musculus.
Para bajarte el programa selector de ortólogos haz click AQUÍ
Se trata de un programa muy simple que se encarga de emparejar los exon fingerprint de genes ortólogos de dos especies.
Utiliza dos fingerprints ya generados y selecciona los genes en función del archivo con la relación de ortología de estas dos especies.
Se le debe introducir los nombres de los archivos que contienen los fingerprints y el nombre de la especie del primer fingerprint. Esto se debe a que utilizamos un sistema de hashes, y necesitamos el nombre de la primera especie como referencia.También hay que indicar el nombre del archivo de salida.
Un ejemplo del formato de salida:
NM_052945 3 3:2:188 2:2:231 2:3:136 | NM_028075 3 3:2:179 2:2:204 2:3:145
Como vemos, el formato de salida consiste en el fingerprint de un gen, a continuación de su ortólogo separado por "|".Puedes ver aquí los apareamientos de genes ortólogos de humano y ratón
Para bajarte el programa selector de fingerprints ortólogos haz click AQUÍ
Se trata de un programa que utiliza un algoritmo de programación dinámica para alinear secuencias en formato de fingerprint.
Proporciona una puntuación basada en el match o mismatch de los elementos del triplete que conforma el exon fingerprint, penalizando los gaps.
El sistema de puntuaciones está explicado en el apartado de Objetivos.
También se penaliza diferencias significativas en el tamaño del CDS, del número de exones codificantes y diferencias en el tamaño de los exones.
Hay que tener en cuenta que a nivel evolutivo es bastante común que se produzcan fusiones entre exones, o que se produzcan separaciones. Por ello hemos implementado un sistema que comprueba si el alineamiento mejora o empeora si se fusionan determinados exones. Definimos como exones que se pueden fusionar, aquellos cuya suma de tamaños es parecida al tamaño del exón en la misma posición del gen ortólogo. Hemos decidido tomar como parecidos en tamaño todos aquellos exones que difieren en menos de seis nucleótidos.
El programa presenta finalmente el mejor alineamiento posible entre las dos especies.
Para funcionar el programa requiere un fichero con los fingerprints emparejados en el formato de salida del programa anterior. El formato de salida de este programa es:
Para conocer mejor el funcionamiento del programa puedes mirar las explicaciones de cada paso abriendo directamente el programa .
Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!
Para el servidor hemos hecho un programa que encadena los cuatro programas, para evitar tener que ir interrumpiendo el proceso a cada paso. Simplemente pide el nombre de los dos archivos RefGene, nombre de las dos especies y el archivo de donde extraer los genes ortólogos.
El formato de salida de este progama es el mismo que el anterior, pero en lugar de introducir los resultados en un nuevo archivo los muestra por pantalla.
Puedes acceder al programa haciendo click AQUÍ
Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!
Hemos creado otro programa además que en lugar de detallar todos los datos del alineamiento simplemente muestra los identificadores de ambos genes y el score del alineamiento.
El formato de salida de este programa es:
El objetivo de este formato es facilitar un análisis mas rápido y visual si lo único que se pretende es obtener la puntuación del alineamiento
Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!