PROGRAMA 1: Creador de exon fingerprint

El objetivo de este programa es convertir los datos de una base de datos tipo UCSC (tipo RefGene), en un archivo que contenga el EXON FINGERPRINT de cada uno de los exones para cada gen.

El programa pide que se le introduzca el nombre del archivo para el que se quiere encontrar el exon fingerprint, y también el nombre del archivo donde se pretende guardar este exon fingerprint.

El formato de los archivos RefGene es el siguiente. Cada elemento de la línea está separado por tabuladores, y en orden, cada elemento corresponde a:

  1. Nombre del gen
  2. Nombre del cromosoma
  3. Cadena + o -
  4. Posición de inicio de transcripción
  5. Posición de final de transcripción
  6. Inicio de la región codificante
  7. Final de la región codificante
  8. Número de exones
  9. Posiciones de inicio de los exones
  10. Posiciones de final de los exones

Por ejemplo:

NM_153709 	chr1	+	6007416	6009046	6008239	6008530 	2	6007416,6007826,	6007454,6009046,

Estas listas puedes encontrarlas en la base de datos de la página genome.ucsc.edu/downloads

Tal como se comenta en la introducción, el formato del exon fingerprint de un gen consiste en:

Donde el exon fingerprint indica:

El fingerprint del anterior gen sería:

NM_153709    1    3:3:291

Hay que tener en cuenta que el formato de Fingerprint describe únicamente el CDS, no tiene en cuenta los exones no codificantes. Por ello nuestro programa, utilizando como referencia las posiciones de inicio y final de región codificante, selecciona los exones que vayan a contribuir a la región codificante, definiendo si fuera necesario nuevos exones. Así, el fingerprint de nuestro ejemplo sólo consiste en un exón.

Puedes ver aquí los fingerprints de todos los genes humanos obtenidos a partir de una archivo fechado en Julio 2003.

Si quieres bajarte este programa haz click AQUí



PROGRAMA 2: Selector de ortólogos

Este programa parte de un archivo que contiene apareamientos de genes ortólogos, y selecciona aquellas líneas que contienen genes de las 2 especies, los cuales se pretende alinear.

El programa requiere la introducción del nombre del archivo que contiene los pares de genes ortólogos, y el nombre de las dos especies en latín. También hay que especificar el nombre del archivo de salida.

Este tipo de ficheros se pueden obtener de la base de datos HomoloGene y están sometidos a revisiones periódicas. Nuestros datos están obtenidos a partir de la lista a fecha del 28/01/04.

Cada línea contiene en parejas los mejores matches entre genes ortólogos de especies diferentes.

El formato de este archivo es el mismo que tendrá el archivo de salida de este programa. Aquí tenemos un ejemplo:

 9606|10090|B|LL.11277 |23595|AI673149|LL.22040 |17632|AW046809|85.9

El delimitador de campo es "|".

En el servidor puedes acceder a algunas listas de parejas de ortólogos ya realizadas con este programa. Para ir al servidor haz click AQUÍ . Como ejemplo, aquí presentamos los emparejamientos sólo de Homo sapiens y Mus musculus.

Para bajarte el programa selector de ortólogos haz click AQUÍ



PROGRAMA 3: Selector de fingerprints ortólogos

Se trata de un programa muy simple que se encarga de emparejar los exon fingerprint de genes ortólogos de dos especies.

Utiliza dos fingerprints ya generados y selecciona los genes en función del archivo con la relación de ortología de estas dos especies.

Se le debe introducir los nombres de los archivos que contienen los fingerprints y el nombre de la especie del primer fingerprint. Esto se debe a que utilizamos un sistema de hashes, y necesitamos el nombre de la primera especie como referencia.También hay que indicar el nombre del archivo de salida.

Un ejemplo del formato de salida:

NM_052945       3       3:2:188 2:2:231 2:3:136         |       NM_028075       3       3:2:179 2:2:204 2:3:145

Como vemos, el formato de salida consiste en el fingerprint de un gen, a continuación de su ortólogo separado por "|".Puedes ver aquí los apareamientos de genes ortólogos de humano y ratón

Para bajarte el programa selector de fingerprints ortólogos haz click AQUÍ



PROGRAMA 4: Alineador de exon fingerprints

Se trata de un programa que utiliza un algoritmo de programación dinámica para alinear secuencias en formato de fingerprint.

Proporciona una puntuación basada en el match o mismatch de los elementos del triplete que conforma el exon fingerprint, penalizando los gaps.

El sistema de puntuaciones está explicado en el apartado de Objetivos.

También se penaliza diferencias significativas en el tamaño del CDS, del número de exones codificantes y diferencias en el tamaño de los exones.

Hay que tener en cuenta que a nivel evolutivo es bastante común que se produzcan fusiones entre exones, o que se produzcan separaciones. Por ello hemos implementado un sistema que comprueba si el alineamiento mejora o empeora si se fusionan determinados exones. Definimos como exones que se pueden fusionar, aquellos cuya suma de tamaños es parecida al tamaño del exón en la misma posición del gen ortólogo. Hemos decidido tomar como parecidos en tamaño todos aquellos exones que difieren en menos de seis nucleótidos.

El programa presenta finalmente el mejor alineamiento posible entre las dos especies.

Para funcionar el programa requiere un fichero con los fingerprints emparejados en el formato de salida del programa anterior. El formato de salida de este programa es:

Para conocer mejor el funcionamiento del programa puedes mirar las explicaciones de cada paso abriendo directamente el programa .

Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!



ExFingx

Para el servidor hemos hecho un programa que encadena los cuatro programas, para evitar tener que ir interrumpiendo el proceso a cada paso. Simplemente pide el nombre de los dos archivos RefGene, nombre de las dos especies y el archivo de donde extraer los genes ortólogos.

El formato de salida de este progama es el mismo que el anterior, pero en lugar de introducir los resultados en un nuevo archivo los muestra por pantalla.

Puedes acceder al programa haciendo click AQUÍ

Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!

Hemos creado otro programa además que en lugar de detallar todos los datos del alineamiento simplemente muestra los identificadores de ambos genes y el score del alineamiento.

El formato de salida de este programa es:

El objetivo de este formato es facilitar un análisis mas rápido y visual si lo único que se pretende es obtener la puntuación del alineamiento

Para ver el resultado del alineamiento de los ortólogos de humano y ratón haz click aquí!