El objetivo principal en nuestro proyecto es el análisis de la conservación de la estructura exónica entre genomas de metazoos. Para poder llevar a cabo este análisis, comparamos los "exon fingerprints" de los tránscritos ortólogos de las especies a estudiar.¿Qué es un exon fingerprint?
El exon fingerprint es una expresión que nos describe cada uno de los tránscritos de un gen y sus diferentes exones, proporcionándonos la información adecuada para poder observar diferencias "estructurales" entre los diferentes tránscritos ortólogos.
Ejemplo:
ENSG00000100823.1 ENST00000216714.1 4 ( 0 : 2 : 58 ) ( 2 : 0 : 188 ) ( 0 : 2 : 193 ) ( 2 : 0 : 515 )
- En primer y segundo lugar se sitúan los identificadores de gen y tránscrito respectivamente.
- A continuación nos proporciona información sobre el número de exones codificantes que tiene el tránscrito.
- Y finalmente nos describe cada uno de los exones mediante "tripletes" de información como el siguiente:
( 0 : 2 : 58 )
- Primera posición: Fase de lectura del extremo 5'.
- Segunda posición: Fase de lectura del extremo 3'.
- Tercera posición: Longitud del exón.
Debemos tener en cuenta que un exón fingerprint cumple las siguientes normas:
- Sólo describe los exones codificantes (el CDS). Aquellos exones que no forman parte del CDS no se ven representados.
- De los exones inicial y final sólo está incluida su región codificante. El codón de inicio de transcripción (ATG, codifica para Met) está incluido en la región codificante, mientras que el codón de STOP (TGA, TAA, TAG) no se incluye, por lo tanto no está considerado en la longitud del <imo exón de cada tránscrito.
- La pauta de lectura se debe mantener entre los distintos exones de un tránscrito. Es decir, la fase de lectura del extremo 3' de un exón tiene que coincidir con la fase de lectura del extremo 5' del siguiente exón.
En la comparación de tripletes entre tránscritos de genes que sabemos que son ortólogos, podemos definir diferentes tipos de conservación estructural:
- Tipo 1: Tránscritos con igual número de exones.
- Tipo 1.1: Tránscritos exactamente iguales.
- Tipo 1.2: Tránscritos de igual número de exones pero con uno o más exones con fases diferentes.
- Tipo 1.3: Tránscritos de igual número de exones pero con uno o más exones con longitudes diferentes.
- Tipo 1.4: Tránscritos de igual número de exones pero con uno o más exones con fases y longitudes diferentes.
- Tipo 2: Tránscritos con diferente número de exones.
- Tipo 2.1: Tránscritos con diferente número de exones, pero los exones compartidos exactamente iguales.
- Tipo 2.2: Tránscritos con diferente número de exones y con uno o más exones con fases diferentes.
- Tipo 2.2: Tránscritos con diferente número de exones y con uno o más exones con longitudes diferentes.
- Tipo 2.2: Tránscritos con diferente número de exones y con uno o más exones con fases y longitudes diferentes.
Estudiando las proporciones halladas de cada tipo al comparar las diferentes especies, podemos obtener la información sobre el grado de conservación de la estructura exónica. Consideraremos que los tránscritos ortólogos comparados tendrán igual estructura cuando todos sus exones sean exactamente iguales, o bien tengan longitudes diferentes con fases conservadas, lo cual significará que ha habido una delección o inserción de uno o más tripletes.