Resultados y conclusiones


Hemos aplicado nuestro programa sobre el subconjunto de genes que tenemos en un fichero:

ENSG00000002016.4 ENSG00000002330.3 ENSG00000002549.2 ENSG00000002587.1 ENSG00000002726.3 ENSG00000002745.1 ENSG00000002746.2 ENSG00000002822.2 ENSG00000002834.4 ENSG00000002919.3 ENSG00000002933.1
Ver fichero

Una vez aplicado el programa, obtenemos un fichero de texto de la siguiente apariencia:

OUTPUT TRAN ENST00000005593.1 - ENSMUST00000016463.1     GENE ENSG00000005022.1 - ENSMUSG00000016319.1
OUTPUT TRAN ENST00000219069.1 - ENSMUST00000023176.1     GENE ENSG00000006194.1 - ENSMUSG00000022529.2
OUTPUT TRAN ENST00000016903.1 - ENSMUST00000041514.1     GENE ENSG00000015479.4 - ENSMUSG00000037236.1
OUTPUT TRAN ENST00000320339.2 - ENSMUST00000047486.1     GENE ENSG00000018610.2 - ENSMUSG00000006423.1
OUTPUT TRAN ENST00000071281.3 - ENSMUST00000023854.1     GENE ENSG00000022267.3 - ENSMUSG00000023092.2
OUTPUT TRAN ENST00000024563.1 - ENSMUST00000025940.2     GENE ENSG00000023041.1 - ENSMUSG00000024982.2
OUTPUT TRAN ENST00000266063.1 - ENSMUST00000026208.1     GENE ENSG00000023839.1 - ENSMUSG00000025194.1
OUTPUT TRAN ENST00000262374.1 - ENSMUST00000049207.2     GENE ENSG00000033011.1 - ENSMUSG00000039427.2
OUTPUT TRAN ENST00000039007.1 - ENSMUST00000033516.1     GENE ENSG00000036473.1 - ENSMUSG00000031173.2
OUTPUT TRAN ENST00000039007.1 - ENSMUST00000049910.2     GENE ENSG00000036473.1 - ENSMUSG00000031173.2
OUTPUT TRAN ENST00000261657.1 - ENSMUST00000038224.2     GENE ENSG00000038532.1 - ENSMUSG00000038050.2
OUTPUT TRAN ENST00000261657.1 - ENSMUST00000066345.1     GENE ENSG00000038532.1 - ENSMUSG00000038050.2
OUTPUT TRAN ENST00000265295.1 - ENSMUST00000020477.1     GENE ENSG00000040275.1 - ENSMUSG00000020245.1
OUTPUT TRAN ENST00000262094.1 - ENSMUST00000025389.1     GENE ENSG00000041353.1 - ENSMUSG00000024511.1
OUTPUT TRAN ENST00000266061.1 - ENSMUST00000026178.1     GENE ENSG00000043822.1 - ENSMUSG00000025178.2
OUTPUT TRAN ENST00000266061.1 - ENSMUST00000066778.1     GENE ENSG00000043822.1 - ENSMUSG00000025178.2
OUTPUT TRAN ENST00000265196.3 - ENSMUST00000042345.1     GENE ENSG00000044115.4 - ENSMUSG00000037815.1
OUTPUT TRAN ENST00000051619.1 - ENSMUST00000015486.1     GENE ENSG00000047597.1 - ENSMUSG00000015342.1
OUTPUT TRAN ENST00000219090.1 - ENSMUST00000067982.1     GENE ENSG00000048471.1 - ENSMUSG00000054743.1
OUTPUT TRAN ENST00000265984.1 - ENSMUST00000025979.1     GENE ENSG00000059573.1 - ENSMUSG00000025007.1
OUTPUT TRAN ENST00000319829.1 - ENSMUST00000012426.1     GENE ENSG00000061492.2 - ENSMUSG00000012282.1
OUTPUT TRAN ENST00000261367.4 - ENSMUST00000025414.1     GENE ENSG00000064692.4 - ENSMUSG00000024534.2
Ver fichero

Esto nos muestra los tránscritos ortólogos, es decir, los que tienen un 100% de homología de sus regiones de splicing y los genes a los que corresponden para cada una de las especies.

¿Por qué?

La apariencia de nuestro fichero de output tiene su razón de ser. En nuestro programa hemos dado la orden de imprimir en pantalla los siguientes datos (además de los resultados de la aplicació,n del programa de alineamiento múltiple clustalw, que se imprimen por defecto), que han sido recogidos en un fichero (ver fichero):

  1. "OUTPUT GENE $id - ",$gene_id2,"\n". Nos muestra todas las parejas de genes ortólogos que lee en función de la información con la que cuenta en sus ficheros de base.
  2. "no existe transcrito para el ortologo $gene_id2\n". Muestra todos aquellos genes presentes en nuestra lista inicial de genes humanos para los cuales el programa no encuentra ortólogo o tránscrito en los ficheros de base.
  3. "-->".$_. Imprime los resultados del programa exstral para todas las parejas de tránscritos de genes ortólogos que cuentan con más de un exón (condición indispensable para que se ejecute exstral, y que hemos definido en el programa).
  4. "OUTPUT TRAN $result[1] - $result[2] \t GENE $id - ",$gene_id2,"\n". Imprime todas aquellas parejas de tránscritos con su pareja correspondiente de genes ortólogos que presentan un 100% de homología (condición que hemos definido para obtener todos los tránscritos homólogos humano-ratón correspondientes a nuestra lista inicial de genes humanos).
  5. "$hpid tiene un solo exon \n" y "$mpid tiene un solo exon \n". Nos muestran aquellos tránscritos que no son procesados porque tienen solamente un exón y, por lo tanto, no pueden ser analizados por el programa exstral.
Una vez obtenido el fichero tratamos el archivo mediante el terminal y con comandos de UNIX para conseguir un nuevo fichero que nos mostrará los resultados vistos anteriormente.


¿Qué concluciones podemos extraer de la ejecución de nuestro programa?