ANÁLISIS INTERESPECÍFICO

ANÁLISIS INTERESPECÍFICO

En este apartado se muestran los resultados del análisis común para las cuatro especies. De este modo, se pretende que se pueda observar las tendencias propias de cada especie respecto a las demás.

Esta gráfica nos muestra el número de proteínas del genoma de cada especie analizada y el número de proteínas que son exclusivas de cada especie, es decir, que no se comparten con ninguna de las otras tres especies. Estos resultados son muy variados.
En los 4 genomas la cifra de proteínas del genoma entero es parecida: alrededor de 30.000. Las diferencias en el número de proteínas exclusivas, en cambio, son considerables. En el caso de Tetraodon nigroviridis podemos observar que cerca del 23% de sus proteínas son exclusivas, mientras que el resultado más bajo es para Fugu rubripes, ya que esta cifra es del 12% (casi la mitad que para Tetraodon).

Esta gráfica muestra la proporción de proteínas sin repeticiones por cada proteína con repeticiones. Los resultados son variados. En todos los casos la relación es superior a 6:1, aunque para Fugu rubripes y Homo sapiens el porcentaje de proteínas con repeticiones es el 16% mientras que para Gallus gallus esta cifra es muy inferior, del 10%.

Esta gráfica analiza la tipología de proteínas para el genoma humano. Podemos dividir su genoma en tres tipos de proteínas: aquellas que comparte con las otras tres especies (llamadas conservadas), aquellas que no comparte con las otras tres especies (llamadas exclusivas) y el tercer grupo, que llamamos "resto", que son aquellas proteínas que comparte con alguna de las tres especies pero no con todas ellas.
Podemos ver que tan sólo una cuarta parte de las proteínas humanas no tienen relación con ninguna de las otras tres especies (presumiblemente se trate de las proteínas que marcan camino a mamífero, o aún no se ha sabido relacionar con los otros genomas).

En esta gráfica comparamos el valor de proteínas exclusivas (no compartidas con las otras 3 especies analizadas) y podemos ver que Tetraodon nigroviridis tiene casi un tercio de proteínas exclusivas, mientras que para Fugu rubripes esta cifra no representa ni un sexto del genoma. Veremos que esta diferencia tan notable entre estas dos especies pertenecientes a la misma familia (Tetraodontidae) es contínua para muchos aspectos.
En este gráfica, en cambio, se muestra el porcentaje de proteínas con repeticiones para todo el genoma de cada especie. En este caso se observa que Gallus gallus tiene el valor más bajo (ronda el 10% de proteínas con repeticiones). En general, Gallus gallus muestra los valores más pequeños en todo lo concerniente a las repeticiones (número absoluto, número de repeticiones largas...).
En esta gráfica podemos observar que el porcentaje de proteínas con repeticiones es mucho menor en el grupo de proteínas exclusivas. Esto ocurre en todas las especies. En general, la relación suele ser de casi 2 a 1 para el genoma entero. Destaca el caso de Tetraodon nigroviridis , en el que esta relación es aún más alta (casi 2'5). El caso más pobre, como ocurre en todos los casos, es el de Gallus gallus.
En esta tabla se muestran los valores porcentuales de número de repeticiones y longitud media para cada aminoácido en las cuatro especies.
Esta gráfica muestra, en números absolutos, el número de casos de repeticiones por aminoácido para los 4 genomas. Cada caso particular se estudia en el análisis de cada especie, pero podemos observar como los aminoácidos más repetidos son un grupo de 5 o 6 (A,E,P,S,G y L). En cuanto a los aminoácidos poco abundantes en repeticiones, destacar que W (Triptófano) está ausente en los cuatro genomas y que C (cisteína) está muy presente en Fugu rubripes.
En este último gráfico se puede observar la longitud media de cada caso de repeticiones por aminoácido y especie. Destaca que: la media oscila alrededor de 6, Gallus gallus muestra los valores más bajos, H y Q suelen ser los que tienen repeticiones más largas, y que en Fugu rubripes C se dispara hasta una media de 11,5 unidades de media por repetición.
Es visible la poca diferencia existente en contenido GC entre las proteínas del genoma de cada especie, si se analiza separando las que tienen repeticiones de las que no tienen repeticiones. Vemos que en todos los casos la diferencia para con las proteínas con repeticiones es menor del 2%. Además, en el caso de Gallus gallus el contenido de GC es menor en aquellas que tienen repeticiones. Cabe comentar que estos casos son cogiendo una muestra aleatoria del 10% en cada caso, para poder trabajar mejor con el programa estadístico SPSS.
En esta tabla se muestran los porcentajes de aparición de aminoácidos según la clasificación de Lehninger en las proteínas con repeticiones de las cuatro especies. Vemos como los porcentajes de hidrófilos son más altos que los hidrófobos y que los ácidos son más abundantes que los básicos. Destaca que en humano (ver análisis para humano) la diferencia entre los hidrófilos e hidrófobos no es tan grande.
Esta gráfica indica lo mismo pero analizando en este caso el grupo de las proteínas exclusivas. Podemos ver que los resultados son equivalentes a los del caso anterior. En el caso de Gallus gallus sigue produciéndose una inversión en las barras. Es observable, además, que los porcentajes para Gallus gallus se alzan hasta el 50%, parejo a los valores de los demás casos.


ANÁLISIS ESTADÍSTICO DEL CONTENIDO GC Y LONGITUD DE REPETICIÓN

En este caso hemos realizado un estadístico de T de Student para muestras independientes entre proteínas con repeticiones versus sin repeticiones agrupando las proteínas exclusivas de las 4 especies. Hemos realizado la prueba para contenido GC y para longitud de proteína. Para longitud de proteína podemos observar que la media de las proteínas con repeticiones es el doble de sin repeticiones. La significancia de 0,000 nos confirma que, efectivamente, se trata de dos grupos perfectamente diferenciados, y podemos afirmar con seguridad estadística que el tener repeticiones va acompañado de una mayor longitud de proteína.

En cambio, el estadístico del contenido de GC es de 0,006. Teniendo en cuenta una fiabilidad del 95%, no podemos afirmar que el hecho de que haya diferente media no se deba al azar, aunque el sentido común nos hace ver que el estadístico es cercano a 0,005 y, por tanto, casi podríamos asumir que sí. De todos modos, cabe tener en cuenta que la diferencia de medias es muy pequeña, menor al 2%.



En este caso hemos hecho la misma prueba pero para genomas enteros. En ambos casos (GC y longitud) el valor del estadístico es de 0,000. Esto nos permite concluir que hay un diferente contenido GC y longitud de proteína entre aquellas proteínas que tienen repeticiones y aquellas que no. Por tanto, las proteínas con repeticiones del genoma entero tienen una longitud más larga y un contenido en GC más alto.


VOLVER AL ÍNDICE DE RESULTADOS


CONTENIDOS DE LA WEB

Urko Martinez Marigorta & Ixabel Mendizabal Ezeizabarrena