ANÁLISIS PARA HOMO SAPIENS

Los resultados de esta gráfica muestran los números absolutos de casos de repeticiones para el genoma de Homo sapiens. A diferencia de las otras 3 especies, destaca el dato de que los tres residuos más comunes en las otras especies (E,P y S) desaparece, y entra en tercera posición el aminoácido A (después de E y P). Además, destaca el alto número de G y L, al nivel de S (995 casos). Por la parte baja, destacar la poca presencia de M(2) y Y(1). Como en los demás casos, no hay ningún caso de repetición de W.
Este gráfico muestra la presencia de 5-6 casos líderes en el caso de humanos, que oscila del 17% de E al 12% de L y S. Se reafirma los casos de A (14%), cuando en los otros genomas no superaba el 10%.
En este caso vemos la distribución de frecuencias porcentuales por aminoácidos en Homo sapiens siguiendo la clasificación de Lehninger. También están añadidos los datos de usos de aminoácidos a nivel de todo el proteoma humano, no tan sólo en los casos de repeticiones. Comparado con las otras tres especies, en el caso de Homo sapiens destaca la alta prevalencia de aminoácidos de carácter hidrófobo en los casos de repeticiones, llegando a ser casi del 30%.Comparando los datos con los de todo el genoma humano, podemos observar que en las proteínas con repeticiones hay un aumento del porcentaje de aminoácidos ácidos (del 12% al 20%) e hidrófilos(del 40% al 47%).
En esta gráfica se observa la longitud media de repeticiones por caso en cada aminoácido. El valor ronda la cifra de 6,5 (segunda cifra más alta, por detrás de Fugu rubripes). Destacan dos casos, la H y, sobretodo, Q, el valor más alto con 8,5 de longitud media.
Los casos de más de 15 repeticiones de longitud en Homo sapiens son de 125 en números absolutos. Este dato es muy inferior a Fugu rubripes (208) pero muy superior a Tetraodon nigroviridis (54) y Gallus gallus (5).En cuanto a aminoácidos, podemos ver una alta prevalencia de Q (41%), muy por encima de su frecuencia a nivel general de repeticiones (6%). Los demás son concordantes con su prevalencia general, aunque destaca la poca presencia de P (4%) y la ausencia de L (en general es de 12%).
Si se realiza un filtraje para repeticiones de más de 25 aminoácidos de longitud quedan tan sólo 21 casos de repeticiones extralargas. Vemos que se dispara la frecuencia de Q (76%), con lo que se reafirma su peso en aquellos casos de repeticiones extralargas.
Esta gráfica es muy interesante, ya que nos permite observar las tres situaciones que hemos encontrado, las tres en la misma especie: genoma entero, proteínas comunes y proteínas exclusivas en Homo sapiens . Los datos de contenido GC son parejos en las tres situaciones, en cambio, los de porcentaje de repeticiones no. Si consideramos el grupo de las exclusivas como indicador del propio camino evolutivo de Homo sapiens , aquellas que, en el grupo de vertebrados "nos hacen mamífero", vemos que la tendencia ha sido aumentar claramente el contenido GC, pero a la vez, perder porcentaje de repeticiones. En cambio, en el caso de las comunes, es decir, las que podemos considerar "necesarias para ser vertebrados", podemos observar que el contenido GC es el más pequeño pero el porcentaje de proteínas con repeticiones es muy alto (20%).



PROTEÍNAS DE HOMO SAPIENS CONSERVADAS EN LAS OTRAS ESPECIES

Estas gráficas pertenecen al análisis de las repeticiones de aquellas proteínas humanas que también están conservadas en las otras tres especies (un 25% del genoma humano).


Vemos que los resultados son muy parecidos a los datos generales de frecuencia de repeticiones de todo el genoma humano: son destables A,E,G,L,P y S. Es interesante que en general el número es la mitad del número general del genoma entero: es decir, ¡la mitad de los casos de repeticiones en humano se encuentran en este 25% de proteínas conservadas!
En este gráfica se observa la distribución de repeticiones por aminoácido en datos porcentuales. Como se ve en otros genomas, destacan los aminoácidos E,P,S,A,L y G. Es notorio que la primera posición corresponde a E, pero sin diferencias significativas. Además cabe observar que la frecuencia del residuo L es de 9,5% y, en cambio, en el genoma entero es del 12%. Es decir, el porcentaje de L es mucho más alto en las proteínas exclusivas humanas.
En esta gráfica vemos para las proteínas conservadas en humano y compartidas en otras especies la longitud media de las repeticiones. Como es constante en todas las observaciones, los valores más altos corresponden a H y Q (para éste la cifra asciende a 9). También se observa la ausencia del aminoácido W.


ANÁLISIS ESTADÍSTICO DEL CONTENIDO GC Y LONGITUD DE REPETICIONES

Se ha realizado una prueba estadística de T de Student para muestras independientes comparando el contenido GC y longitud de las proteínas para 2 casos de Homo sapiens : comunes y exclusivas. Los resultados son elocuentes: el estadístico toma valor 0,000 para los dos casos. Por ello, se confirma que, de manera estadísticamente significativa, las proteínas que compartimos con las otras tres especies analizadas tienen menor contenido en GC y mayor longitud media de proteína.

ANÁLISIS DE OCHO PROTEÍNAS RELACIONADAS CON ENFERMEDADES EN HUMANOS

En este apartado se estudian las repeticiones existentes en 8 proteínas humanas (no 10 como indican las gráficas) relacionadas con diferentes enfermedades con elevado número de repeticiones:

Hay que decir que las diez proteínas presentaban repeticiones. En total había 24. En la gráfica se puede observar que un alto porcentaje eran repeticiones de Q (38%). Aparte, cabe destacar que el resto de casos, al ser 24 tan sólo, están protagonizados por los aminoácidos que en todos los genomas han resultado ser los más frecuentes: S,E,P,H y A.
Observamos la media de longitud de cada repetición. Podemos observar que la media es la más alta observada hasta ahora (alrededor de 10 unidades). Además de ello, vemos que los casos de Q vuelven a destacar por ser muy largos (18 unidades). Por lo tanto, Q es el aminoácido con más repeticiones y más largas. También S destaca por tener una alta frecuencia (21%) y una media de longitud alta, pero sin llegar a los valores de éste.
En este caso observamos los casos de repeticiones de más de 10 unidades de longitud. En total se trata de 14 casos (58% del total encontrado en enfermedades). En este caso cabe decir que la prevalencia de Q es abrumadora (65%).

VOLVER AL ÍNDICE DE RESULTADOS


CONTENIDOS DE LA WEB

Urko Martinez Marigorta & Ixabel Mendizabal Ezeizabarrena