ANÁLISIS PARA GALLUS GALLUS

Los resultados de repeticiones para Gallus gallus destacan por indicar que se trata la especie que de las cuatro analizadas tiene menos proteínas con repeticiones, tanto en números absolutos como en porcentaje sobre todo el genoma (tan solo el 10%). En cuanto al número absoluto de repeticiones, tres aminoácidos destacan sobre el resto (E,P y S). Por otra parte hay un subgrupo que oscila alrededor de las 300 repeticiones (A,G,K,L y Q). En último término, son numerosos aquellos aminoácidos con menos de 100 repeticiones (C,D,F,H,I,N,R,T,V y Y). Por último, destacar que 2 aminoácidos no tienen ninguna repetición (M y W).

Tal como se ha comentado para con la gráfica anterior, en porcentaje podemos ver que los 3 aminoácidos más comunes representan el 50 % de las repeticiones encontradas. Este resultado contrasta con el grupo de los "menos comunes", que agrupados en un subgrupo representan tan sólo el 6 % de las repeticiones.
Si se agrupan los aminoácidos según la división clásica del Lehninger, podemos ver que los aminoácidos considerados hidrófilos suman la mitad de las repeticiones. El grupo de los básicos representan menos del 10% de las mismas. Cabe destacar que el amplio grupo de los hidrófobos, pese a ser 8 (40% de los aminoácidos), tan sólo suman el 21 % de las repeticiones. De todos modos, los resultados son semejantes a los de las otras especies.
Si se filtran los casos con repeticiones "largas" (más de 15 aminoácidos), encontramos que hay tan sólo 5 casos. Estos resultados contrastan con los de las otras especies, que abundan en repeticiones largas.
En esta tabla se puede observar la longitud media de repeticiones por cada aminoácido. Cabe destacar, como primera observación, que la longitud media es de menos de 6 aminoácidos repetidos por caso. Esta es la media más baja de los 4 genomas analizados. A lo largo del análisis veremos que cuantas más repeticiones se tienen, más tendencia hay a que sean más largas. En ningún caso se llega a una media superior a las 7 repeticiones por caso, dato que contrasta enormemente con las demás.


ANÁLISIS ESTADÍSTICO DEL CONTENIDO GC Y LONGITUD DE REPETICIÓN


En esta tabla se muestra el análisis de T de Student para el contenido GC y longitud media de proteína en dos muestras: las proteínas con repeticiones y las que no en Gallus gallus. Para el contenido GC el valor del estadístico es de 0.003 (asumimos el valor de no considerar las varianzas iguales ya que la prueba de Levene ha dado superior a 0.025 en el otro caso). Este valor nos permite afirmar que hay un contenido diferencial en GC entre las dos muestras y, por tanto, efectivamente, las proteínas con repeticiones tienen un contenido menor en GC (recordamos que es lo contrario a lo que ocurre en las otras tres especies analizadas).

El estadístico de longitud media de proteínas es de 0.000. Esto indica que, efectivamente, las proteínas con repeticiones son más largas que aquellas sin repeticiones.




VOLVER AL ÍNDICE DE RESULTADOS


CONTENIDOS DE LA WEB

Urko Martinez Marigorta & Ixabel Mendizabal Ezeizabarrena