En este caso hemos realizado un estadístico de T de Student para muestras independientes entre proteínas con repeticiones versus sin repeticiones agrupando las proteínas exclusivas de las 4 especies. Hemos realizado la prueba para contenido GC y para longitud de proteína. Para longitud de proteína podemos observar que la media de las proteínas con repeticiones es el doble de sin repeticiones. La significancia de 0,000 nos confirma que, efectivamente, se trata de dos grupos perfectamente diferenciados, y podemos afirmar con seguridad estadística que el tener repeticiones va acompañado de una mayor longitud de proteína.
En cambio, el estadístico del contenido de GC es de 0,006. Teniendo en cuenta una fiabilidad del 95%, no podemos afirmar que el hecho de que haya diferente media no se deba al azar, aunque el sentido común nos hace ver que el estadístico es cercano a 0,005 y, por tanto, casi podríamos asumir que sí. De todos modos, cabe tener en cuenta que la diferencia de medias es muy pequeña, menor al 2%. |