En este apartado resumimos los resultados de nuestro trabajo:
- En los genomas de las cuatro especies analizadas el número de proteínas con repeticiones (considerando a partir de cinco aminoácidos) respecto a las que no tienen repeticiones es de 1:6 como mínimo. Respecto a todo el genoma, la cifra de proteínas con repeticiones varía de 10-16% en las cuatro especies: Gallus gallus 10%, Tetraodon nigroviridis 14%, y Homo sapiens y Fugu rubripes 16%.
- En las cuatro especies, el porcentaje de proteínas con repeticiones es el doble en el genoma entero respecto a las proteínas exclusivas de cada especie.
- En Homo sapiens el 50% de los casos de repeticiones se encuentran en las proteínas conservadas en las otras especies, quienes tan sólo representan el 25% de las proteínas del genoma.
- Los aminoácidos más frecuentes en las cuatro especies son E (ácido glutámico), P (prolina), S (serina), G (glicina), L (leucina) y A (alanina). Es destacable que no se ha encontrado ningún caso de repeticiones para el aminoácido W (triptófano) en ninguno de los cuatro proteomas. En Homo sapiens se observa un aumento de la frecuencia de A (alanina) y L (leucina) junto a una disminución de S (serina). En Fugu rubripes por otro lado, destaca el elevado porcentaje de C (cisteína) que es del 3% (en las otras especies no supera el 0,5%).
- Teniendo en cuenta la clasificación de Lehninger encontramos valores diferentes en las proteínas con repeticiones respecto a los genomas en general. En general, el porcentaje de aminoácidos hidrófilos (50%) y ácidos (20%) se ve aumentado en las proteínas con repeticiones, y disminuyen los valores de los hidrófobos (20%) y básicos (10%). Esta regla se cumple tanto en las proteínas exclusivas como en las conservadas (analizadas para Homo sapiens ). Esto coincide con los resultados de análisis en otros organismos eucariotas (Karlin et al.2002).
En el caso de Homo sapiens destacan los hidrófobos (27%) junto a una disminución de los hidrófilos (45%). En Fugu rubripes, en cambio, hay un alto porcentaje de hidrófilos (56%) en detrimento de los básicos (6%).
- La media de longitud de repeticiones por aminoácido se sitúa alrededor de 6. Destaca el valor de C (Cisteína) en Fugu rubripes , que tiene la media más alta: 11,5. Los valores más altos para todas las especies son de H (histidina) y Q (glutamina), de 8 residuos de media. En general se observa que Fugu rubripes tiene las medias más altas y Gallus gallus las más bajos.
- Los aminoácidos menos frecuentes tienen medias de longitud por repetición cortas y los aminoácidos más frecuentes tienen medias de longitud por repetición largas.
- El aminoácido Q (glutamina) tiene la frecuencia más alta en los casos de repeticiones de más de 15 unidades de longitud (pasa de valores de 6% a 40%). En Fugu rubripes C (cisteína) alcanza el 27% de estos casos (en las otras tres no llega al 1%). En números absolutos Fugu rubripes tiene 200 casos. En cambio, Gallus gallus tan sólo tiene 5. En repeticiones de más de 25 unidades Q (glutamina) alcanza el 65% de los casos en Homo sapiens .
- En las 8 proteínas relacionadas con enfermedades humanas debidas a repeticiones se han encontrado repeticiones (3 de media por proteína). Se han encontrado casos de Q (glutamina), S (serina), A (alanina), E (ácido glutámico), H (histidina) y P (prolina). Los casos de Q (glutamina) representan el 38% de las repeticiones. En repeticiones de más de 10 unidades de longitud el porcentaje de Q es de 65%. La longitud media de residuos por repetición es de 10 (la más alta encontrada). Destaca la media de longitud de Q (glutamina):18 unidades.
- Las proteínas con repeticiones tienen un porcentaje de GC más alto que las que no tienen repeticiones excepto Gallus gallus .
- En Homo sapiens las proteínas comunes tienen menos contenido GC que las exclusivas de especie.
- Las proteínas con repeticiones tienen una media de longitud por proteína mayor que las que no tienen repeticiones (suelen ser el doble de largas).
- En Homo sapiens las proteínas comunes tienen una media de longitud más grande que las exclusivas de especie.