En este apartado discutimos los resultados obtenidos del análisis de las repeticiones de zonas homopoliméricas en cuatro especies de vertebrados (Homo sapiens, Gallus gallus,Tetraodon nigroviridis y Fugu rubripes).
Hemos visto que el número de proteínas con repeticiones es parecido en los cuatro genomas analizados (10-16%). Claramente, en Homo sapiens existe un desvío en las proteínas comunes con repeticiones, siendo más éstas más frecuentes que en las exclusivas. Esto puede indicar que la selección purificadora ha sido más fuerte para la generación de las repeticiones durante la especiación hacia Homo sapiens, pero sin embargo se han conservado en mayor medida las proteínas con repeticiones del linaje de los vertebrados.
El hecho de que estas proteínas se hayan conservado en diferentes vertebrados puede ser debido a que estos genes son en su mayoría factores de transcripción, canales de calcio y potasio y genes del desarrollo embrionario y/o del sistema nervioso, tal como sugieren Karlin et al.(2002). De todos modos, esta observación sólo se ha podido realizar en Homo sapiens por lo que no podemos afirmar que este fenómeno sea general para todos los genomas, ya que además se ha sugerido muchas veces en la literatura que las proteínas con repeticiones en humano son un hecho reciente de la evolución que iría unido al desarrollo de la complejidad del cerebro (Karlin et al.2002).
Las proteínas con repeticiones resultaron tener un contenido en GC del gen significativamente más alto. La observación concuerda con Albà and Guigó (2004), que sugiere que los aminoácidos con repeticiones en vertebrados tienden a estar codificados por codones con un contenido GC alto, al contrario de la tendencia observada en levaduras, gusanos y plantas, donde las zonas homopoliméricas tienden a ser ricas en AT (Karlin et al.2002). Además, hemos visto que el contenido en GC es más alto en las proteínas exclusivas, de acuerdo con la tendencia de aumentar el contenido en GC en las proteínas con repeticiones.
Hemos observado que las proteínas con repeticiones tienen una mayor longitud media de proteína, y en Homo sapiens las proteínas más largas son aquellas que tienen más repeticiones (conservadas).
Los aminoácidos más frecuentes en zonas homopoliméricas han sido E, P, S, A, G y L. El único aminoácido que no tiene repeticiones es el triptófano (W). Además, los aminoácidos más frecuentes tienden a formar repeticiones más largas. Para Fugu rubripes destacan las repeticiones del aminoácido cisteína (C), ya que aparecen en una proporción seis veces mayor que en las otras especies. Esta especie destaca por tener un gran número de repeticiones largas(>15), a diferencia del miembro de su misma familia Tetraodon nigroviridis. A falta de más datos sobre otras especies de peces y tomando como outgroup las otras dos especies, sugerimos que esta abundancia de proteínas con repeticiones es propia del linaje de Fugu rubripes.
En Homo sapiens el porcentaje de aminoácidos hidrófilos y ácidos es significativamente más grande en proteínas con repeticiones respecto a todo el proteoma. Este fenómeno se repite en zonas homopoliméricas en diferentes organismos eucariotas (Karlin et al. 2002), en los que abundan los resíduos polares y pequeños junto a los ácidos pero se evitan los alifáticos, aromáticos y los básicos.
El aminoácido glutamina (Q) es el más abundante en las proteínas con repeticiones relacionadas con enfermedades humanas. Además, dicho aminoácido muestra los casos de repeticiones más largos. Esta observación coincide con Karlin et al.(2002). Se especula que estas repeticiones de glutamina causan agregación protéica y en consecuencia toxicidad.
Por último, hemos visto que en Homo sapiens existe una sobrerepresentación de casos de repeticiones de 15 a 25 unidades de longitud (ver análisis extra). Haría falta hacer más estudios sobre si ese tamaño de repetición puede formar una unidad funcional o si tiene alguna relación con el fenómeno de "slippage".