En aquest apartat discutim els resultats obtinguts de l'anàlisi de les repeticions de zones homopolimèriques és semblant als genomes de les quatre espècies de vertebrats analitzades (Homo sapiens, Gallus gallus,Tetraodon nigroviridis i Fugu rubripes).
Hem vist que el número de proteïnes amb repeticions és semblant als quatre genomes analitzats (10-16%). Clarament, a Homo sapiens existeix una desviació en les proteïnes comunes amb repeticions, essent aquestes més frequents que no pas a les exclusives. Això pot indicar que la selecció purificadora ha estat més forta per a la generació de les repeticions durant l'especiació cap a Homo sapiens, però en canvi s'han conservat en més gran mesura a les proteïnes amb repeticions del llinatge dels vertrebrats.
El fet que aquestes proteïnes s'hagin conservat en diferents vertebrats pot ser degut a que aquests gens són majoritàriament factors de transcripció, canals de calci i potassi i gens del desenvolupament embrionari i/o del sistema nerviós, tal com suggereixen Karlin et al. (2002). De tota manera, aquesta observació tan sols s'ha pogut realitzar a Homo sapiens, i per tant no podem pas afirmar que aquest fenomen sigui general per a tots els genomes, ja que a més a més s'ha suggerit força cops a la literatura que les proteïnes amb repeticions en humà són un fenomen prou recent de l'evolució que aniria plegat amb el desenvolupament de la complexitat del cervell (Karlin et al. 2002).
Les proteïnes amb repeticions tenen un contingut en GC del gen significativament més alt. L'observació s'addiu amb Albà and Guigó (2004), que suggereix que els aminoàcids amb repeticions en vertebrats tendeixen a estar codificats per codons amb un contingut en GC alt, al contrari de la tendència observada en llevats, cucs i plantes, a on les zones homopolimèriques tendeixen a ésser riques en AT (Karlin et al. 2002). A més a més, hem vist que el contingut en GC és més alt en les proteïnes exclusives, d'acord amb la tendència d'augmentar el contingut en GC en les proteïnes amb repeticions.
Hem observat que les proteïnes amb repeticions tenen una més gran longitud mitjana de proteïna, i a Homo sapiens les proteïnes més llargues són aquelles que tenen més repeticions (conservades).
Els aminoàcids més freqüents a zones homopolimèriques han estat E, P, S, A, G i L. L'únic aminoàcid que no té pas repeticions és el triptòfan (W). A més a mes, els aminoàcids més freqüents tendeixen a fer repeticions més llargues. A Fugu rubripes destaquen les repeticions de l'aminoàcid cisteïna (C), ja que apareixen en una proporció sis cops més gran que a les altres espècies. Aquesta espècie destaca per tenir un gran número de repeticions llargues (>15), a diferència del membre de la seu mateixa familia Tetraodon nigroviridis. A falta de més dades sobre d'altres espècies de peixos i prenent com a outgropus les altres dues especies, suggerim que aquesta abundància de proteïnes amb repeticions és pròpia del llinatge de Fugu rubripes.
A Homo sapiens el percentatge d'aminoàcids hidròfils i àcids és significativament més gran a proteïnes amb repeticions respecte a tot el proteoma. Aquest fenomen es repeteix en zones homopolimèriques riques a diferents organismes eucariotes (Karlin et al. 2002), en el que abunden els residus polars i petits i els àcids, però s'eviten els alifàtics, aromàtics i bàsics.
L'aminoàcid glutamina (Q) és l'aminoàcid més abundant a les proteïnes amb repeticions relacionades amb malalties humanes. A més a més, aquest aminoàcid (Q) té els valors de repeticions més llargs. Aquesta observació coincideix amb Karlin et al.(2002). S' especula que aquestes repeticions de glutamina causen agregació proteica i, en consequència, toxicitat.
Per últim, hem vist que a Homo sapiens existeix una sobrerepresentació de casos de repeticions de 15 a 25 unitats de longitud (veure anàlisi extra). Caldria fer més estudis sobre si aquesta mida de repetició pot formar una unitat funcional o si té cap relació amb el fenomen d' "slippage".