A partir dels resultats obtinguts en l’anàlisi de proteànes que contenen repeticions, ens hem pogut fer una
idea sobre els aminoàcids que es repeteixen més sovint. Com es pot observar en l’apartat de resultats, els
aminoàcids més freqüentment repetits en les diferents espècies són (per ordre
d’abundància):
- per Fugu trobem la Serina (S), la Cisteïna (C) i l’Àcid glutàmic (E).
Com podem observar la Serina, la Prolina i l’Àcid glutàmic es troben repetits en les quatre espècies
analitzades. Tot i això no observem un patró definit en els aminoàcids que es troben repetits,
ni pel que fa a l’aminoàcid en si, ni per la seva abundància. El que si cal destacar és que el conjunt
dels aminoàcids més repetits pertanyen tots al grup dels aminoàcids polar o hidrofòbics.
Aquests resultats concorden amb els obtinguts per altres grups d’investigació
(Albà et al, 2004) (Mukund et al, 2001)
- per Tetraodon trobem la Glicina (G) en el cas de les proteïnes exclusives i la Serina en el cas de les
proteïnes totals.
- per humà, trobem la Leucina (L) en les proteïnes exclusives i l’&Aagrave;cid glutàmic i la
Prolina en cas de les proteïnes totals.
- per Gallus trobem la Serina (S) i la Prolina (P).
Si comparem els dos grups de proteïnes humanes analitzats anteriorment (exclusives humanes i humanes totals) amb les
proteïnes humanes que es troben conservades en la resta de les espècies, podem veure que no hi ha massa
diferència pel que fa als percentatges dels aminoàcids que es repeteixen més. En aquest últim grup,
els aminoàcids que es repeteixen més són l'àcid glutàmic amb un 17%, la Prolina (15%) i la Serina (14%).
Com veiem, continuem amb els mateixos aminoàcids que sempre es repeteixen, per tant, no podem afirmar que hi hagi
diferència en aquest grup de proteïnes conservades respecte els altres grups de proteïnes.
Pel que fa a l’abundància de proteïnes que presenten repeticions versus les que no en presenten podem observar
una clara diferència. En general, podem apreciar que en totes les espècies predominen les proteïnes
que no tenen repeticions amb un alt tant per cent (entre 80-90%). S’ha de comentar que hi ha una petita excepció:
es tracta del Fugu Rubripes. Aquest presenta un percentatge molt similar entre les proteïnes que contenen repeticions
i les que no en tenen. Potser aquesta diferència tan gran pot ser deguda a que les proteïnes amb grans
repeticions poden provocar una disfunció cel.lular, per tant podríem dir que la selecció actua
negativament sobre elles.
En quant al contingut GC mitjà de les proteïnes analitzades cal destacar que no trobem diferències
siginificatives entre les diferents espècies. El que si cal remarcar és que les desviacions estàndar
es troben entre els valors 5 i 9, que considerem normals. Amb aquests resultats podem veure que considerant globalment
totes les proteïnes, no s’aprecien grans diferències, però potser sí que les trobarem quan
analitzem el contingut GC de les proteïnes amb repeticions enfront a les que no en tenen.
En l’anàlisi de la possible relació entre el contingut GC i les proteïnes que contenen o no repeticions
podem observar que existeix una relació bastant significativa, ja que els valors obtinguts per la probabilitat
utilitzant el test estadístic de la T de Student ens han donat molt baixos. Aix&oagrave; ens fa pensar que
tot i que a simple vista la diferència entre les mitges no sembla gaire radical (entre un 1 i 3%) sí que
són significatives. Tot i això, cal destacar el cas de les proteïnes totals del Fugu, en el que el
valor de la p (probabilitat) ens ha donat 0. Potser es deu a un error en l'extracció o de les dades, tot i que nosaltres
no sabem on hem pogut fallar. També s'ha de destacar el cas de les proteïnes exclusives de Gallus, ja que el
valor de la probabilitat no ens ha donat significatiu, ja que és un valor superior a 0,05.
Com s'observa en els gràfics de les mitges percentuals del contingut GC en relació amb proteïnes que
presenten o no repeticions, sabent que la diferència és significativa, podem observar que les proteïnes
que presenten repeticions tenen major contingut GC. Diversos autors han atribuit aquest fet als codons que codifiquen per
cada aminoàcid. Si ens parem a pensar, veurem que quasi tots els codons codificants tenen com a mínim una C o
una G.
Concretament, en el cas dels aminoàcids que hem trobat més repetits, els codons que els poden codificar
són:
- per la Serina: AGC, AGU, UCA, UCC, UCG, UCU
- per la Prolina: CCA, CCC, CCG, CCU
- per l'àcid glutàmic: GAA, GAG
Com podem observar, per exemple, en el cas de la prolina, quasi tots els possibles codons que la codifiquen tenen com a
mínim dues posicions que estan ocupades tant per C com per G. Això podria explicar el fet de que el contingut
GC d'aquestes proteïnes estigués augmentat.
Pel que fa a les proteïnes involucrades en malalties humanes, hem observat que totes contenen com a mínim
un bloc de repeticions. La llargada d’aquest bloc és variable (entre 5 i 38) i sol ser proporcional a la gravetat
de l’enfermetat (per exemple, en el cas de la Corea de Huntington és així). Entre aquestes proteïnes
hem observat que hi ha una variabilitat, ja que trobem proteïnes que presenten un únic bloc de repeticions i
d’altres que en presenten fins a sis.
S’ha de destacar que l’aminoàcid més repetit en aquestes proteïnes és la Glutamina (Q),
aminoàcid que en els resultats de l’anàlisi de les repeticions, no apareixia entre els més abundants.
Això ens ha fet pensar que potser les repeticions d’aquest aminoàcid estan sotmeses a una forta
selecció negativa, ja que en el cas de que es donin, poden provocar malalties.
Per últim, comentar que la mitja del contingut GC d'aquestes proteïnes que estan implicades en malalties humanes,
és de 45,85%. Tot i que no el podem comparar amb cap altre valor, ja que només tenim proteïnes amb
repeticions (no tenim valor de contingut GC de proteïnes implicades en malalties que no tinguin repeticions), podem
dir que sí que existeix relació entre aquest percentatge del contingut GC i les repeticions. Aquesta
deducció l'hem pogut fer després de consultar la bibliografia proposada, on la majoria d'articles parlen
d'una relació clara entre elevat contingut GC i repeticions d'aminoàcids.
(Hancock JM et al, 2001) (Karlin et al, 2002)