CONCLUSIONS

CONCLUSIONS


A partir dels resultats obtinguts en l’anàlisi de proteànes que contenen repeticions, ens hem pogut fer una idea sobre els aminoàcids que es repeteixen més sovint. Com es pot observar en l’apartat de resultats, els aminoàcids més freqüentment repetits en les diferents espècies són (per ordre d’abundància):

    - per Fugu trobem la Serina (S), la Cisteïna (C) i l’Àcid glutàmic (E).
    - per Tetraodon trobem la Glicina (G) en el cas de les proteïnes exclusives i la Serina en el cas de les proteïnes totals.
    - per humà, trobem la Leucina (L) en les proteïnes exclusives i l’&Aagrave;cid glutàmic i la Prolina en cas de les proteïnes totals.
    - per Gallus trobem la Serina (S) i la Prolina (P).

Com podem observar la Serina, la Prolina i l’Àcid glutàmic es troben repetits en les quatre espècies analitzades. Tot i això no observem un patró definit en els aminoàcids que es troben repetits, ni pel que fa a l’aminoàcid en si, ni per la seva abundància. El que si cal destacar és que el conjunt dels aminoàcids més repetits pertanyen tots al grup dels aminoàcids polar o hidrofòbics. Aquests resultats concorden amb els obtinguts per altres grups d’investigació (Albà et al, 2004) (Mukund et al, 2001)

Si comparem els dos grups de proteïnes humanes analitzats anteriorment (exclusives humanes i humanes totals) amb les proteïnes humanes que es troben conservades en la resta de les espècies, podem veure que no hi ha massa diferència pel que fa als percentatges dels aminoàcids que es repeteixen més. En aquest últim grup, els aminoàcids que es repeteixen més són l'àcid glutàmic amb un 17%, la Prolina (15%) i la Serina (14%).
Com veiem, continuem amb els mateixos aminoàcids que sempre es repeteixen, per tant, no podem afirmar que hi hagi diferència en aquest grup de proteïnes conservades respecte els altres grups de proteïnes.

Pel que fa a l’abundància de proteïnes que presenten repeticions versus les que no en presenten podem observar una clara diferència. En general, podem apreciar que en totes les espècies predominen les proteïnes que no tenen repeticions amb un alt tant per cent (entre 80-90%). S’ha de comentar que hi ha una petita excepció: es tracta del Fugu Rubripes. Aquest presenta un percentatge molt similar entre les proteïnes que contenen repeticions i les que no en tenen. Potser aquesta diferència tan gran pot ser deguda a que les proteïnes amb grans repeticions poden provocar una disfunció cel.lular, per tant podríem dir que la selecció actua negativament sobre elles.

En quant al contingut GC mitjà de les proteïnes analitzades cal destacar que no trobem diferències siginificatives entre les diferents espècies. El que si cal remarcar és que les desviacions estàndar es troben entre els valors 5 i 9, que considerem normals. Amb aquests resultats podem veure que considerant globalment totes les proteïnes, no s’aprecien grans diferències, però potser sí que les trobarem quan analitzem el contingut GC de les proteïnes amb repeticions enfront a les que no en tenen.

En l’anàlisi de la possible relació entre el contingut GC i les proteïnes que contenen o no repeticions podem observar que existeix una relació bastant significativa, ja que els valors obtinguts per la probabilitat utilitzant el test estadístic de la T de Student ens han donat molt baixos. Aix&oagrave; ens fa pensar que tot i que a simple vista la diferència entre les mitges no sembla gaire radical (entre un 1 i 3%) sí que són significatives. Tot i això, cal destacar el cas de les proteïnes totals del Fugu, en el que el valor de la p (probabilitat) ens ha donat 0. Potser es deu a un error en l'extracció o de les dades, tot i que nosaltres no sabem on hem pogut fallar. També s'ha de destacar el cas de les proteïnes exclusives de Gallus, ja que el valor de la probabilitat no ens ha donat significatiu, ja que és un valor superior a 0,05.
Com s'observa en els gràfics de les mitges percentuals del contingut GC en relació amb proteïnes que presenten o no repeticions, sabent que la diferència és significativa, podem observar que les proteïnes que presenten repeticions tenen major contingut GC. Diversos autors han atribuit aquest fet als codons que codifiquen per cada aminoàcid. Si ens parem a pensar, veurem que quasi tots els codons codificants tenen com a mínim una C o una G.
Concretament, en el cas dels aminoàcids que hem trobat més repetits, els codons que els poden codificar són:
    - per la Serina: AGC, AGU, UCA, UCC, UCG, UCU
    - per la Prolina: CCA, CCC, CCG, CCU
    - per l'àcid glutàmic: GAA, GAG

Com podem observar, per exemple, en el cas de la prolina, quasi tots els possibles codons que la codifiquen tenen com a mínim dues posicions que estan ocupades tant per C com per G. Això podria explicar el fet de que el contingut GC d'aquestes proteïnes estigués augmentat.

Pel que fa a les proteïnes involucrades en malalties humanes, hem observat que totes contenen com a mínim un bloc de repeticions. La llargada d’aquest bloc és variable (entre 5 i 38) i sol ser proporcional a la gravetat de l’enfermetat (per exemple, en el cas de la Corea de Huntington és així). Entre aquestes proteïnes hem observat que hi ha una variabilitat, ja que trobem proteïnes que presenten un únic bloc de repeticions i d’altres que en presenten fins a sis.

S’ha de destacar que l’aminoàcid més repetit en aquestes proteïnes és la Glutamina (Q), aminoàcid que en els resultats de l’anàlisi de les repeticions, no apareixia entre els més abundants. Això ens ha fet pensar que potser les repeticions d’aquest aminoàcid estan sotmeses a una forta selecció negativa, ja que en el cas de que es donin, poden provocar malalties.

Per últim, comentar que la mitja del contingut GC d'aquestes proteïnes que estan implicades en malalties humanes, és de 45,85%. Tot i que no el podem comparar amb cap altre valor, ja que només tenim proteïnes amb repeticions (no tenim valor de contingut GC de proteïnes implicades en malalties que no tinguin repeticions), podem dir que sí que existeix relació entre aquest percentatge del contingut GC i les repeticions. Aquesta deducció l'hem pogut fer després de consultar la bibliografia proposada, on la majoria d'articles parlen d'una relació clara entre elevat contingut GC i repeticions d'aminoàcids. (Hancock JM et al, 2001) (Karlin et al, 2002)



Torna a la pàgina principal