ANÀLISI PER A HOMO SAPIENS
Els resultats d'aquesta gràfica mostren en números absoluts el número de repeticions per cada aminoàcid pel cas d' Homo sapiens. A diferència de les altres 3 espècies, destaca que els tres residus més comuns són E, P i A (en comptes d'S).
Cal destacar també que G i L es col·loquen a l'alçada d' S (995). L'únic aminoàcid que no té repeticions és W, com a la resta de genomes. | |
Podem observar que 6 aminoàcids ballen entre el 17% (E) i el 12% (L i S). Destaca el 14% d'A (a la resta no superava el 10%). | |
En aquest cas véiem la ditribució de freqüències classificant els aminoàcids segons Lehninger.Homo sapiens
També s'hi han afegit les dades d'ús d'aminoàcids al genoma humà. Comparat amb la resta d'espècies, destaca que a Homo sapiens els aminoàcids hidròfobs fan el 30% dels casos. Podem veure que en les proteïnes amb repeticions augmenten els casos d'àcids (del 12% al 20%) i hidròfils (del 40% al 47%). | |
Véiem que la mitjana de longitud per cas és de 6,5 aminoàcids. Destaca que H i Q (8,5) tenen la mitjana més alta. | |
Hi ha 125 casos de repeticions de més de 15 aminoàcids de longitud a Homo sapiens. Aquesta dada és molt inferior a Fugu rubripes (208) però molt superior a Tetraodon nigroviridis (54) i Gallus gallus (5). S'hi pot veure l'alta prevalença de Q (41%), molt per sobre de la seu freqüència a nivell general de repeticions (6%). De la resta en destaca la poca presència de P (4%) i la absència de L (en general és de 12%). | |
Si triem les repeticions de més de 25 aminoàcids de longitud nomès superen el filtre 21 casos. S'hi dispara la freqüència de Q (76%), i, per tant, es reafirma el seu pes a les repeticions llargues. | |
Aquesta gràfica és molt interessant, ja que ens permet observar les tres situacions que hem trobat, les tres a la mateixa espècie: genoma sencer, proteïnes comunes i proteïnes exclusives a Homo sapiens . Les dades de GC són semblants a les tres situacions, en canvi, els de percentatge de repeticions no. Si considerem el grup de les exclusives com a indicador del propi camí evolutiu d' Homo sapiens , aquelles que, en el grup de vertebrats, "ens fan mamífers", veiem que la tendència ha estat d'augmentar clarament el contingut en GC, però, alhora, perdre percentatge de repeticions. En canvi, en el cas de les comunes, és a dir, les que podem considerar "necesàries per a ser vertebrats", podem observar que el contingut GC és el més petit però el percentatge de proteïnes amb repeticions és molt alt (20%). | |
PROTEÏNES D' HOMO SAPIENS CONSERVADES A LA RESTA D'ESPÈCIES
Aquestes gràfiques pertanyen a l'anàlisi de les repeticions d'aquelles proteïnes humanes que també estan conservades a les altres tres espècies (un 25% del genoma humà).
Podem veure que els resultats són molt semblants a les dades generals de freqüència de repeticions de tot el genoma humà: destaquen A,E,G,L,P i S. Cal destacar que la xifra és la meitat que la xifra de tot el genoma: és a dir, que la meitat dels casos amb repeticions en humans es troben en aquest 25% de proteïnes conservades! | |
Mirant-ho en dades de percentatges, podem observar que la freqüència del residu L es de 9,5% i, en canvi, en el genoma sencer és del 12%. | |
En aquesta gràfica veiem que les proteïnes conservades en humà i compartides amb les altres espècies. Els valor més alts corresponen a H i Q (com a tot el genoma sencer). | |
ANÀLISI ESTADÍSTIC DEL CONTINGUT EN GC I LONGITUD DE REPETICIÓ
S'ha fet una prova estadística de T d'Student per a mostres independents per a contingut en GC i longitud de proteïnes per a 2 casos d' Homo sapiens : comunes i exclusives. Els resultats són ben expressius: l'estadístic pren el valor de 0'000 en ambdós casos. Es confirma per tant, de manera estadísticament significativa, que les proteïnes que compartim amb les altres tres espècies analitzades tenen menys contingut en GC però tenen una longitud mitjana de proteïna més gran. |
|
ANÀLISI DE VUIT PROTEÏNES RELACIONADES AMB MALALTIES EN HUMANS
ALIGN=JUSTIFY>En aquest apartat s'estudien les repeticions que hi ha a 8 proteïnes humanes (no 10 com indiquen les gràfiques) relacionades amb diferents malalties amb un alt nombre de repeticions:
- ataxia espinocerebelar 1
- ataxia espinocerebelar 2
- ataxia espinocerebelar 6
- ataxia espinocerebelar 7
- ataxia espinocerebelar 17
- atrofia dentatorubro-palidolusiana
- malaltia de Huntington
- malaltia de Majado-Joseph
Cal dir que les 8 proteïnes tenien repeticions. En total n'hi havia 24, és a dir, 3 per proteïna de mitjana. Podem veure que la gran majoria era de Q (38%). Pel que fa a la resta, destaca que hi havia presència nomès dels que acostumen a ser els aminoàcids amb més repeticions: S,E,P,H i A. | |
Podem veure que la mitjana de longitud per repetició és la més alta observada fins ara: al voltant de 10 aminoàcids per cas. En destaca per ser molt gran la mitjana de Q (18 unitats). Per tant, Q és l'aminoàcid amb més repeticions i amb les repeticions més llargues. També destaca l'alta freqüència d' S (21%) i la seva mitjana de longitud, però sense arribar als extrems de Q. | |
Ens centrem ara en les repeticions de més de 10 unitats de longitud. En són 14 (58% del total trobat a proteïnes de malalties). Destaca la freqüència de Q (65%). | |
TORNAR A L'INDEX DE RESULTATS
CONTINGUTS DE LA WEB
Urko Martinez Marigorta & Ixabel Mendizabal Ezeizabarrena