ANÀLISI INTERESPECIFIC

En aquest apartat s'hi troben els resultats de l'anàlisi comú per a les 4 espècies. Així es poden veure les tendències pròpies de cada espècie comparat amb la resta.

Aquesta gràfica ensenya el número de proteïnes del genoma de cadascuna de les espècies i el número de proteïnes que són exclusives de cada espècie, és a dir, que no es comparteixen amb cap de les altres tres espècies. Aquests resultats són molt variats. En tots 4 genomes la xifra de proteïnes és semblant: al voltant de les 30.000. Les diferències en el número de proteïnes exclusives, en canvi, són considerables. A Tetraodon nigroviridis podem observar que el 23% de les seus proteïnes són exclusives, mentre que la xifra més baixa pertany a Fugu rubripes, ja que és del 12%.

Aquesta gràfica ensenya la proporció de proteïnes sense repeticions per cada proteïna amb repeticions. Els resultats són variats. En tots els casos la relació és superior a 6:1, tot i que per a Fugu rubripes i Homo sapiens el percentatge de proteïnes amb repeticions és del 16% mentre que per a Gallus gallus aquesta xifra és molt inferior, del 10%.

Aquesta gràfica analitza la tipologia de proteïnes del genoma humà. Podem dividir el genoma en tres tipus de proteïnes: aquelles que comparteix amb les altres tres espècies (en diem conservades), aquelles que no comparteix amb les altres tres espècies (dites exclusives), i el tercer grup, que en diém "la resta", que són aquelles proteïnes que comparteixen amb alguna de les altres tres espècies però no amb totes elles.
Es pot veure que només una quarta part de les proteïnes humanes no tenen pas una relació amb alguna de les altres tres espècies (podríem dir que es tracta de les proteïnes que "marquen camí" cap a mamífer o que no s'ha sabut relacionar amb cap dels altres genomes).

A aquesta gràfica s'hi compara el valor de proteïnes exclusives (no compartides amb les altres 3 espècies analitzades) i podem veure que Tetraodon nigroviridis té gairebé un terç de proteïnes exclusives, mentre que per a Fugu rubripes aquesta xifra no representa ni una sisena part del genoma. Aquesta no és pas l'única diferència notable que es troba a l'hora de comparar aquestes dues espècies de la mateixa família.
A aquesta gràfica, en canvi, s'hi mostra el percentatge de proteïnes amb repeticions per a tot el genoma de cada espècie. Podem veure que Gallus gallus té la xifra més baixa (volta el 10% de proteïnes amb repeticions).
A aquesta gràfica podem observar-hi que és més alt el percentatge de proteïnes amb repeticions en el grup de les proteïnes exclusives d'espècie. Destaca el cas de Tetraodon nigroviridis , a on la relació arribar a ser de (2,5:1).
A aquesta taula s'hi mostren els valors porcentuals del número de proteïnes amb repeticions i longitud mitjana de cada cas per cada aminoàcid.
Aquesta gràfica ensenya en números absoluts el número de casos de repeticions per aminoàcid als 4 genomes. Cada cas particular s'estudia a l'anàlisi de cada espècie, però podem veure que els aminoàcids més repetits són sempre un grup de 5 o 6 (A,E,P,S,G i L). Pel que fa als aminoàcids poc abundants en repeticions, cal destacar que W (triptòfan) no ha aparegut en cap cas als 4 genomes i que C (cisteina) està molt present a Fugu rubripes.
En aquesta gràfica podem observar la longitud mitjana de cada cas de repeticions per aminoàcid i espècie. Destaca que: la mitjana oscil·la al voltant de 6, Gallus gallus té els valors més baixos, H i Q acostumen a tenir les repeticions més llargues, i que a Fugu rubripes C es dispara hasta una mitjana d'11,5 unitats per repetició.
En aquesta taula es mostren els percentatges d'aparició d' aminoàcids segons la classificacióde Lehninger a les proteïnes amb repeticions de les quatre espècies. Podem veure que els percentatges d'hidròfilos són més alts que no pas els hidròfobos i que els ácids so´n més abundants que els bàsics. Destaca que a humà (veure l'anàlisi per a humà) la diferència entre els hidròfils i hidròfobs no és pas tan gran.
És visible la poca diferència existent en contingut GC entre les proteïnes del genoma de cada espècie, si s'analitza separant les que tenen repeticions de les que n'hi manquen. Veiem que a tots els casos la diferència per a les proteïnes amb repeticions és menor al 2%. A més a més, en el cas de Gallus gallus el contingut de GC és menor en aquelles que tenen repeticions. Cal dir que aquests casos són treballant amb una mostra aleatòria del 10% del total en cada cas, per a poder treballar millor amb el programa estadístic SPSS.
Aquesta gràfica indica el mateix però analitzant en aquest cas el grup de les proteïnes exclusives. Podem veure que els resultats són equivalents als del cas anterior. En el cas de Gallus gallus es segueix produint una inversió a les barres respecte les altres espècies. De tota manera, podem veure com els seus valors també volten el 50%.

ANÀLISI ESTADÌSTIC DEL CONTINGUT GC I LONGITUD DE REPETICIÓ

En aquest cas hem calculat un estadístic de T d'Student per a mostres independents entre proteïnes amb repeticions versus proteïnes que no en tenen, agrupant les proteïnes exclusives de les 4 espècies. Hem fet una prova per a contingut en GC i per a longitud de proteïna. Per a longitud de proteïna podem observar que la mitjana de les proteïnes amb repeticions és el doble que sense repeticions. La significança és de 0'000 ens confirma que, efectivament, es tracta de dos grups perfectament diferenciats, i podem afirmar per tant amb total seguretat estadístia que el tenir repeticions va associat a una major mida de proteïna.
En canvi, l'estadístic del contingut de GC és de 0'006. Per tant, no podem afirmar amb una fiabilitat del 95% que siguin dos grups clarament diferenciats, i hem de dir que hi ha una diferència del 2% en el contingut en GC favorable a les proteïnes amb repeticions, però que per poc no té una forta significança estadística.


En aquest cas hem fet la mateixa prova però per a genomes sencers. En ambdós casos (GC i longitud) el valor de l'estadístic és de 0'000. Això ens permet de concloure que hi ha un contingut diferent en GC i una longitud diferent de proteïnes entre les proteïnes que tenen repeticions i les que no en tenen. Per tant, les proteïnes del genoma amb repeticions tenen una llargària més gran i un contingut en GC més alt.


TORNAR A L'INDEX DE RESULTATS


CONTINGUTS DE LA WEB

Urko Martinez Marigorta & Ixabel Mendizabal Ezeizabarrena