Índex | Abstract | Introducció i objectius | Materials i mètodes | Discussió | Agraïments | Referències |
Identificació d'homòlegs a ENSEMBL
Per analitzar la relació entre taxa evolutiva de les proteïnes i l'edat, hem obtingut un total de 12808 parelles d'homòlegs entre Fugu i Zebrafish.
Classificació de seqüències
Segons el grup d'edat s'han classificat de la següent forma:
- 1661 pertanyen al grup de VERTEBRATS
- 64 són exclusius del grup dels TELEOSTOMS
Calcular el % d'identitat i similaritat
Fig.1 Representació dels histogrames per als tres grups d'edat. L'eix de les ordenades representa la freqüència absoluta i el de les abscisses representa el percentatge d'identitat i similaritat en tant per 1.
A partir del percentatge d'identitat i similaritat obtinguts per a cada parella d'homòlegs s'han calculat els histogrames per cadascun dels grup d'edat (fig.1).
S'aprecia una certa normalitat al grup de vertebrats, i una distribució de normalitat desplaçada cap a la dreta als histogrames del grup d'eucariotes. En canvi, al grup dels teleostoms no apareix una distribució normal, però s'ha de tenir en compte que hi ha una gran diferència en el mostreig de cada grup. El grup de teleostoms és el que conté una mostra més petita (64 teleostoms vs. 11083 eucariotes); aquesta podria ser la causa de la distribució no normal.
Degut a la distribució de les mostres, s'ha aplicat un test no paramètric (Kolmogorov-Smirnov test) per poder comparar els grups entre ells. D'aquesta forma s'assegura uns resultats més fiables, tot i que menys robustos que utilitzant mètodes paramètrics.
La mitjana és el paràmetre estadístic que permet observar la conservació de les proteïnes per a cada grup d'edat. Una altra forma d'estudiar-ho és amb la Ka/Ks, és a dir, el nombre de substitucions no sinònimes pel nombre de substitucions sinònimes, la qual mostra el grau de divergència entre proteïnes (és inversament proporcional a la mitjana).
Taula 1.1 i 1.2 Característiques de les proteïnes ortòlogues fugu-zebrafish dels diferents grups d'edat.
Nota- N és el nombre de proteïnes. SD fa referència a la Desviació Estàndard.
Validació de les dades
Per estudiar les constriccions selectives ens hem basat en la identitat entre parelles de seqüències homòlogues, és a dir, en la proporció de posicions conservades. També hem estudiat la similaritat entre aquestes seqüències, que inclou tant les posicions conservades com aquelles en què el canvi sofert ha estat entre dos aminoàcids amb propietats fisico-químiques similars, mantenint-se en la majoria de casos les característiques funcionals.
La nostra hipòtesi nul.la era que la distribució de mitjanes era la mateixa per als quatre grups dedat, no obstant, els valors d'identitat i similaritat dels parells d'homòlegs classificats en 3 grups d'edat és significativament diferent per totes les parelles de grups comparats (P < 10-4, Kolmogorov-Smirnov test), un resultat que rebutja la hipòtesi nul.la i accepta l'alternativa, és a dir, que les diferències són significatives (taula 2.1 i 2.2).