Conclusions


Conclusions

El principal objectiu d’aquest treball va ser identificar i anotar de forma correcta totes les selenoproteïnes i les proteïnes de maquinària presents en el genoma d’Ictalurus punctatus.Els resultats es van obtenir a partir d’un anàlisi bioinformàtic i d’aproximacions computacionals a partir de la comparació del genoma de la nostra espècie amb el selenoproteoma ja anotat del peix zebra (Danio rerio). Es va escollir aquesta espècie com a espècie de referència principal perquè té una elevada proximitat filogenètica, perquè el seu genoma està ben caracteritzat i perquè és el peix ossi amb el selenoproteoma més gran.

Per tal de dur a terme la predicció de selenoproteïnes es va desenvolupar un programa per automatitzar el procés d’anàlisis, on es van utilitzar els programes tblastn, exonerate i t-coffee. A més, per tal d’identificar correctament les selenoproteïnes és va utilitzar el programa Seblastian per predir els possibles elements SECIS en l’extrem 3’UTR.

Totes les proteïnes de referència es van extreure de les bases de dades SelenoDB i Uniprot agafant les proteïnes del genoma de Danio rerio, tot i que en alguns casos va caldre les del genoma humà (SelI) o el de Gadus morhua (Sel J i SelL).

Les selenoproteïnes de diferents espècies en general presenten una alta homologia, gràcies a aquest fet va ser possible predir la majoria d’elles en el genoma del nostre organisme. Pel que fa les selenoproteïnes, en Danio rerio hi ha 36 mentre que en Ictalurus punctatus es van identificar 32.

Totes les proteïnes presents en el principal organisme de referència es van trobar en el nostre peix sense presentar fets destacats excepte les que s’expliquen a continuació. A més, la majoria de prediccions dels elements SECIS es van aconseguir, confirmant la presència del residu Sec en la selenoproteïna.

Les selenoproteïnes J i L, exclusives dels peixos, s’han perdut en el nostre peix (o no s’han pogut predir correctament), i SelS tot i estar present no es pot considerar com una selenoproteïna ja que enlloc d’un residu Sec presenta una Arg.

Com la resta de peixos ossis i el nostre organisme de referència, Ictalurus punctatus també presenta algunes selenoproteïnes duplicades (famílies SelT i MSRB, GPx1b, GPx3b i GPx4b) però, a més, el nostre peix té duplicada la proteïna SELENOU (SelU1a i SelU1b) i SELENOW2 (SelW2a i SelW2b). Altres duplicacions s’han perdut respecte Danio rerio, és el cas de SelO2 i DIO3b, però en aquestà última s’ha perdut la duplicació i la selenoproteïna original, és a dir, s’ha perdut el gen de DIO3.

Finalment, en l’anàlisi de la família tioredoxina reductasa (TR) Danio rerio té, com la resta de peixos ossis, dues selenoproteïnes: TR2 i TR3 (mentre els mamífers tenen TR1, TR2 i TR3); per Ictalurus punctatus vam trobar la presència de TR1 i TR2 i la pèrdua de TR3. La troballa de TR1 coincideix amb els resultats d’altres companys d’anys anteriors.

L’actual estudi aporta dades filogenètiques que confirmen la bibliografia consultada sobre l’evolució d’algunes selenoproteïnes a partir d’un antecedent comú. El nostre anàlisi va mostrar similituds entre la proteïna Fep15 i SelM, reforçant la idea que Fep15 va sortir d’una duplicació de SelM; també va mostrar similituds entre GPx7 i GPx8, que van evolucionar a partir de GPx4; i en analitzar la família T es va observar un alt grau d’homologia entre T1 i T1b, el que confirmava que hi ha hagut una duplicació de T1 que ha originat T1b.

Pel que fa les proteïnes homòlogues en cisteïna, Danio rerio té 8 i Ictalurus punctatus 7.

Es van caracteritzar bé en Ictalurus punctatus GPx7, GPx8, MSRB2, MSRB3, SELENOU2 i SELENOU3 mentre que es va observar una pèrdua de la còpia de la metionina sulfoxi reductasa A (MsrA). En aquestes proteïnes no s’han identificat elements SECIS.

A més, en el nostre treball també s’ha fet palès els canvis dinàmics Sec to Cys que hi ha entre els diferents nivells taxonòmics o les diferents espècies. SelP1 -la única proteïna amb múltiples residus Sec- en Danio rerio té 17 Sec i, en canvi, en Ictalurus punctatus 2 d’aquestes 17 Sec s’han convertit en Cys i les altres dues s'han convertit en Arg i Gly.

Pel que fa les proteïnes de maquinària, Danio rerio en té 8 i en Ictalurus punctatus es van identificar 7.

Es van caracteritzar bé en Ictalurus punctatus eEFsec, PSTK, SBP2.1, SBP2.2, SecS i SEPHS/SPS1 mentre que es va establir l’existència d’una sola proteïna SECp43 a diferència de Danio rerio que en té dues.

Danio rerio Ictalurus punctatus
Selenoproteïnes
Sel15 Sel15
SELENOE (Fep15) SELENOE (Fep15)
GPx1a/b, GPx2, GPx3, GPx4a/b GPx1a/b, GPx2, GPx3, GPx4a/b
DIO1, DIO2, DIO3a, DIO3b DIO1, DIO2
SEPHS2/SPS2 SEPHS2/SPS2
SELENOH SELENOH
SELENOI SELENOI
SELENOJ ---
SELENOK SELENOK
SELENOL ---
SELENOM SELENOM
SELENON SELENON
SELENOO1, SELENOO2 SELENOO1
SELENOP1, SELENOP2 SELENOP1, SELENOP2
MSRB1a, MSRB1b MSRB1a, MSRB1b
SELENOS ---
SELENOT1, SELENOT1b, SELENOT2 SELENOT1, SELENOT1b, SELENOT2
SELENOU1a SELENOU1a, SELENOU1b
SELENOW1, SELENOW2, SELENOW3 SELENOW1, SELENOW2a, SELENOW2b
TXNRD2/TR2, TXNRD3/TR3 TXNRD1/TR1, TXNRD2/TR2
Homòlogues en cisteïna
GPx7 GPx7
GPx8 GPx8
MsrA1, MsrA2 MsrA
MSRB2, MSRB3 MSRB2, MSRB3
SELENOU2 SELENOU2
SELENOU3 SELENOU3
Proteïnes de maquinària
eEFsec eEFsec
PSTK PSTK
SBP2.1, SBP2.2 SBP2.1, SBP2.2
SecS SecS
SEPHS/SPS1 SEPHS/SPS1
SECp43 1, SECp43 2 SECp43 1


Al llarg d’aquest treball van haver algunes limitacions. La principal limitació va ser que algunes proteïnes estaven mal anotades a SelenoDB, com SELENOI, SELENOU2 i SELENOU3 entre d’altres, el que va fer que haguéssim de recórrer a altres bases de dades com UniProt o altres espècies de referència com Homo sapiens i Gadus morhua. L’estudi es va basar en buscar homologia en aquestes espècies, el que implica que les selenoproteïnes que no estan descrites en aquests organismes no s’han pogut contemplar en l’estudi d’Ictalurus punctatus. Per tant, calen més estudis per trobar totes les selenoproteïnes i descriure-les correctament.

Una altre limitació va ser el programa que vam dissenyar per automatitzar el procés. Aquest programa no ens va ser del tot útil quan vam haver d’interpretar algunes famílies com les glutatió peroxidases (GPx) ja que, malgrat fer tots els passos, no assignava cada scaffold a una proteïna. És per això que les famílies i moltes proteïnes es van haver d’analitzar manualment.

A més a més, donada la complexitat i magnitud del projecte, en alguns casos va ser difícil per a nosaltres dissenyar el programa, interpretar els resultats obtinguts o realitzar algunes accions de la pàgina web. De cara a futurs cursos estaria bé ampliar els coneixements sobre html i també sobre interpretació de fitxers, així com aprofundir en el disseny de programes complexos amb llenguatge Perl. Finalment, les estudiants agrairíem que es dediqués, almenys un seminari, a ensenyar a penjar les selenoproteïnes a SelenoDB, ja que ens hem trobat amb molts entrebancs i molt poc temps per fer-ho tot bé.