Per tal de realitzar les anotacions en el genoma de Pteropus alecto s'han d'analitzar les prediccions en el genoma de Pteropus alectus s’han analitzat totes les isoformes humanes de les diverses selenoproteïnes, homòlegs en cisteïna i de les proteïnes de la maquinària.
Per identificar quines es troben en el genoma de Pteropus alecto s’han seleccionat de forma automatitzada els hits amb un e-value significatiu i posteriorment els hem analitzat tenint en compte els scaffolds on es troben situats i quins són els millors alineaments amb el t-coffee a partir de les prediccions realitzades tant amb el Genewise com amb l’Exonerate. També hem valorat les prediccions dels elements SECIS i finalment, s'ha realitzat una predicció amb el Seblastian a partir del fastasubseq generat per a cadascuna de les selenoproteïnes.
S’ha assumit que la seqüència proteica (query) que presenta major homologia amb el genoma de Pteropus alecto és aquella que es trobarà en aquest organisme amb major probabilitat. Per contra, les seqüències restants que presenten menor homologia i que es troben en scaffolds diferents podrien correspondre's a duplicacions, altres possibles esdeveniments o bé a un resultat a desestimar. També hem considerat la possibilitat que les nostres anotacions fossin pseudogens o que durant les modificacions post-transcripcionals aquestes tinguin un splicing alternatiu. A més, també hem considerat la possibilitat de l'existència de diversos ORFs (Open reading frame) quan trobàvem proteïnes solapades en una mateixa regió, de manera que l'existència d'aquests ORFs permetria l'expressió de diferents gens per a una mateixa seqüència.
El fet d'haver utilitzat el genoma de Pteropus Vampirus ens ha permès anotar amb major fiabilitat aquelles proteïnes que presentaven diverses prediccions amb les queries humanes. A més, en alguns casos minoritaris, la seqüència de la query de Pteropus vampyrus era més llarga que la query humana i, per tant més informativa.
Per a cada proteïna s'ha intentat fer un alineament que inclogués la primera metionina necessària per a l'inici de la traducció. En alguns casos no ha estat possible i creiem que la causa d'això podria ser la falta d'homologia d'aquesta proteïna amb els genomes que l'hem comparat, de manera que o bé es troba varis aminòacids abans en el genoma de Pteropus alecto o bé podria ser que la metionina inicial comencés més tard del punt a partir del qual obtenim l'alineament.
Al llarg de l'estudi hem vist que en alguns alineaments manquen alguns aminoàcids, ja siguin a l’extrem N-terminal o C-terminal. Prèviament a prendre com resultat final una proteïna amb aquesta mancança s’ha comprovat que això no està provocat per la mida de la regió genòmica seleccionada, allargant la regió delimitada repetidament i observant el mateix resultat.
A continuació es comenten els resultats obtinguts per famílies o grups de selenoproteïnes.
L'any 2007 Dikiy A et al. van proposar una nova família de selenoproteïnes anomenada Rdx que inclou SelV, SelW, SelT, SelH, SelW-like bacteriana i Rdx12. Els seus membres es caracteritzen per tenir un plegament tioredoxina-like i un motiu CxxC o CxxU pròxim a l’extrem N-terminal del pèptid. Aquestes característiques suggereixen que aquestes proteïnes podrien dur a terme funcions redox en la cèl•lula, formant ponts disulfur transitoris en les proteïnes substrat (6).
La selenoproteïna V (SelV) és una proteïna de mamífers homòloga de la Seleneoproteïna W (SelW), caracteritzada prèviament. El gen humà de la SelV codifica per a una selenoproteïna que conté un residu de Sec en el seu domini catalític. Gràcies a estudi previs amb programes bioinformàtics s’ha predit que la SelV podria tenir 5 exons, amb la selenocisteïna situada en el segon exó a prop de la regió C-terminal del polipèptid. La funció de la proteïna és encara avui desconeguda. (2)(3) La SelW juga un paper important en les neurones, protegint-les de l’estrès oxidatiu durant el desenvolupament neuronal.(1)(27)
Per aquesta proteïna obtenim una predicció tant per l’exonerate com pel genewise. L’scaffold obtingut és el gi|431920154|gb|KB030334.1, la seqüegrave;ncia comença en la posició 198990 i acaba en la 200368, incloent un total de 1378 nucleòtids repartits en 5 exons i 4 introns. El bit score obtingut és de 90.15 bits.
SelV es troba codificada en el mateix sentit que l’anotació (forward). Aquesta proteïna presenta un residu de selenocisteïna en el seu segon exó, aquest fet demostra que molt probablement el genoma de Pteropus alecto ha conservat aquesta selenoproteïna.
L’alineament obtingut, però, no inclou tota la seqüència de la query humana, el primer fragment no s’alinea. En canvi, l’alineament amb Pteropus vampyrus sí que és complet ja que aquesta query també és més curta. Aquest fet podria ser degut a una pèrdua d’aquest fragment al llarg de l’evolució del gènere Pteropus i per tant, és probable que en aquestes dues espècies aquesta selenoproteïna sigui més curta.
Tot i així, el genoma d’aquesta espècie segueix conservant una bon fragment d’aquesta selenoproteïna i per aquest motiu considerem l’anotació d’aquest gen en aquest genoma. A més, la seqüència conservada conté el motiu CxxU (redox box) i hem trobat elements SECIS en la regió 3’UTR de la nostra anotació, per tant, molt probablement, aquesta selenoproteïna ja és funcional malgrat haver perdut la porció inicial. Tot i això, no ha estat possible obtenir una predicció amb el Seblastian. A l’espècie Pteropus vampyrus s’han descrit fins un total de 3 subfamílies de SelW, de les quals una coincideix amb la humana, ja comentada. Respecte les altres dues s’han obtingut alineaments que indiquen que molt possiblement Pteropus alecto les presenta, encara que no se les coneix amb cap nomenclatura concreta (4)(16) (20).
SelTEs tracta d’una proteïna localitzada a l'aparell de Golgi i al reticle endoplasmàtic. Encara que la seva funció no ha estat ben descrita, s’ha vist que la seva deficiència altera l'adhesió cel•lular i millora l’expressió de gens oxidoreductors. Per tant, es sospita que estigui implicada en processos d'organitzaci6oacute; i ancoratge cel•lular.
En les prediccions realitzades la SelT es localitza en l’scaffold gi|431838610|gb|KB031157.1, a la cadena forward. Inclou 4 introns i 5 exons situats entre les posicions 1498826 i 151889, amb una longitud de 19993 nucleòtids i un score de 375.65 bits.
Els alineaments que s’obtenen amb el t-coffee a partir de les prediccions gèniques utilitzant els dos programes diferents són idèntics i presenten gran homologia amb la seqüència de la selenoproteïna humana i la del Pteropus vampyrus. La proteïna conté un residu de selenocisteïna que correspon al codó TGA i es pot identificar la caixa redox CxxU. S’ha predit un element SECIS situat a la regió 3’UTR, de la posició 1519392 a la 1519466 i els resultats del Seblastian indiquen que en aquesta regió genòmica hi ha la selenoproteïna.
Estudis previs demostren que aquesta selenoproteïna presenta una gran identitat entre tots els mamífers fins i tot a nivell de seqüència nucleotídica, de manera que és lògic que aquesta es trobi també en l’espècie estudiada.
SelHAquesta família la compon una sola proteïna que es troba al nucli, amb possible acció anti redox. Es troba a tots els vertebrats, per tant, l’esperem trobar i així resulta ser. El grau de conservació és força alt, ja que obtenim un alineament sencer tant entre humà com amb Pteropus vampyrus. De fet, la proteïna entre els dos ratpenats només difereix en un sol aminoàcid. Es troba a l’scaffold gi|431918504|gb|KB030399.1|, amb una llargada de 560 nucleòtids, ja que comença al nucleòtid 678635 i acaba al 679195 de la cadena forward. Té 2 introns i 3 exons. L’score del Genewise és de 208,23 bits. És una selenoproteïna, ja que s’alinea l’aminoàcid resultant d’un codó TGA amb una selenocisteïna. S’ha trobat un element SECIS en 3’UTR, però es troba a la posició 781161, massa allunyada de Sec segons la distància que caldria esperar. Cal destacar que presenta el motiu redox característic d’aquest grup (concretament, CTSU). Per tant, sembla ser que aquesta proteïna s’ha conservat i és funcional a Pteropus alecto, encara que caldria fer una cerca més exhaustiva d’elements SECIS.
És una selenoproteïna que també se l’ha relacionat amb la protecció de l’estrès redox, però es troba al cervell. Per tant, podria ser una proteïna molt important per tal de prevenir malalties cerebrals on l’estrès oxidatiu sigui important. De fet, se l’ha relacionada com a factor protector de l’Alzheimer. També es creu que té un paper important en la regulació del calci. Com a proteïna redox, esperaríem trobar el motiu [UC]XX[UC].
S'ha trobat SelM a la regió gi|431920835|gb|KB030308.1 de la cadena reverse tant fent l’anàlisi amb la query humana com amb la de Pteropus vampyrus. Té una longitud de 2339 bases, començant a la posició 4831826 i acabant a la 4829487. Segons l’exonerate conté 4 introns i 5 exons, en canvi, amb el genewise s’obtenen 3 introns i 4 exons, sent les posicions d'inici i final iguals. El bit score del genewise és de 195,95 bits. Tant amb el genewise com amb l'exonerate s'aconsegueix alinear tota la proteïna, encara que l’alineament del genewise no és tan bo. S'observa que hi ha una selenocisteïna i un element SECIS en 3'UTR a 4829453 amb una longitud de 72 nucleòtids, per tant es confirma que es tracta d’una selenoproteïna. També presenta el motiu redox. Els resultats es confirmem amb la predicció obtinguda amb el Seblastian (3)(7).
Aquesta selenoproteïna es troba a tots els vertebrats, es caracteritza per ser una glicoproteïna extracel•lular, de manera que juga un rol molt important en la homeòstasi del seleni i juga un paper crucial per l’activitat redox extracel•lular. A més, és una proteïna que s'uneix a heparina i s’associa amb les cèl•lules endotelials. Una característica important és que té moltes selenocisteïnes, en humans n’hi ha 10
Hem trobat aquesta proteïna a la regió gi|431896762|gb|KB031034.1 codificada en sentit contrari a l’anotació (cadena reverse), comença a 4584481 i acaba a la posició 4577581. Per tant, té 6900 nucleòtids continguts en 4 introns i 5 exons
Primer es va obtenir un alineament amb humà i es va aconseguir el primer tros, que només inclou una selenocisteïna. L’alineament amb Pteropus vampyrus va ser més exitós, i va permetre alinear gairebé totes les selenocisteïnes. S’observa que en el genoma d'interès s’han inserit varis aminoàcids. D’una banda, s’han inserit una regió d’una vintena d’aminoàcids rics en histidines i d’altra banda, una altra regió molt llarga (d’uns 150 aminoàcids) rica en serines i prolines. En aquest alineament es poden identificar 9 selenocisteïnes, encara que en falta una a l’extrem 5’, possiblement hi és però no l’hem aconseguit alinear. També hem pogut observar que hi ha un element SECIS a la regió 3’ UTR, a la posició 4577233
Per tant, tot i que no s’ha predit una selenoproteïna en aquest scaffold utilitzant seblastian, podem afirmar que Pteropus alecto conté aquesta selenoproteïna (2).
La Selenoproteïna S és una proteïna de membrana del reticle endoplasmàtic, que és important per la regulació de la homeòstasi d’aquest i la protecció antioxidant; participa en la translocació de les proteïnes mal plegades cap al citosol, on seran degradades. Regula la producció de citoquines i en humans juga un paper important en la inflamació. SelS es relaciona amb la susceptibilitat al càncer colorectal, a malalties coronàries, artritis, diabetis, etc.
De totes les isoformes humanes analitzades, la predicció que presenta un millor alineament es troba a la regió del genoma gi|431891658|gb|KB031138.1 a la cadena reverse entre les posicions 5042117 i 5025634 i un score de 304.63 bits
A la proteïna predita a partir del genoma de Pteropus alecto li manquen alguns aminoàcids inicials. La predicció amb l’exonerate inclou 6 introns i 7 exons i conté el residu de selenocisteïna. En canvi, la obtinguda amb el Genewise inclou 5 introns i 6 exons sense incloure aquest aminoàcid. S’ha predit un element SECI situat a la regió 3’-UTR, a la posició de 5025208 a 5025287 i els resultats del Seblastian confirmen que en aquesta regió genòmica hi ha SelN. No s’ha aconseguit realitzar un bon alineament amb la selenoproteïna de Pteropus vampyrus.
La Selenoproteïna I (SelI) és una de les últimes selenoproteïnes estudiades. Conté un domini CDP-alcohol fosfatidiltransferasa altament conservat, que és característic d’enzims colina fosfotransferases (CHPT1) i colina/etanolamina fosfotransferases (CEPT1). Aquesta selenoproteïna conserva 7 dominis transmembrana corresponents a les topologies CHPT1 i CEPT1, i les regions crítiques per la seva funció són 3 residus d’àcid aspàrtic situats entre el primer i el segon domini transmembrana
La principal diferència entre SelI i les seves homòlogues és l'extensió C-terminal que conté la Selenocisteïna (Sec). La funció d’aquesta extensió C-terminal és encara desconeguda però no s’han trobat cisteïnes amb homologia amb l’extensió a la part C-terminal de la SelI
SelI es localitza en l’scaffold gi|431911798|gb|KB030580 de la cadena forward entre les posicions 15684079 a la 15697369 i inclou 5 introns i 6 exons. L’score és de 426.07 bits
En els alineaments obtinguts a partir de les prediccions gèniques realitzades, tant amb la seqüència de la selenoproteïna humana com amb la de Pteropus vampyrus s’obté una proteïna més curta, a la qual li manquen els primers aminoàcids (s’inicia l’alineament a partir de l’aminoàcid 171). és important destacar que és en aquest fragment absent on es troben els dominis CDP-alcohol fosfatidiltransferasa i els aminoàcids crítics per la seva funció.
Per altra banda, el residu de selenocisteïna es manté a la part final de la proteïna predita i s’ha trobat un element SECIS situat a la regió 3’-UTR, a la posició de 15698603 a 15698685
Per tant, encara que li manca la part de l’extrem N-terminal podríem dir que la SelI es troba a Pteropus alecto. Els resultats del Seblastian també identifiquen aquesta proteïna en aquesta regió genòmica, malgrat que li manquin els primers aminoàcids. Ara bé, tenint en compte que aquest és important per la seva funció, probablement hi hagi un error en la predicció o bé els programes utilitzats no permetin que aquesta sigui del tot completa
Aquesta selenoproteïna està formada per dues isoformes que s'expressen en múscul esquelètic, cervell, pulmó i placenta; la isoforma 2 és expressada també en cor, diafragma i estómac. Es relaciona amb una correcta funcionalitat dels músculs i presenta dominis d’interacció amb el calci
Segons les prediccions realitzades SelN es localitza en l’scaffold gi|431891056|gb|KB031148.1 a la cadena reverse, entre les posicions 97169991 a 9659189 i amb un score de 792.57 bits.
Pel que fa a l’alineament amb la selenoproteïna humana, s’observa que hi ha certa homologia però que a la proteïna predita a partir del genoma de Pteropus alecto li manquen alguns aminoàcids. Tot i així, el nombre d’introns i exons és diferent en ambdós programes: 14 introns i 15 exons amb l’exonerate i 9 introns i 10 exons amb el Genewise, fet que causa que la predicció amb aquest programa sigui de menor longitud
La seqüència de la selenoproteïna de Pteropus vampyrus és més curta que la humana i presenta més homologia amb la selenoproteïna predita en Pteropus alecto, ja que li manquen menys aminoàcids a l’extrem C-terminal. El residu de selenocisteïna es conserva en la proteïna i s’ha predit un element SECIS situat a la posició de 9659186 a 9659278, encara que aquest es troba a l’extrem 3’ i se solapa amb una part del darrer exó. No s’ha pogut predir SelN en aquesta regió genòmica amb el Seblastian.
Per tant, podem dir que aquesta selenoproteïna està present en el Pteroptus alecto, conté selenocisteïna però li manquen aminoàcids a l’extrem c-terminal, ja sigui perquè la proteïna de Pteropus alecto a és més curta o perquè la predicció realitzada no ha estat del tot completa.
La selenoproteïna 15-KDa (Sep15) és una tiroredoxina-like localitzada en el reticle endoplasmàtic (RE) i que està implicada en el control del plegament de les glicoproteïnes a través de la seva interacció amb la UDP-glucosa: glucoproteïna glucosiltransferasa. Ara bé, la seva funció específica és desconeguda. El seu domini catalític, l’oxidoreductasa conté un residu de selenocisteïna. S’ha descrit una up-regulació de la selenoproteïna en resposta del sistema adaptatiu a l’estrès del RE. L’expressió de Sep15 és alta en els teixits secretoris com el fetge, els ronyons, la pròstata i la glàndula tiroides.
S’ha descrit la seqüència completa del gen de Sep15 en el genoma humà la qual està formada per 51 kbp, 5 exons i 4 introns.
Per la Sel15 hem obtingut una predicció tant per la query humana com per la de Pteropus vampyrus que situa la proteïna en l’scaffold gi|431896833|gb|KB031032.1, iniciant-se en la posició 31357123 i acabant en la 31327528, amb un total de 29595 nucleòtids. Amb l’exonerate s’obté una predicció que inclou 5 exons i 4 introns, en canvi, amb el genewise s’obtenen 5 exons, 4 introns i un score de 190.47 bits. La proteïna està codificada en el sentit oposat al de l’anotació.
Amb tot això, veiem que el genoma de Pteropus alecto molt probablement conté el gen de la Sel15 i que aquest ha estat conservat com a una selenoproteïna. A més, aquesta hipòtesi es veu reforçada amb els estudis previs que han descrit, en humans, el gen de la Sel15 amb 5 exons i 4 introns.
Ara bé, en contraposició a la nostra hipòtesi no ha estat possible trobar cap element SECIS en la regió 3’-UTR del gen predit (11)(13)(15).
La selenoproteïna K (SelK) és una proteïna situada en el RE de 11 kDa. La seva funció exacte és desconeguda però es creu que està relacionada amb la resposta del RE davant l’estrès. (1)
S’ha obtingut una predicció tant per la query humana com per Pteropus vampyrus que situen la seqüència que codifica per aquesta proteïna en l’scaffold gi|431899758|gb|KB030947.1. Es troba codificada en el mateix sentit que l’anotació (forward), s’inicia en la posició 497357 i acaba en la 448356, incloent un total de 49000 nucleòtids. La predicció per l’exonerate inclou 5 exons i 4 introns mentre que la del genewise 3 exons, 2 introns i un score de 173.94 bits.
Aquests resultats han estat corroborats amb la cerca dels elements SECIS ja que s’ha pogut trobar-ne un a la regió 3’-UTR de la nostra anotació. A més, amb el Seblastian s’ha obtingut una predicció que corrobora que aquesta seqüència correspon a la SelK (23).
família de selenoproteïnes O (Sel O) tenen un sol residu de selenocisteïna i alguns membres d’aquesta família són homòlogues amb cisteïna. En molts eucariotes i alguns bacteris, Sel O, es troba present en una sola còpia, mentre que en alguns metazous i alguns bacteris s’han descrit duplicacions.
Actualment, SelO és una proteïna que no ha estat caracteritzada i de qui només s’han fet estudis estructurals i funcionals (se'n desconeix la funció). S’ha vist que les Sel O sovint presenten un motiu: Cys-x-x-[Cys/Sec]-x-x-> a l’extrem C’ terminal, on > indica la terminació del pèptid. Aquests dominis són reminiscències d’una funció oxidoreductasa.
Per la Sel O obtenim una predicció per l'exonerate a l’scaffold gi|431899529|gb|KB030957.1. La proteïna es troba codificada en el sentit oposat a l'anotació (revers), es situa entre la posició 497357 i la 448356 i inclou un total de 49000 nucleòtids. La predicció amb l'exonerate inclou 16 exons i 15 introns i la del genewise 8 exons i 7 introns, amb un score de 846.41 bits.
En l’alineament obtingut hi ha una regió en l’inici de la selenoproteïna que no s’aconsegueix alinear, ja sigui perquè s’ha produït una pèrdua evolutiva d’aquest fragment o bé perquè no s’ha aconseguit fer una predicció completa.
Aquesta proteïna ha estat conservada en Pteropus alecto com una selenoproteïna, ja que el residu de selenocisteïna s'ha conservat en el darrer exó i s’obté la predicció d’un element SECIS situat a la regió 3’UTR amb el SECISearch. A més, també es conserva el domini CxxC (redox box) en la regió C-terminal i la predicció amb el Seblastian concorda amb la predicció obtinguda (7)(8).
En molts mamífers, com els humans i els ratolins, totes les proteïnes que formen part de la família de les selenoproteïnes U (SelU) s’han trobat com a homòlogues amb cisteïna. Totes les SelU que contenen selenocisteïna pertanyen a la subfamília de SelU1, la funció de la qual és desconeguda, encara que per alguns dels seus dominis es creu que podrien formar part de la superfamília de les tioredoxines-like. Per contra, en SelU2 i SelU3 no s’han identificat selenocisteïnes. (12)
Pel que fa a SelU1, s’obté una predicció tant amb la query humana com amb la de Pteropus vampyrus localitzada en l’scaffold gi|431904035|gb|KB030800.1. La seqüència inclou un total de 8746 nucleòtids, entre la posició 5776116 i 5767370 i codifica en el sentit oposat a l’anotació (reverse). Amb l’exonerate s’obtenen 5 exons i 4 introns, mentre que amb el genewise 4 exons, 3 introns i un score de 382.87 bits.
Així doncs, malgrat obtenir només un bon alineament amb l’exonerate, considerem que aquest gen s’ha conservat en el genoma de Pteropus alecto com a un homòleg en cisteïna tal i com té lloc en humans. A més, com és d’esperar, no hem trobat cap element SECIS.
SelU2En el cas de SelU2, es troba a l’scaffold gi|431897827|gb|KB031011.1 i es troba codificada en el sentit de l’anotació (forward). La seqüència de SelU2 està entre les posicions 169464 i 177521 i té un total de 8057 nucleòtids. La predicció amb l’exonerate inclou 6 exons i 5 introns i la del genewise, en canvi, 5 exons i 4 introns, amb un score de 320.03 bits. La predicció amb la query de Pteropus vampyrus és molt similar a la realitzada amb la query humana.
De la mateixa manera que SelU1, la SelU2 ha estat conservada en el genoma de Pteropus alecto com a una homòloga amb cisteïna i tampoc s’ha predit cap element SECIS.
SelU3Finalment, per l’últim membre d’aquesta família, SelU3, obtenim una predicció a partir de la query humana i de Pteropus vampyrus a l’scaffold gi|431918661|gb|KB033790.1. La seqüència inclou 502 nucleòtids entre les posicions 3 i 505, està formada per 2 exons i 1 intró codificats a la cadena forward. El score és de 173.00 bits.
No s’ha aconseguit obtenir un alineament complet de la seqüència proteica malgrat haver allargat la regió a estudiar fins a la posició zero de l’scaffold. Per tant, probablement la seqüència que codifica per la primera part d’aquesta es troba a l’scaffold anterior i caldria ampliar l’estudi tenint en compte aquesta regió.
Com la resta de proteïnes d’aquesta família, la SelU3 es troba conservada en el genoma de Pteropus alecto com a una homòloga en cisteïna i tampoc ha estat possible obtenir una predicció d’elements SECIS.
La família de les iodotirosines deionidases (DI) està formada per un grup de tres enzims, la DI1, la DI2 i la DI3 que s’encarreguen d’activar o desactivar les hormones tiroïdals. Aquestes selenoproteïnes actuen mitjançant una deiodinació reductora. La família DI es troba conservada en tots els vertebrats i a més, els seus membres presenten una alt grau d’homologia ja que per a dur a terme la seva funció necessiten d’un plegament en tioredoxina per adoptar una estructura terciària determinada. (14)
DI1:Aquest enzim catalitza l’activació de l’hormona tiroïdal mitjançant la conversió de la tetraiodotironina (T4) per desiodació del seu anell exterior a la hormona triiodotironina (T3) que és la forma bioactiva. A més, aquesta selenoproteïna degrada ambdues hormones, la T4 i la T3, per desiodació del anell interior. L’splicing alternatiu d’aquesta selenoproteïna permet obtenir múltiples variants de transcripció que codifiquen diferents isoformes. Algunes d’aquestes variants contenen una selenocisteïna (Sec).
DI2:Aquest enzim, de la mateixa manera que el DI1, pot convertir la prohormona tiroxina (T4) per desiodació en la forma bioactiva, la T3. Aquesta proteïna també conté Selenocisteïna. L’splicing alternatiu d’aquesta selenoproteïna dóna lloc a diverses isoformes.
DI3:Característicament el gen que codifica per aquest enzim no presenta introns. El DI3 catalitza la inactivació de de T4 i T3 donant lloc als metabòlits inactius rT3 i T2, respectivament. Aquesta proteïna, al igual que les anteriors, conté un residu de selenocisteïna.
Pel que fa a la selenoproteïna DI1 hem obtingut una predicció localitzada en l’scaffold gi|431896833|gb|KB031032.1 i codificada en el mateix sentit que l'anotació (forward). A més, veiem que correspon a una selenoproteïna que s’ha conservat en la espècie estudiada ja que disposa d’un residu de selenocisteïna codificat en el segon exó. El gen d’aquesta selenoproteïna inclou un total de 15387 nucleòtids compresos entre la posició 6131014 i la 6146401, que inclou 4 exons, 3 introns i un score de 442.67 bits.
El programa SECISearch3 ha identificat un element SECIS situat en la regió 3’-UTR de la predicció.
Amb el Pteropus vampyrus també obtenim la mateixa predicció que amb la query humana, amb el mateix scaffold i posicions. Aquest fet, juntament amb el resultat del Seblastian corroboren la nostra hipòtesi de conservació d’aquesta selenoproteïna.
DI2La predicció obtinguda per a la proteïna DI2 se situa en l’scaffold gi|431839086|gb|KB031153.1, amb inici en la posició 7171146 i final en la 7162396. La codificació té lloc en sentit reverse i inclou un total de 8750 nucleòtids que es corresponen a 3 exons i 2 introns, amb un score de 545.34 bits.
L’alineament obtingut amb la query humana no és complert ja que falten els últims 8 aminoàcids, que tampoc es troben presents a la proteïna DI2 de Pteropus vampyrus.
La query humana conté 3 residus de selenocisteïna dels quals dos s’han pogut alinear i per tant podem considerar que aquesta s’ha conservat com a una selenoproteïna en el genoma d’estudi. A més, s’ha identificat un element SECIS en l’extrem 3’-UTR de la seqüència. Per la query de Pteropus vampyrus no s’ha pogut alinear la única selenocisteïna que aquesta presenta, però aquest residu correspon a un dels que si s’ha pogut alinear amb la query humana.
Per tant, si es comparen les tres seqüències podem veure com Pteropus alecto ha perdut una Sec presentant una major homologia amb la seqüència humana que la de Pteropus vampyrus, la qual n’ha perdut dues.
DI3La DI3 és troba en el mateix scaffold que la DI2, estant codificada per 833 nucleòtids compresos entre la posició 22448437 i 22449270. La predicció inclou un únic exó i un score de 629.90 bits, i té lloc en sentit forward.
Es tracta d’una selenoproteïna ja que disposa d’un residu de selenocisteïna en la seva seqüència. A més, s’ha predit un element SECIS en l’extrem 3’-UTR de la selenoproteïna i el Seblastian corrobora la nostra hipòtesi.
No ha estat possible obtenir una predicció amb el Pteropus vampyrus per a DI3 ja que aquest no disposa de queries per a aquesta proteïna.
Aquesta família de selenoproteïnes és molt important per prevenir l’estrès redox. Això fa que sigui una família altament conservada en els mamífers. A tots els vertebrats s’han descrit les selenoproteïnes GPx1-4, que esperem trobar. En humans en total trobem 8 homòlegs: a part de les 4 esmentades també hi ha la GPx6 com a selenoproteïna i la GPx5, GPx7 i GPx8 com a homìlegs amb cisteïna.
A Pteropus alecto hem trobat 7 proteïnes d’aquesta família. Aquest procès ha estat difícil ja que totes 8 proteïnes presenten un alt grau d’homologia entre elles i al fer el blast d’una GPx humana trobavem homologia amb totes les GPx de Pteropus alecto, dificultant la caracterització de cadascuna d’elles.
Respecte a aquesta proteïna s’ha descrit un pseudogen en molts organismes. Tenint en compte que en el blast hi havia dos scaffolds amb un e-value molt més petit respecte els altres, considerem que Pteropus alecto també el presenta. És difícil determinar quina seqïència és el pseudogen i quina codifica per la proteïna al fer l’alineament, a continuació s’expliquen i es valoren les dues troballes.
Hem identificat el gen de GPx1 a l’scaffold gi|431913378|gb|KB030552.1 entre la posició 686364 i 685525, ocupant 840pb de la cadena reverse i s’organitza en 1 intró i 2 exons amb un bit score de 407,46. L’alineament és molt bo tant a partir de les dades extretes del genewise com les de l’exonerate, però a inici l’alineen diferent: amb l’exonerate l’alineament no comença amb una metionina, però amb el genewise sí.
L’alineament conté la selenocisteïna i s’ha predit un element SECIS a la posició 685476 de l'extrem 3’UTR. Concloem que aquest és el gen que codifica per la selenoproteïna GPx1 a Pteropus alecto, resultats que concorden amb el Seblastian.
L’altre scaffold amb alta homologia per GPx1 és gi|431893634|gb|KB031080.1. L’alineament més bo aconseguit ha estat el situat entre 2600597 i 2601005 de la cadena forward, que correspon a un sol exó. Aquesta regió no inclou la possible selenocisteïna, així que vam allargar pel davant per trobar el primer exó. Ens vam trobar amb un fet curiós, i és que s’ha perdut una base, concretament un timdina, de manera que s’altera el marc de lectura:
Les regions en verd són regions que hem aconseguit alinear bé, però de forma independent. En groc s’aprecia el codó que codifica per la selenocisteïna. En vermell s’indica el codó que ha perdut una base. Si ens fixem la seqüència humana per aquesta regió veiem que on hi ha les GG codifica per una arginina, per tant, que el DNA en aquest locus és GGT. Aquesta T és la que s’ha perdut en Pteropus alecto, de manera que aquesta selenoproteïna no pot ser funcional. Això pot indicar que es tracta del pseudogen, no sotmès a pressió evolutiva. Tot i així, no ha perdut l’element SECIS en 3’UTR, que es troba a la posició 2601056.
GPX2GPx2 es troba a l’scaffold gi|431904446|gb|KB030790.1 des de la base 3552818 a la 3550007 de la cadena reverse, amb una longitud de 2811 nucleòtids. Té 1 intró i 2 exons amb un bit score de 431,22. Els dos alineaments fets amb el t-coffee són complerts, permeten concloure que s’ha conservat la selenocisteïna. A més, veiem que en aquesta cadena hi ha un element SECI a la base 3549785, a la regió 3’UTR I es confirmen els resultats amb el Seblastian.
GPX3Aquesta proteïna es troba codificada a l’scaffold gi|431918010|gb|KB030406.1 amb una longitud de 7361 nucleòtids, des de la posició 2453691 a la 2461052 de la cadena forward amb 4 introns i 5 exons i un score de 462,86 bits. Els alineaments obtinguts inclouen la selenocisteïna i s’ha trobat un element SECI a la posició 2461700 a 3’UTR. Aquest fet, juntament amb la predicció del Seblastian, reforcen la hipìtesi que aquesta selenoproteïna està conservada en Pteropus alecto.
GPX4Respecte GPx4 s’ha trobat una seqüència d’alta homologia a l’scaffold gi|431922172|gb|KB030265.1, des de la posició 452367 a la 454385 de la cadena forward, amb una allargada de 2018 nucleòtids, en 6 introns i 7 exons. El bit score és de 341,13.
Els alineaments generats presenten una homologia elevada amb alineament de Sec, encara que el del genewise inclou quatre aminoàcids menys. S’ha trobat un element SECI dins la regió 3’UTR, concretament a la posició 454440, però el Seblastian no ha predit cap selenoproteïna.
GPX5Aquest homòleg amb cisteïna està present al genoma de Pteropus alecto a l’scaffold gi|431914530|gb|KB030530.1 des de la base 519660 a la 512608 de la cadena reverse, n’ocupa 7052 organitzades en 4 introns i 5 exons. Té un bit score de 406,55. L’alineament a partir del t-coffee permet confirmar que aquesta proteïna s’hi troba present. Hem trobat un elements SECIS a la regió 3’UTR però està força allunyats (més de 10000 bases). Aixì podria ser degut a que GPx5 es va originar a partir de GPx3 i el fet de que estigui tan allunyat denota que ja no és essencial per a aquesta proteïna.
GPX6Aquesta selenoproteïna es troba a l’epiteli olfactori i no és essencial per la supervivència. De fet, aquesta espècie tampoc presenta la proteïna AOB de l’epitel olfactori, fet que podria estar relacionat amb la possible absència de GPx6. D’altra banda, el seu paràlog, GPx4 també s’ha vist que pot expressar-se a aquest epiteli.
Amb els resultats obtinguts no podem afirmar completament que Pteropus alecto tingui aquesta selenoproteïna. D’una banda, encara que a l’scaffold gi|431908899|gb|KB030660.1 no hem obtingut un alineament molt bo s’ha identificat un codó TGA a la posició 19008313 de la cadena reverse i un element SECIS a 3’UTR, a la posició 18927675. D’altra banda, no hem trobat la metionina inicial i amb el Seblastian no hem obtingut cap predicció.
Per tant, podria ser que aquesta anotació sigui una duplicació d’una altra glutatió peroxidasa o bé la GPx6, no anotada a Pteropus vampyrus (10).
GPX7Trobem l’homòleg amb cisteïna GPx7 a l’scaffold gi|431896833|gb|KB031032.1 amb una longitud de 5236 nucleòtids, des de la posició 5079994 a la 5085230, amb 2 introns i 3 exons a la cadena forward. El bit score és de 396,86. S’ha aconseguit alinear amb els dos programes emprats i concloem que està present.
GPX8També s’ha trobat aquest homòleg amb cisteïna a l’scaffold gi|431908567|gb|KB030662.1 entre les posicions 5381924 i 5385953 de la cadena forward, organitzat en 2 introns i 3 exons i amb una longitud de 4029 nucleòtids. Té un bit score de 411,46. L’alineament aconseguit és molt bo i complet.
Els resultats comentats es basen en els alineament entre les seqüències humanes i les de Pteropus alecto, per6ó els hem comprovat alineant també amb Pteropus vampirus, ja que presenta un major grau d’homologia i ens ha permès acabar de discernir entre les diferents subfamílies. Els resultats coincideixen i ens permeten observar que tot i que la homologia entre Homo sapiens i Pteropus alecto sigui força elevada, l’homologia entre els dos ratpenats encara ho és més, com és d’esperar.
Són enzims que serveixen per reciclar les tioredoxines, aportant-los els electrons del NADPH perquè adoptin l’estat reduït. Estan involucrades en la regulació redox de processos cel•lulars i medien el pas final de la transferència d’electrons per la reducció de nucleòsids difosfat.
En mamífers existeixen diverses formes d'aquesta selenoproteïna que tenen diferent funció i localització: TR1, que es troba principalment al citosol; TR2 (TGR), a nivell mitocondrial i TR3, específica de testicles. Hi ha diversos transcrits (formes de splicing) o isoformes proteiques de cada TR.
Aquests isoenzims contenen un domini que presenta homologia estructural i funcional amb les glutations reductases (GRx). També presenten la seqüència CVNVGC a la regió N-terminal i el tetranucleòtid GCUG en el C-terminal, ambdues molt conservades i essencials per la seva funció. Està ben descrit que les selenoproteïnes que contenen selenocisteïna en aquesta posició tenen un poder catalític molt superior a les proteïnes homòlogues que contenen un residu de cisteïna.
Les proteïnes TR1, TR2 i TR3 trobades a Pteroptus alecto presenten una homologia elevada amb les corresponents proteïnes humanes i en els alineaments obtinguts amb l’exonerate es manté la selenocisteïna formant part del domini GCUG, fet que no passa amb el genewise. A més, també conserven el dominis catalítics CVNVGC, fet que reforça la hipòtesi de que aquestes selenoproteïnes es trobin en el genoma estudiat i puguin ser funcionals.
En els alineaments amb Pteropus Vampyrus, les seqüències proteiques són més curtes que en humans i en aquests casos no es manté la selenocisteïna i no hi ha el domini GCUG (21).
Segons les prediccions realitzades, TR1 es localitza a la cadena reverse de l’scaffold gi|431905215|gb|KB030754.1. Es troba entre la posició 5724262 i 5626365, un total de 97897 nucleòtids. El bit score és de 1090,23. Segons la predicció de l’exonerate la seqüència inclou 16 introns i 17 exons, mentre que el genewise prediu un exó i un intró de més.
S’ha predit un elements SECIS situat de la posició 5626136 a 5626063, a 3’UTR i els resultats del Seblastian indiquen que en aquesta regió genòmica hi ha aquesta selenoproteïna.
S’han pogut predir altres proteïnes que també presenten homologia amb TR1 en altres scaffolds, però s’ha comprovat que corresponen a altres membres d’aquesta família, la qual cosa no és sorprenent perquè tenen una seqüència molt similar.
Pel que fa a l’alineament amb la selenoproteïna de Pteropus vampyrus, de seqüència més curta que la humana, aquest s’ha obtingut en el mateix scaffold però sense alinear el residu de Selenocisteïna.
TR2TR2 es localitza en l’scaffold gi|431904373|gb|KB030791.1 a la cadena forward, entre la posició 4970417 i la 5054891 i amb un score de 819.01 bits. La predicció amb l’exonerate inclou 16 introns i 17 exons i l’alineament no conté la primera metionina alineada. La predicció amb el genewise, en canvi, conté 15 introns i 16 exons i a l’alineament manquen més aminoàcids.
S'ha predit un element SECIS situat a l’extrem 3’UTR a la posició 5056155 i els resultats del Seblastian indiquen que en aquesta regió genòmica hi ha aquesta selenoproteïna.
TR3Aquesta selenoproteina es localitza en l’scaffold gi|431909979|gb|KB030631.1, a la cadena reverse, entre les posicions 857255 i 749872 i amb un score de 1115,47 bits.
La predicció amb l’exonerate inclou 18 introns i 19 exons i la del genewise, 15 introns i 16 exons. En ambdós alineaments manquen els tres primers residus de la proteïna.
S’ha predit un element SECIS a la posició 749663 a 749585 de l’extrem 3’-UTR i els resultats del Seblastian indiquen que en aquesta regió genòmica hi ha aquesta selenoproteïna.
Al llarg de l’estudi hem determinat que Pteropus alecto conserva força selenoproteïnes i per tant, és d’esperar que en el genoma d’aquest també hi siguin presents els gens que codifiquen per la maquinària necessària per a la biosíntesi d’aquestes.
Encara que no tots els alineaments presentin una homologia completa i ens alguns casos faltin alguns residus en la proteïna predita, podem concloure que Pteropus alecto presenta les proteïnes següents: PSTK, SPS1, SPS2, SecP43, eEFSec, SBP2 i SecS.
D’entre totes aquestes, SPS2 és l’única que és una selenoproteïna i s’ha descrit en tots els vertebrats. En Pteropus alecto, es troba a l’scaffold gi|431917619|gb|KB030418.1 a la cadena reverse entre les posicions 5935201 i 6022571 i amb un score de 570.49 bits.
S’ha obtingut un millor alineament amb l’exonerate que amb el genewise, que inclou 12 introns i 13 exons.
Pel que fa al residu de la selenocisteïna, en les prediccions realitzades amb ambdós programes i utilitzant tant la selenoproteïna humana com amb la de Pteropus vampyrus s’observa que aquest s’ha substituït per una treonina (T).
Per altra banda, tot i que s’ha predit un element SECIS de la posició 5998272 a 5857797 a l’extrem 3’, aquest es solapa amb una part del darrer exó de la seqüència. Tampoc s’ha pogut predir aquesta selenoproteïna en aquesta regió genómica amb el Seblastian.
Els resultats obtinguts en els dos alineaments ens fan pensar que la substitució de la selenocisteïna per un residu de treonina no compromet la funcionalitat d’aquest enzim, ja que aquest és necessari per a dur a terme la biosíntesi de selenocisteïnes, és l'encarregat de la generació del selenofosfat, el compost donador de Seleni.
Un cop analitzats tots els resultats obtinguts al llarg de l’estudi podem concloure que Pteropus alecto presenta el selenoproteoma compartit de tots els vertebrats: GPx1-4, TR1, TR3, SelH,DI1, DI2, DI3, SelI, SelK, SelM, SelN, SelO, SelP, MsrB1 (methionine-R-sulfoxide reductase 1), SelS, SelT1, SelW1 i Sel15.
Les prediccions realitzades per homologia indiquen que l’organisme d’estudi presenta totes les selenoproteïnes anotades en humans. Tot i així, en alguns casos no s’ha pogut aconseguir un alineament perfecte que inclogui tots els residus i respecte GPx6, com ja s’ha comentat, no podem arribar a resultats concluents. Tambè s’observa que presenta totes les selenoproteïnes de Pteropus vampyrus, a més de la selenoproteïna DI3, absent en aquest.
Per tant, aquest estudi reforça la idea que les selenoproteïnes són importants i per aquest motiu es conserven en diferents espècies, com és el cas de Pteropus alecto, demostrant la seva rellevància biològica.