Estudi de les selenoproteïnes de

Miniopterus natalensis




Abstract

Introducció

Materials i mètodes

Resultats

Discussió

Conclusions

Referències

Agraïments

Autores

DISCUSSIÓ

Per tal de realitzar la discussió, hi ha hagut una sèrie de premisses que s’han tingut en compte per a fer un correcte anàlisi de resultats.

En primer lloc, a causa de la gran quantitat de dades que s’han obtingut després de realitzar la predicció de totes les proteïnes per Mus musculus i Myotis lucifugus, per a cada gen s’han seleccionat els millors alineaments, tenint com a criteri, a part de la interpretació subjectiva de cada participant, l’SCORE obtingut en el t-coffee. També s’ha de tenir en compte que tots aquells hits amb un e-value en el BLAST superior a e-15 també s’havien descartat prèviament.

Hi ha casos en els quals les queries de Mus musculus i Myotis lucifugus coincideixen en scaffolds i en posicions similars; en aquests casos sempre triarem la predicció provinent de Myotis lucifugus per mirar exons i posició ja que és una espècie més propera a la nostra.


També hi ha casos on els exons predits per exonerate i SEBLASTIAN són diferents. Tenint en compte que molts cops SEBLASTIAN ens compara amb la nostra pròpia espècie -ja que moltes de les proteïnes del nostre genoma estaven anotades en una base de dades per selenoproteïnes-, elegirem preferencialment la predicció de SEBLASTIAN.


Per tal de poder visualitzar millor les relacions entre espècies hem fet aquest arbre filogenètic que en cas de dubte ens permetrà decidir quina predicció triar en funció de la proximitat entre Miniopterus natalensis i les altres espècies.

Finalment, relacionat amb la maquinària que s’encarrega de la seva producció, assumirem que no tenen ni SECIS ni selenoproteïnes, tot i que potser fa poc que han perdut la selenocisteïna i encara no ha passat suficient temps com per veure canvis en el SECIS.


Sel15

La selenoproteïna de 15 kDa (Sel15) pertany a la família de selenoproteïnes Sep15 / M. La funció exacta d'aquesta proteïna no es coneix, tot i que s'ha associat amb el control de qualitat de plegament de proteïnes en el reticle endoplasmàtic [14].


Després de fer el BLAST trobem, amb un e-value de 2e-19, la seqüència de la proteïna situada en l’scaffold LDJU01000069.1, concretament, entre les posicions 5675992 i 5656480. En aquest cas es tracta de cadena reversa i conté els següents exons:


Exó 1: 5679741 - 5679803

Exó 2: 5675825 - 5675992

Exó 3: 5664594 - 5664657

Exó 4: 5657816 - 5657865

Exó 5: 5656480 - 5656608


Al fer la predicció amb t-coffee, la selenocisteïna que apareix, tant a Sel15 de ratolí com a la de microbat, també es troba conservada a M. natalensis. Tot i això, la predicció feta amb el SEBLASTIAN no ens prediu cap SECIS, però el fet que mantingui la selenocisteïna ens fa pensar que hi ha hagut algun problema a la predicció d’aquest element.


GPx

Aquestes proteïnes pertanyen a la família de la glutatió peroxidasa, encarregades de catalitzar la reducció de hidroperòxids orgànics i peròxid d'hidrogen (H2O2) a glutatió, per tal de protegir les cèl·lules contra el dany oxidatiu. Hi ha diversos isozims d'aquesta família de gens en els vertebrats, que varien en localització cel·lular i l'especificitat de substrat [15].


GPx1 - GPx2

GPx1 presenta un cas especial ja que, tot i que existeix en ambdues espècies, en el cas de GPx1 es considera com a “Cysteine-containing homologs or selenium machinery genes”, i en ratolí es contempla que té una selenoproteïna.

Després de realitzar el BLAST, hem trobat la proteïna en els scaffolds LDJU01000232.1, amb un e-value de 1e-17, i LDJU01000087.1, amb un e-value de 5e-26. Aquests estan situats entre la posició 1827615 i la 1826804 de la cadena reversa i la posició 3581050 i la 3584182, respectivament. Al comparar els SCOREs dels alineaments obtinguts en ratolí, observem que són els mateixos per a ambdues scaffolds, per aquest motiu, podem predir que podria tractar-se d’una duplicació de la proteïna GPx1 en Miniopterus natalensis ja que, a més, es troben en posicions genòmiques molt separades, per tant, aquesta espècie té gens paràlegs per aquesta proteïna. Cal esmentar també que els SCOREs del microbat eren diferents i en una primera selecció s’havia descartat LDJU01000087.1, tot i que vist que són paràlegs es seguirà estudiant.

Al scaffold LDJU01000087.1, trobem 1 exó:


Exó 1: 5015 - 5257

Al scaffold LDJU01000232.1, trobem 1 exó segons exonerate, i 2 exons segons SEBLASTIAN:


Exó 1: 5530 - 5712

Exó 2: 4898 - 5254

Respecte a les selenocisteïnes, analitzarem en la query de ratolí ja que recordem que la de microbat no en presentava, estava considerada com “Cysteine-containing homologs or selenium machinery genes”:

  • Al scaffold LDJU01000087.1, el t-coffee es prediu que es conserva la selenocisteïna. A aquesta predicció li dóna més rellevància el fet de trobar un SECIS de cadena positiva en 3’-UTR. A més, la predicció de SEBLASTIAN amb la nostra pròpia espècie ens corrobora la presència d’una selenocisteïna a l’exó 1.

  • Al scaffold LDJU01000232.1, el t-coffee es prediu que es conserva la selenocisteïna. A aquesta predicció li dóna més rellevància el fet de trobar un SECIS de cadena negativa en 3’-UTR. A més, la predicció de SEBLASTIAN amb la nostra pròpia espècie ens corrobora la presència d’una selenocisteïna a l’exó 1.


Amb tot això podem afirmar que Miniopterus natalensis segueix mantenint la selenoproteïna per aquest gen i que, per tant, microbat la va perdre en algun punt evolutiu posterior a la separació d’aquestes dues espècies.


En quant a GPx2, quan hem fet el BLAST hem trobat la proteïna als scaffolds LDJU01000087.1 i LDJU01000232.1 tant a ratolí com a microbat. La còpia de la seqüència de GPx2 encabida dins el scaffold LDJU01000087.1 es troba entre les posicions 3581062 i 3584191, mentre que la que es troba al scaffold LDJU01000232.1 ocupa l’espai entre les posicions 1827609 i 1826822, ja que és de cadena reversa. Totes aquestes dades ens porten a la conclusió que GPx1 i GPx2 són un mateix gen en Miniopterus natalensis (la predicció de SECIS ens indica que també són els mateixos per ambdues).


Cal comentar també que, en el cas de la comparació amb les querys de microbat, dues proteïnes de la família de les GPx, GPx_None2 i GPx_None3, després de comprovar la taula del BLAST, també han aparegut al scaffold LDJU01000232.1, a posicions molt semblants a GPx2 i GPx1. A més a més, l’element SECIS predit per a aquestes dues proteïnes és el mateix que a les proteïnes GPx1 i GPx2, de manera que sembla que aquestes dues proteïnes que són diferents a microbat, també són la mateixa a Miniopterus natalensis.


GPx3 - GPx5 - GPx6

Un cop fet el BLAST trobem que coincideixen dos scaffolds significatius quan ho comparem amb la proteïna de microbat i la ratolí. El primer scaffold en el que trobem la proteïna és LDJU01000117.1, amb un e-value de 2e-37, concretament entre les posicions 4179054 i 4176522, ja que és cadena reversa. En el segon cas, amb un e-value de 2e-22, trobem la seqüència situada al scaffold LDJU01000689.1, entre les posicions 31625 i 39640. Al comparar els SCOREs del alineament final veiem que són els mateixos a totes dues scaffolds, de manera que podria tractar-se d’una duplicació de la proteïna GPx3, de manera que Miniopterus natalensis, podria tenir gens paràlegs per aquesta proteïna.

Quan mirem el nombre d’exons ens trobem que:

En el cas del paràleg del scaffold LDJU01000117.1, veiem que se’n prediuen 6 si mirem la comparació amb la query de microbat i 5 amb SEBLASTIAN:


Exó 1: 4179284 - 4179323

Exó 2: 4178898 - 4179086

Exó 3: 4177646 - 4177763

Exó 4: 4177099 - 4177198

Exó 5: 4176498 - 4176716


En el cas de la còpia del scaffold LDJU01000689.1, es prediuen 5 exons:


Exó 1: 27764 - 27832

Exó 2: 31628 - 31781

Exó 3: 37416 - 37533

Exó 4: 38246 - 38345

Exó 5: 39449 - 39650


Després de fer el t-coffee, es pot predir que en tots dos paràlegs, la selenocisteïna que apareix a GPx3 de ratolí i de microbat, es manté també a Miniopterus natalensis.

Pel que fa als elements SECIS, no se n’ha predit cap a la còpia que es troba al scaffold LDJU01000689.1, però el fet que mantingui la selenocisteïna ens fa pensar que hi ha hagut algun problema a la predicció de l’element SECIS. En el cas de l’altre paràleg, en canvi, sí que se’n prediu un, a l’extrem 3’-UTR de la cadena negativa, concretament amb inici a la posició 4175788. A més a més, al fer servir SEBLASTIAN també ens dóna una predicció semblant a la que havíem fet amb microbat i ratolí, de manera que corrobora que la selenocisteïna s’ha mantingut en el genoma de M. natalensis.


En quant a GPx5 i GPx6, després de realitzar el BLAST hem trobat la proteïna en els scaffolds LDJU01000117.1 i LDJU01000689.1. Aquests estan situats entre la posició 4179057 i la 4176531 de la cadena reversa i la posició 31625 i la 39646, respectivament, igual que en el cas de la proteïna GPx3. Això ens duu a la conclusió que GPx3, GPx6 o GPx5, són unes proteïnes que, o bé han sigut un guany per duplicació o triplicació en el ratolí, o bé, en la divergència d’espècies, s’ha perdut en el cas de Miniopterus natalensis.

Cal remarcar que les queries de GPx5 no presentaven selenoproteïnes, estan considerades com “Cysteine-containing homologs or selenium machinery genes”.

  • Per l’scaffold LDJU01000117.1, a partir de t-coffee observem que, respecte microbat i ratolí, 3 de les 4 cisteïnes s’han conservat, i l’altra s’ha tornat un codó STOP, és a dir, és una selenocisteïna potencial; a més, trobem que té un SECIS en cadena negativa a 3’-UTR. Aquesta predicció es corrobora amb el SEBLASTIAN, on ens compara amb la nostra mateixa espècie i ens indica que la possible selenocisteïna es troba a l’exó 1 (tal i com s’havia esmentat amb GPx3).

  • Per el scaffold LDJU01000689.1, a partir de t-coffee observem que, respecte microbat i ratolí, les 4 cisteïnes s’han conservat i, a més, hi ha hagut un guany al canviar-se una Y per una altra C. En quant a SECIS, no se n’ha predit cap.


GPx4

Aquesta proteïna només existeix a microbat, no a ratolí i després de fer el BLAST veiem que ocupa el scaffold LDJU01000355.1 de M. natalensis, amb un e-value de 4e-55, concretament es troba entre les posicions 95187 i 96134. El nombre d’exons és de 6 segons la predicció d’exonerate i de 7 segons SEBLASTIAN:


Exó 1: 93342 - 93425

Exó 2: 95166 - 95297

Exó 3: 95317 - 95478

Exó 4: 95609 - 95760

Exó 5: 95863 - 95887

Exó 6: 95072 - 96131

Exó 7: 96208 - 96234


Després de fer el t-coffee i comparar-ho amb SEBLASTIAN, podem predir que la selenocisteïna present a GPx4 de microbat s’ha conservat a Miniopterus natalensis també, concretament al exó 3.

S’ha predit un element SECIS a la regió 3’-UTR de la cadena positiva, amb inici a la posició 96294. Això i el SEBLASTIAN fan més segura la predicció feta, és a dir, que GPx4 s’ha mantingut en M. natalensis.


Tot i que a ratolí no existeix GPx4, sí que existeixen proteïnes de la família de GPx que hem anomenat GPx_None1, GPx_None2 i GPx_None4. Després de fer el BLAST sembla que ocupen la mateixa scaffold i posicions en M. natalensis que la GPx4. De manera que assumim que per la nostra espècie es tracta de la mateixa proteïna.


GPx7

Després de realitzar el BLAST, hem trobat la proteïna en els scaffolds LDJU01000197.1, amb un e-value de 2e-28, i LDJU01000378.1, amb un e-value de 1e-56. En aquest punt s’ha considerat que, tot i que en ratolí ambdós alineaments de t-coffee són bons, no es compleix el mateix amb microbat -espècie més propera-, per això a partir d’ara només discutirem LDJU01000378.1. L’scaffold LDJU01000378.1 ocupa l’espai entre les posicions 806617 i 804652 de la cadena reversa. Pel que fa al nombre d’exons, en trobem 2 amb exonerate:


Exó 1: 806353 - 806617

Exó 2: 804652 - 804770


Respecte a les selenocisteïnes, aquesta query no en presentava, estava considerada com “Cysteine-containing homologs or selenium machinery genes”. A partir del t-coffee podem predir que aquesta proteïna ha mantingut les dues cisteïnes que posseïa respecte microbat i ratolí. A més, tampoc s’han predit cap SECIS.


Cal comentar també que, en el cas de la comparació amb les queries de ratolí, una proteïna de la família de les GPx, GPx_None3, després de comprovar la taula del BLAST, també ha aparegut als scaffolds LDJU01000378.1 i LDJU01000197.1, a posicions molt semblants a GPx7. A més a més, l’element SECIS predit per LDJU01000378.1 és el mateix, i en LDJU01000197.1 tampoc s’hi troben SECIS, de manera que sembla que aquestes dues proteïnes que són diferents a ratolí, són la mateixa a Miniopterus natalensis.


DI

La família de les iodotironina deiodinases està formada per proteïnes encarregades de catalitzar l'activació, així com també la inactivació, de l'hormona tiroïdal per una desiodació de l’anell exterior i interior, respectivament. La reacció d'activació implica la conversió de la prohormona tiroxina, secretada per la glàndula tiroide, a l'hormona tiroidea bioactiva mitjançant una desiodització [16].


DIO1

Aquesta proteïna s'expressa predominantment en el fetge i el ronyó i proporciona la major part de la T3 circulant, que és essencial pel creixement, la diferenciació i el metabolisme basal en vertebrats.


Després de fer el BLAST observem, amb un e-value de 1e-53, que la proteïna DIO1 es troba al scaffold LDJU01000648.1, entre les posicions 129795 - 142346 del seu genoma. Conté els següents 4 exons:

Exó 1: 129795 - 130116

Exó 2: 135739 - 135882

Exó 3: 140108 - 140307

Exó 4: 142281 - 142346


En aquest cas, després de fer la predicció i el t-coffee, veiem que la selenocisteïna present a la proteïna DIO1 de ratolí i de microbat es manté a la de Miniopterus natalensis. Concretament està localitzada al segon exó.

Pel que fa als elements SECIS, se n’ha predit un que es troba a la regió 3’-UTR de la cadena positiva, començant a la posició 143237. Això, juntament amb la predicció del SEBLASTIAN, corroboren que la predicció feta és correcta.


DIO2

S’expressa en el cervell, placenta i glàndules mamàries. Es creu que és responsable de la producció "local" de T3, i per tant es important per influir en l'acció de l'hormona tiroïdal en aquests teixits.


En el cas de DIO2, al finalitzar el BLAST hem observat que, amb un e-value de 3e-115, la proteïna es troba continguda al scaffold LDJU01000120.1, entre les posicions 1524011 i 1533712. Segons exonerate només conté 1 exó:


Exó 1: 5015 - 5437


Després de fer el t-coffee, podem predir que la selenocisteïna, que es troba present tant en la proteïna de DIO2 de ratolí com en la de microbat, també s’hi troba a la de Miniopterus natalensis.

Pel que fa a la predicció dels elements SECIS, n’apareix un a la regió 3’-UTR de la cadena positiva. Aquest comença a la posició 1538515.

Tot i que els resultats obtinguts amb t-coffee i amb SECIS prediuen que DIO2 s’ha conservat com a selenoproteïna a Miniopterus natalensis, no s’obté cap predicció amb SEBLASTIAN.


DIO3

Aquesta proteïna presenta un cas doblement especial ja que, per un costat, en ratolí apareix com a DIO3, mentre que en microbat està classificada com a desconeguda. Després d’analitzar els seus scaffolds i la posició dins de la seqüència, assumim que són la mateixa proteïna; a més, coincideixen amb la posició del SECIS. Per altra banda, es considera com a “Cysteine-containing homologs or selenium machinery genes” en microbat, mentre que en ratolí es contempla que té una selenoproteïna.

Després de realitzar el BLAST, hem trobat la proteïna en l’scaffold LDJU01000400.1, amb un e-value de 9e-66, situada entre la posició 701178 i la 700834 de la cadena reversa. Conté un exó segons exonerate i també coincideix amb SEBLASTIAN:


Exó 1: 700810 - 701721


Després de fer el t-coffee, podem predir:

  • Tenint en compte microbat com a query, hi ha una cisteïna que es conserva en la nostra espècie.

  • Tenint en compte el ratolí com a query, hi ha una selenocisteïna i aquesta s’ha conservat en la nostra espècie. Això, sumat al fet que hi ha un SECIS en l’extrem 3’-UTR de la cadena negativa, ens dóna més valor a la predicció. Per corroborar, el SEBLASTIAN ens indica que hi ha una selenocisteïna en l’exó 1.

Amb aquests elements suggerim que Miniopterus natalensis, a diferència de microbat, ha conservat la selenoproteïna en aquest gen. Alhora, podem observar que el canvi de microbat no té a veure amb la cisteïna ja que la nostra espècie també la té.

SELENOH

Es tracta d’una proteïna nucleolar, que pertany a la família SelWTH. Funciona com una oxidoreductasa, i s'ha demostrat que protegeix les neurones contra el dany induït per UVB mitjançant la inhibició de les vies de mort cel·lular per apoptosi, la promoció de la biogènesi mitocondrial i la funció mitocondrial. Tambe afavoreix la supressió de la senescència cel·lular mitjançant el manteniment del genoma i la regulació de les reaccions redox [17].


Després de fer el BLAST, trobem, amb un e-value de 3e-28, que la seqüència de la proteïna SELENOH es troba al scaffold LDJU01000201.1, concretament entre les posicions 2024553 i 2024075, ja que és reversa. Conté tres exons segons exonerate:


Exó 1: 2024513 - 2024634

Exó 2: 2024279 - 2024421

Exó 3: 2024075 - 2024169


Després de fer el t-coffee, podem predir que la selenocisteïna present tant a ratolí com a microbat també es conserva a Miniopterus natalensis.

Pel que fa als elements SECIS, se n’ha predit un a la regió 3’-UTR de la cadena negativa, a la posició 2023134. Pel que fa a la predicció amb SEBLASTIAN, no ha donat resultats tot i que el tcoffee i la predicció de SECIS indiquen que la selenocisteïna sí que s’ha conservat.


SELENOI

És una selenoproteïna transmembrana que pertany a la família de les CDP-alcohol fosfatidiltransferases de classe I. Catalitza la transferència de fosfoetanolamina de CDP-etanolamina a diacilglicerol per produir fosfatidiletanolamina, que està implicat en la formació i manteniment de les membranes vesiculars, en la regulació del metabolisme de lípids, i en el plegament de proteïnes [18].


En el cas de SELENOI, amb el BLAST s’ha pogut observar, amb un e-value de 8e-36, que el seu gen es troba al scaffold LDJU01000111.1, entre les posicions 1702825 i 1739827. Pel que fa als exons exonerate en prediu els següents:


Exó 1: 1702825 - 1702881

Exó 2: 1715910 - 1715978

Exó 3: 1716416 - 1716524

Exó 4: 1718379 - 1718453

Exó 5: 1721972 - 1722234

Exó 6: 1723640 - 1723748

Exó 7: 1729902 - 1729950

Exó 8: 1731928 - 1732108

Exó 9: 1733425 - 1733607

Exó 10: 1739732 - 1739827


Després de fer el t-coffee, podem predir que la selenocisteïna, present tant a ratolí com a microbat, també es troba a Miniopterus natalensis, de manera que s’ha mantingut.

Pel que fa als elements SECIS, se n’ha predit un a la cadena positiva, a l’extrem 3’-UTR, concretament a la posició 1741128. Pel que fa a la predicció amb SEBLASTIAN, no ha donat resultats tot i que el t-coffee i la predicció de SECIS indiquen que la selenocisteïna sí que s’ha conservat.


SELENOK

Aquesta proteïna està involucrada en la degradació depenent de reticle endoplasmàtic de les proteïnes glucosilades que s’han plegat de forma incorrecta [19].

A microbat apareixen 4 proteïnes de la familia SELENOK que també apareixen a ratolí. Les hem anomenat com SELENOK_None1, SELENOK_None2 i SELENOK_None3, SELENOK_None4. Al fer el BLAST de totes elles, les seves seqüències apareixen en tots els casos al scaffold LDJU01000172.1, a l’espai inclòs entre les posicions 2593602 i 2593417. Presenta un únic exó:

Exó 1: 2593315 - 2593602

Això pot voler dir que el que a les altres espècies són proteïnes diferents, a Miniopterus natalensis és una sola proteïna.

Quan mirem el t-coffee, podem predir que el que a microbat són selenocisteïnes, a M. natalensis no ho són, de manera que es poden haver perdut. A més a més, no es prediu cap element SECIS, cosa que fa més bona la nostra predicció.


SELENON

La funció d'aquesta proteïna no es coneix, però, les mutacions en el gen homòleg en humans s'associen amb la miopatia multiminicore i la distròfia muscular de columna rígida. En ratolins s’ha demostrat que juga un paper important en el desenvolupament dels pulmons [20, 21].


En aquest cas, després de fer el BLAST s’ha predit, amb un e-value de 7e-36, que la seqüència de SELENON es troba al scaffold LDJU01000012.1, amb inici a la posició 1938073 i final a 1949386. Pel que fa al nombre d’exons se n’han predit 11:


Exó 1: 1938073 - 1938193

Exó 2: 1941637 - 1941770

Exó 3: 1942374 - 1942286

Exó 4: 1942758 - 1942882

Exó 5: 1943421 - 1943558

Exó 6: 1945281 - 1945362

Exó 7: 1945808 - 1945996

Exó 8: 1946344 - 1946449

Exó 9: 1947497 - 1947609

Exó 10: 1947702 - 1947803

Exó 11: 1949219 - 1949386


Després de fer l’alineament amb t-coffee, observem que la selenocisteïna present a la proteïna SELENON de ratolí i de microbat també es troba a la de Miniopterus natalensis, de manera que podem predir que s’ha conservat.

S’ha predit un element SECIS a la regió 3’-UTR de la cadena positiva, a la posició 1950528 del genoma de M. natalensis. Pel que fa a la predicció amb SEBLASTIAN, no ha donat resultats tot i que el t-coffee i la predicció de SECIS indiquen que la selenocisteïna sí que s’ha conservat.


SELENOO - SELENOO_None1 - SELENOO_None2 - SELENOO_None3

Es tracta de la selenoproteïna més gran en mamífers amb ortòlegs a gran varietat d'organismes, incloent bacteris i llevats.

Aquesta selenoproteïna es localitza als mitocondris i s'expressa en tots els teixits de ratolí. Participa activament en reaccions redox de la cèl·lula [22].


En el cas del ratolí només existeix una proteïna de la família de les SELENOO que, al fer el BLAST, apareix predita amb un e-value de 7e-44 al scaffold LDJU01000393.1 de Miniopterus natalensis. Concretament ocupa l’espai entre les posicions 468126 i 453135, ja que és a la cadena reversa. Pel que fa els exons se n’han predit 9 amb exonerate, a l’igual que amb SEBLASTIAN:

Exó 1: 467962 - 468126

Exó 2: 460398 - 460582

Exó 3: 459049 - 459229

Exó 4: 458050 - 458180

Exó 5: 457326 - 457606

Exó 6: 454696 - 454846

Exó 7: 453654 - 453839

Exó 8: 453391 - 453547

Exó 9: 453135 - 453305


Quan observem l’alineament fet amb t-coffee, podem predir que la selenocisteïna de la proteïna SELENOO de ratolí s’ha mantingut en Miniopterus natalensis.

S’ha predit un element SECIS a la regió 3’-UTR de la cadena negativa, concretament a la posició 452971. Això, juntament amb el SEBLASTIAN fan més segura la predicció feta, és a dir, que la selenocisteïna s’ha mantingut en M. natalensis.


En el cas del microbat tenim queries de diverses proteïnes de la família SELENOO, a les que hem anomenat SELENOO_None1, SELENOO_None2 i SELENOO_None3. Al fer el BLAST d’aquesta última veiem que es prediu la seqüència dins del mateix scaffold que la proteïna SELENOO de ratolí i encabida dins la mateixa seqüència. A més a més, l’element SECIS es prediu a la mateixa posició. Això ens fa pensar que SELENOO_None3 i SELENOO són proteïnes paràlogues i que SELENOO_None3 ha perdut un fragment del gen inicial, de manera que són la mateixa proteïna a Miniopterus natalensis.


Pel que fa a la SELENOO_None1, després de fer el BLAST trobem el seu gen a dos scaffolds. El primer, amb un e-value de 4e-21, és LDJU01000904.1 i trobem la seqüència entre les posicions 19058 i 22315. El segon scaffold, amb un e-value de 3e-18, és LDJU01000621.1 i la seqüència es troba entre les posicions 70918 i 67762, ja que la cadena és reversa. Al comparar els SCOREs dels alineaments obtinguts al final, observem que són els mateixos per a ambdós scaffolds, per aquest motiu, podem predir que podria tractar-se d’una duplicació d’aquesta proteïna a Miniopterus natalensis ja que, a més, es troben en posicions genòmiques molt separades, per tant, aquesta espècie podria tenir gens paràlegs per aquesta proteïna. Pel que fa als exons:

En el cas de la còpia encabida al scaffold LDJU01000904.1, tindria 6 exons segons exonerate:


Exó 1: 17337 17358

Exó 2: 19059 - 19142

Exó 3: 19805 - 19934

Exó 4: 21898 - 21942

Exó 5: 22051 - 22132

Exó 6: 22232 - 22333


El gen paràleg situat al scaffold LDJU01000621.1, tindria 6 exons també:


Exó 1: 72600 - 72621

Exó 2: 70834 - 70917

Exó 3: 70038 - 70167

Exó 4: 68164 - 68207

Exó 5: 67945 - 68027

Exó 6: 67744 - 67844


Respecte a les selenocisteïnes, aquesta query no en presentava i per tant estava considerada com “Cysteine-containing homologs or selenium machinery genes”. A partir del t-coffee podem predir que aquesta proteïna ha mantingut, en tots dos paràlegs, la cisteïna que tenia en microbat. El fet de que no s’hagin predit elements SECIS corrobora que la cisteïna de microbat no és selenocisteïna a M. natalensis.


Finalment, quan fem el BLAST de la proteïna SELENOO_None2 de microbat, observem que es troba al mateix scaffold que SELENO_None1, LDJU01000621.1 i que ocupa la mateixa posició al genoma. Això fa pensar que el que a microbat són dues proteïnes diferents a M. natalensis és la mateixa.


SELENOP

És una glicoproteïna rica en seleni, participa en el transport de seleni per l’organisme [23].


Un cop fet el BLAST podem observar que el gen predit es troba al scaffold LDJU01000126.1 amb un e-value de 5e-35. Aquest està situat entre la posició 50544 i la 55061, i té 5 exons tenint en compte l’exonerate, i 4 segons SEBLASTIAN:


Exó 1: 50544 - 50746

Exó 2: 51580 - 51792

Exó 3: 53159 - 53276

Exó 4: 54489 - 55118


Pel que fa a les selenocisteïnes, a partir del t-coffee podem predir que, respecte microbat que en té 14, s’han conservat 13 d’elles; aquesta predicció es corrobora amb el SEBLASTIAN, on ens compara amb la nostra mateixa espècie i ens indica que n’hi ha 13 -1 en l’exó 1, i 12 en l’exó 4-. En ratolí, en canvi, trobem 10 selenocisteïnes i només 6 d’elles es conserven en Miniopterus natalensis. Tot això ens duu a la conclusió que, a causa del gran salt evolutiu, només 6 selenocisteïnes s’han conservat en aquestes tres espècies.

En quant a elements SECIS, se’n prediuen dos en cadena positiva i a l’extrem 3’-UTR, però ens quedem amb el segon ja que té un inici més proper a la nostra proteïna (55383).


SELENOT

Aquesta proteïna no es considera que tingui selenocisteïna en microbat, però sí en ratolí. Per aquest motiu hem procedit a fer-ne l’anàlisi ja que podria ser que microbat l’hagués perdut mentre que Miniopterus natalensis l’hagués conservat al llarg de l’evolució [24].


La funció cel·lular de selenoproteïna T (SelT), localitzada al Golgi i al reticle endoplàsmic, no es coneix. S’ha estudiat que la deficiència de SelT altera l'adhesió cel·lular i augmenta l'expressió de diversos gens de la proteïna oxidoreductasa, mentre disminueix l'expressió de gens implicats en l'organització de l'estructura cel·lular, el que suggereix la participació de SelT en la regulació redox i l’ancoratge cel·lular. A més, s’ha estudiat que la pèrdua de SelT eleva l’expressió d'una altra selenoproteïna, la selenoproteïna W (SepW1). SelT i SepW1 pertanyen a la mateixa família de proteïnes, el que suggereix que SepW1 es pot compensar funcionalment per SelT.


Després d’analitzar el BLAST s’ha observat que aquesta proteïna es troba al scaffold LDJU01000516.1 amb un e-value de 8e-21. Aquesta està situat entre la posició 76649 i la 95828, i té 5 exons tenint en compte l’exonerate, i 4 segons SEBLASTIAN:


Exó 1: 90302 - 90429

Exó 2: 91177 - 91303

Exó 3: 94138 - 94225

Exó 4: 95707 - 95828


Respecte a les selenocisteïnes, a partir del t-coffee podem predir que, respecte ratolí que en té 1, aquesta s’ha conservat. Aquesta predicció es corrobora amb la presència d’un SECIS en extrem 3’-UTR en la cadena positiva. A més, també tenim un SEBLASTIAN, on es compara amb la espècie Dipodomys ordii i també ens indica que n’hi ha 1 en l’exó 1.

Amb tot això podem concloure que acabem de trobar una selenoproteïna que no estava descrita per aquesta espècie.


SELENOW

Aquesta proteïna és important per al sistema antioxidant de les cèl·lules musculars. La manca de SelW, però, podria ser compensada per altres enzims antioxidants intracel·lulars [24, 25].


En aquest cas trobem que, segons el BLAST, el gen predit es troba al scaffold LDJU01000126.1, situat entre la posició 50544 i la 55061 igual que en el cas de la proteïna SELENOT. Això ens duu a la conclusió que hi ha hagut una duplicació d’un gen, i que després de l’actuació de la selecció al llarg dels anys ha donant com a resultat els gens que codifiquen per SELENOT i SELENOW. Pot ser que aquesta duplicació tingués lloc en la branca evolutiva del ratolí o fos prèvia a la separació d’aquest i M. natalensis i que aquest segon la perdés.


SELENOM

S’ha estudiat que aquesta selenoproteïna pot tenir un paper important en la protecció contra el dany oxidatiu en el cervell i presenta una funció relacionada amb la regulació del calci a la cèl·lula [26].


Després de fer el BLAST veiem que el gen que codifica per SELENOM es troba, amb un e-value de 5e-19, al scaffold LDJU01000126.1, concretament comença a la posició 636611 i acaba a la 636920. Pel que fa al nombre d’exons, se’n prediuen 3 amb exonerate i 4 amb SEBLASTIAN:

Exó 1: 635935 - 636003

Exó 2: 636211 - 636245

Exó 3: 636610 - 636688

Exó 4: 636765 - 636920


Aquesta proteïna manté la selenocisteïna a ratolí però no a microbat. Quan mirem els alineaments que proporciona t-coffee i comparem amb la predicció de SEBLASTIAN, que en aquest cas no és amb Miniopterus natalensis com ens passa gairebé sempre, sinó que és amb Dasypus novemcinctus, podem predir que en Miniopterus natalensis sí que es manté la selenocisteïna, de manera que aquesta selenoproteïna no ha estat descrita anteriorment. Sembla ser que microbat va perdre la selenocisteïna que Miniopterus natalensis ha mantingut.

S’ha predit un element SECIS a la regió 3’-UTR de la cadena positiva, amb inici a la posició 636955. De manera que això fa que la predicció sigui més acurada.


SELENOU

Aquesta proteïna es troba en forma de selenocisteïna en peixos, aus, equinoderms i algues diatomees, mentre que en mamífers, plantes, artròpodes, cucs i amfibis el residu de selenocisteïna ha estat reemplaçat per una cisteïna [18].


Dins la família SELENOU de microbat hi ha dues proteïnes que hem anomenat SELENOU_None2 i SELENOU_None3. Totes dues es troben al scaffold LDJU01000779.1 i se solapen al genoma, de manera que entenem que el que a microbat són dues proteïnes diferents, a Miniopterus natelensis només n’és una. La seqüència es troba entre les posicions 6767 i 5000 en el cas de SELENOU_None2 i entre les posicions 6311 i 5000 en el cas de SELENOU_None3, ja que es tracta de cadenes reverses. Una possible explicació per aquesta diferència de nucleòtids seria que SELENOU_None3 hagi perdut un fragment del gen al llarg de l’evolució, de manera que només la part conservada s’ha pogut alinear amb el genoma de Miniopterus natalensis. Així, l’alineament més llarg que hem obtingut consta de 5 exons:


Exó 1: 71523 - 71569

Exó 2: 65443 - 65554

Exó 3: 64972 - 65040

Exó 4: 64070 - 64123

Exó 5: 63786 - 63914


Respecte a les selenocisteïnes, la proteïna de microbat no en tenia cap, de manera que es considera “Cysteine-containing homologs or selenium machinery gene”. Després del t-coffee podem predir que en el cas de M. natalensis tampoc no se’n troben i que les 4 cisteïnes presents a microbat també es conserven.

El fet que no s’hagi predit cap element SECIS (ni s’hagi fet la predicció SEBLASTIAN) fa que la nostra predicció sigui més acurada.


SELENOU1

Després de fer el BLAST veiem que, amb un e-value de 1e-26, el gen que codifica per SELENOU1 es troba al scaffold LDJU01000133.1, concretament entre les posicions 1060060 i 1068914. Pel que fa els exons se’n troben 5:


Exó 1: 1060057 - 1060237

Exó 2: 1062042 - 1062133

Exó 3: 1065185 - 1065325

Exó 4: 1065962 - 1066126

Exó 5: 1068816 - 1068914


Respecte a les selenocisteïnes, tant la query de ratolí com la de microbat no en presentaven i, per tant, estan considerades com “Cysteine-containing homologs or selenium machinery genes”. En tots dos casos hi havia dues cisteïnes que, mitjançant t-coffee, podem predir que es mantenen a Miniopterus natalensis també.

No es prediuen elements SECIS i, per tant, tampoc SEBLASTIAN, cosa que dóna més pes a la nostra predicció.


MSRB

MSRB1

Aquesta proteïna pertany a la família MsrB (metionina-R-sulfòxid reductasa B). La seva funció és actuar com un enzim de reparació de les proteïnes contra l’estrès oxidatiu, catalitzant la reducció de sulfòxid de metionina-R- a metionina. Aquesta proteïna es troba de forma predominant en fetge i ronyó, i es localitza en el nucli i el citosol [27].


Un cop fet el BLAST podem observar que hi ha dos scaffolds per al gen predit, el LDJU01000131.1 amb un e-value de 6e-60, i el LDJU01000322.1 amb un e-value de 3e-26. Aquests estan situats entre la posició 3263234 i la 3262911 de la cadena reversa i la posició 615355 i la 619151, respectivament. Al comparar els SCOREs dels alineaments obtinguts al final, observem que són els mateixos per a ambdues scaffolds, per aquest motiu, podem predir que podria tractar-se d’una duplicació de la proteïna MSRB1 a Miniopterus natalensis, ja que, a més, es troben en posicions genòmiques molt separades, per tant, són gens paràlegs.

En l’scaffold LDJU01000131.1 trobem 1 exó en l’exonerate:


Exó 1: 3262911 - 3263234


I en l’scaffold LDJU01000322.1 trobem 3 exons en l’exonerate i 4 amb SEBLASTIAN:


Exó 1: 615355 - 615409

Exó 2: 617622 - 617770

Exó 3: 618076 - 618190

Exó 4: 619123 - 619151


Respecte a les selenocisteïnes:

  • Per l’scaffold LDJU01000131.1, a partir del t-coffee podem predir que, respecte microbat i ratolí que en tenen una, aquesta s’ha conservat. Aquesta predicció es corrobora amb la presència d’un SECIS en extrem 3’-UTR en la cadena negativa. Tot i aquesta predicció, no s’obté cap amb SEBLASTIAN, de manera que no podem assegurar plenament que realment hi hagi una selenocisteïna.

  • Per l’scaffold LDJU01000322.1, a partir del t-coffee podem predir que, respecte microbat i ratolí que en tenen una, aquesta s’ha conservat. Aquesta predicció es corrobora amb la presència d’un SECIS en extrem 3’-UTR en la cadena positiva i amb el SEBLASTIAN, on ens compara amb la nostra mateixa espècie i ens presenta una selenocisteïna en l’exó 3.


MSRB2

Aquesta proteïna presenta un cas especial ja que, en ratolí apareix com a MSRB2, mentre que en microbat està classificada com a dos proteïnes desconegudes. Després d’analitzar els seus scaffolds i la posició dins de la seqüència, assumim que són la mateixa proteïna.

Després de realitzar el BLAST, hem trobat la proteïna en l’scaffold LDJU01000096.1, tenint les dues proteïnes desconegudes uns e-value de 3e-25 i de 4e-16, entre les posicions 1999520 i 1988454 de la cadena reversa. Pel que fa al nombre d’exons, en trobem un nombre diferent per cada predicció. Tot i que només hi ha 6 nucleòtids de diferència entre les dues, això comporta que una predicció sigui de 2 exons -sent el primer de només 5 nucleòtids- i l’altra de 4 exons. Per aquest motiu, descartem la predicció de 2 exons i ens quedem amb la de 4:


en trobem 4 en l’exonerate (tot i que hi ha només 6 nucleòtids de diferència entre les dues, això influencia en que una hi hagin 2 exons i en l’altre 4; la de 2 la descartem ja que el primer exó té només 5 nucleòtids):


Exó 1: 1999428 - 1999526

Exó 2: 1994957 - 1995033

Exó 3: 1989452 - 1989599

Exó 4: 1988466 - 1988561


Respecte a les selenocisteïnes, aquesta query no en presentava i, per tant, estava considerada com “Cysteine-containing homologs or selenium machinery genes”. A partir del t-coffee podem predir que, respecte microbat que té 7 cisteïnes, es conserven totes; en ratolí també es preserven 7, tot i que hi ha una vuitena que no es preserva i que, segurament, ha aparegut després de la separació entre microbat-Miniopterus i ratolí. El fet que no s’hagin predit elements SECIS corrobora el fet que cap cisteïna s’ha transformat en selenocisteïna en la nostra espècie M. natalensis.


MSRB3

Aquesta proteïna no es considera que tingui rellevància pel que fa a les selenoproteïnes en microbat, però sí en ratolí. Per aquest motiu hem procedit a fer-ne l’anàlisi ja que podria ser que alguna de les cisteïnes de microbat sigui una selenocisteïna en el M. natalensis.

Després de realitzar el BLAST, hem trobat la proteïna en l’scaffold LDJU01000102.1, amb un e-value de 8e-17, entre les posicions 3137635 i 3232323. Pel que fa al nombre d’exons, trobem 8 en l’exonerate:

Exó 1: 3235543 - 3235548

Exó 2: 3233589 - 3233657

Exó 3: 3232943 - 3232943

Exó 4: 3232214 - 3232322

Exó 5: 3230502 - 3230579

Exó 6: 3199118 - 3199146

Exó 7: 3146167 - 3146264

Exó 8: 3137692 - 3137790


Després de veure el exons cal remarcar que n’hi ha un que comença i acaba pel mateix nucleòtid, i que, per això, segurament hi ha hagut un error o bé de predicció, o bé d’anotació de la query.


Respecte a les selenocisteïnes, aquesta query no en presentava i, per tant, estava considerada com “Cysteine-containing homologs or selenium machinery genes”. A partir del t-coffee podem observar que, respecte ratolí que té 10 cisteïnes, només s’han conservat 7. El fet que no s’hagin predit elements SECIS corrobora que la cisteïna de microbat no s’ha transformat en selenocisteïna a M. natalensis.


TXNRD

Aquestes són les proteïnes de la família de les piridines nucleotid-disulfur oxidoreductases. Aquestes proteïnes són flavoenzims, que utilitzen NADPH per a la reducció de tiorredoxines així com altres proteïnes i substrats no proteics, i juga un paper important en la protecció contra l'estrès oxidatiu [28].


TXNRD1 - TXNRD3

Aquesta proteïna presenta un cas especial ja que en ratolí apareix com a TXNRD1, mentre que en microbat està classificada com a desconeguda. Després d’analitzar els seus scaffolds i la posició dins de la seqüència, assumim que són la mateixa proteïna.

Després de realitzar el BLAST, hem trobat la proteïna en els scaffolds LDJU01000081.1, amb un e-value de 8e-38, i LDJU01000159.1, amb un e-value de 5e-28. En aquest punt s’ha considerat que, tot i que en ratolí ambdós alineament de t-coffee són bons, no es compleix el mateix amb microbat -espècie més propera-, per això a partir d’ara només discutirem LDJU01000159.1. Aquest scaffold ocupa l’espai entre les posicions 11399387 i 1377935 de la cadena reversa. Pel que fa al nombre d’exons, en trobem 15 amb l’exonerate, que coincideixen amb els obtinguts en SEBLASTIAN:


Exó 1: 1403634 - 1403697

Exó 2: 1402506 - 1402615

Exó 3: 1401152 - 1401256

Exó 4: 1400843 - 1400915

Exó 5: 1399267 - 1399386

Exó 6: 1395124 - 1395266

Exó 7: 1393609 - 1393724

Exó 8: 1392402 - 1392627

Exó 9: 1391149 - 1391241

Exó 10: 1388516 - 1388592

Exó 11: 1387784 - 1387940

Exó 12: 1383829 - 1383936

Exó 13: 1380178 - 1380273

Exó 14: 1377938 - 1378072

Exó 15: 1377667 - 1377732


Respecte a les selenocisteïnes, a partir del t-coffee podem predir que, respecte microbat i ratolí que en tenen una, aquesta s’ha conservat. Aquesta predicció es corrobora amb la presència d’un SECIS en extrem 3’-UTR en la cadena negativa. A més, també tenim un SEBLASTIAN, on ens compara amb la espècie Homo sapiens i també ens indica que n’hi ha una en l’exó 15.

Amb tot això podem concloure que acabem de trobar una nova selenoproteïna per aquesta espècie.


En el cas de TXNRD3, després de fer el BLAST, es troba la proteïna a dos scaffolds diferents. El primer d’ells, LDJU01000159.1 és el mateix que s’ha vist en TXNRD1 i la proteïna té el mateix nombre d’exons i el SECIS a la mateixa posició, de manera que probablement TXNRD1 i TXNRD3 són la mateixa proteïna per Miniopterus natalensis.

El segon scaffold que s’ha trobat amb el BLAST ha estat LDJU01000081.1, amb un e-value de 7e-33, i concretament, la seqüència de la proteïna s’ha trobat entre les posicions 3518532 i 3542777. Si es comparen els SCOREs dels alineaments finals, es pot veure que dóna el mateix valor pels dos scaffolds. És per això que podem predir que es tracta d’una duplicació de la proteïna a Miniopterus natalensis ja que, a més a més, es troben en posicions genòmiques molt separades. Això ens duu a la conclusió que TXNRD1 i 3 són el mateix gen en la nostra espècie i que, a més, presenten un paràleg.

A partir d’ara es discutirà només l’scaffold LDJU01000081.1, en el qual hi trobem 13 exons en l’exonerate:

Exó 1: 3515415 - 3515477

Exó 2: 3516861 - 3516933

Exó 3: 3518533 - 3518652

Exó 4: 3524043 - 3524185

Exó 5: 3524602 - 3524717

Exó 6: 3526074 - 3526299

Exó 7: 3528695 - 3528787

Exó 8: 3529188 - 3529264

Exó 9: 3530388 - 3530544

Exó 10: 3533951 - 3534058

Exó 11: 3539949 - 3540044

Exó 12: 3542712 - 3542774

Exó 13: 3544568 - 3544627


Respecte a les selenocisteïnes, a partir del t-coffee podem predir que, respecte microbat i ratolí que en tenen una, aquesta s’ha conservat en la nostra espècie. Aquesta predicció no es corrobora després de no trobar la presència d’un SECIS. Tot i això, cal remarcar que l’alineació donada pel t-coffee era molt bona i que, per tant, podria haver un error a l’hora de trobar SECIS.

Veiem que tot i que hem considerat que eren paràlegs, en algun punt evolutiu una de les dues ha patit una suposada pèrdua (o hi ha hagut un guany) de selenoproteïna.



TXNRD2

Després de realitzar el BLAST, hem trobat la proteïna en els scaffolds LDJU01000026.1, amb un e-value de 2e-26, i LDJU01000081.1, amb un e-value de 3e-22. En aquest punt s’ha considerat que, tot i que en ratolí ambdós alineament de t-coffee són bons, no es compleix el mateix amb microbat -espècie més propera-, per això a partir d’ara només discutirem LDJU01000026.1. L’scaffold LDJU01000026.1 ocupa l’espai entre les posicions 2200204 i 2161761 de la cadena reversa. Pel que fa al nombre d’exons, en trobem 16 en l’exonerate, mentre que 8 en SEBLASTIAN. Tal i com ha passat en altres casos, ens quedem amb el resultat de SEBLASTIAN ja que és el que compara amb una query més propera a la proteïna:


Exó 1: 2182931 - 2182963

Exó 2: 2180720 - 2180894

Exó 3: 2168562 - 2168698

Exó 4: 2166553 - 2166648

Exó 5: 2165979 - 2166071

Exó 6: 2164284 - 2164353

Exó 7: 2164016 - 2164113

Exó 8: 2161761 - 2161887


Respecte a les selenocisteïnes, a partir del t-coffee podem predir que, respecte microbat i ratolí que en tenen 1, aquesta s’ha conservat. Aquesta predicció es corrobora amb la presència d’un SECIS a l’extrem 3’-UTR en la cadena negativa. A més, també tenim un SEBLASTIAN, on ens compara amb la espècie Homo sapiens i també ens indica que n’hi ha 1 en l’exó 8.

Amb tot això podem concloure que acabem de trobar una nova selenoproteïna per aquesta espècie.


MsrA

La metionina sulfòxid reductasa A és un enzim essencial en el sistema antioxidant que neutralitza espècies reactives de l'oxigen a través de l'oxidació cíclica i la reducció de la metionina i el sulfòxid de metionina [29].


En aquest cas, tot i que aquesta proteïna es troba tant a microbat com a ratolí, només ens fixem en la comparació amb la query de ratolí perquè l’alineament final que s’ha obtingut amb el de microbat és molt dolent i hi ha massa regions no conservades com per a poder fer una bona predicció.

Després de fer el BLAST, trobem que el gen MsrA de M. natalensis es troba al scaffold LDJU01000369.1, concretament entre les posicions 482478 i 679001, amb un e-value de 1e-23. Els exons són:


Exó 1: 478723 - 478745

Exó 2: 479254 - 479306

Exó 3: 482479 - 482547

Exó 4: 513017 - 513136

Exó 5: 570197 - 570301

Exó 6: 595708 - 595814

Exó 7: 678840 - 679001


Mirant el t-coffee podem predir que les quatre cisteïnes presents a la query de ratolí també es conserven en microbat.

A la predicció dels elements SECIS n’apareix un a la cadena positiva, començant a la posició 625375, és a dir, dins la seqüència de la proteïna. Per aquest motiu, creiem que aquest SECIS deu estar mal predit. Al comprovar si en el cas de la query de microbat que hem descartat per mal alineament es podia predir un bon SECIS, tampoc no ha sigut així i el seu inici es troba, de nou, dins la seqüència de la proteïna.



MAQUINÀRIA


eFSec

Aquesta proteïna es tracta d’un factor d’elongació que s’uneix de forma especifica al SEc-tRNA. L’extrem N-terminal de la proteïna presenta una similaritat en la seqüència al factor d’elongacio EF1A. La seva extensió conté una senyal de localització nuclear (NLS) i una regió necessària per a la interacció amb SBP2, la proteïna d’unió a SECIS [18].

Aquesta proteïna, tot i tenir en el BLAST un e-value molt alt per l’scaffold LDJU01000159.1 equivalent a 3e-127, la predicció que dóna te un SCORE de 600 i, subjectivament parlant, l’alineament és molt dolent. Per aquest motiu tan sols podem suggerir que, o bé s’ha fet malament la predicció, o bé aquesta proteïna no s’ha conservat en aquesta espècie.


SBP2

La incorporació de seleniocisteïna en una proteïna requereix l'acció concertada d'un element RNAm que s'anomena seqüència d'inserció S (SECIS), un factor d'elongació específic de la traducció a seleniocisteïna i una proteïna d'unió SECIS. Aquesta proteïna nuclear funciona com una proteïna d'unió a SECIS. Les mutacions en un gen similar en humans s'han associat amb una reducció en l'activitat de la tiroxina deiodinasa i amb un metabolisme de l'hormona tiroidea anormal [18].


Tant a ratolí com a microbat hi ha dues proteïnes d’aquesta família que hem anomenat SBP2_None1 i SBP2_None2 en microbat i SBP2_None1 i SBP2_None3 en ratolí. Després de fer el BLAST veiem que totes elles es troben al mateix scaffold, LDJU01000113.1 i que, les posicions se solapen, de manera que assumim que a Miniopterus natalensis són la mateixa proteïna, mentre que a ratolí i microbat són diferents, probablement per duplicacions del gen i pèrdues de fragments d’aquest. Triem la seqüència que engloba el que pensem que és la proteïna completa -ja que, com hem dit, suposem que els altres paràlegs han perdut una part de la seqüència inicial-, que anirà de la posició 12671 fins la 50597. Pel que fa als exons:


Exó 1: 12671-12852

Exó 2: 15041-15362

Exó 3: 17303-17435

Exó 4: 121561-21833

Exó 5: 22435-22550

Exó 6: 28487-28621

Exó 7: 30458-30538

Exó 8: 31535-31702

Exó 9: 31854-31995

Exó 10: 35115-35284

Exó 11: 36081-36213

Exó 12: 38048-38210

Exó 13: 40036-40256

Exó 14: 41181-41335

Exó 15: 43451-43670

Exó 16: 50065-50597


Després de fer el t-coffee podem predir que respecte les 18 cisteïnes presents a microbat es conserven totes, i respecte les 16 que presenta ratolí també. En tots dos casos apareixen dues cisteïnes noves.

Pel que fa a la predicció dels elements SECIS, no se n’ha trobat cap. Així que podem predir que després de perdre la selenocisteïna va perdre el SECIS.


SECp43

S’ha determinat que aquesta proteïna té un paper en la biosíntesi de selenoproteïnes a través de la interacció amb tRNA ([Ser]-Sec). També presenta funció en la regulació de l’expressió de les selenoproteïnes, en afectar la síntesi de Um34 en el tRNA ([Ser]-Sec) [30].


Després de fer el BLAST apareixen scaffolds diferents en funció de si s’ha comparat amb la query de ratolí o amb la de microbat. En aquest cas hem decidit quedar-nos amb la de ratolí, ja que tot i que l’espècie és més llunyana, dóna una millor predicció. Així, el gen de SECp43 s’ha trobat al scaffold LDJU01000151.1, concretament entre les posicions 1665514 i 1665371, ja que es troba a la cadena reversa, amb un e-value de 2e-21. Pel que fa al nombre d’exons, se’n troba 1:

Exó 1: 5000 - 5143


Tenint en compte els resultats del t-coffee podem predir que la cisteïna que es troba a la query de ratolí es conserva a Miniopterus natalensis.

No s’han trobat elements SECIS, de manera que possiblement es va perdre després de perdre la selenocisteïna.



SecS

Aquesta proteïna forma part de la maquinària de síntesi de selenoproteïnes ja que la Sec-Synthase (SecS) està implicada la síntesis del RNA de transcripció de la selenocisteïna [18].


Després de fer el BLAST, trobem la seqüència que codifica per SecS, amb un e-value de 4e-42, al scaffold LDJU01000058.1, concretament entre les posicions 3369365 i 3399851. Pel que fa el nombre d’exons:


Exó 1: 3369365 - 3369478

Exó 2: 3370458 - 3370612

Exó 3: 3372741 - 3372859

Exó 4: 3373414 - 3373572

Exó 5: 3376145 - 3376298

Exó 6: 3380216 - 3380318

Exó 7: 23384726 - 3384855

Exó 8: 3384986 - 3385077

Exó 9: 3396339 - 3396432

Exó 10: 3398124 - 3398214

Exó 11: 3399584 - 3399851


Pel que fa a les cisteïnes, el ratolí en presenta una més que microbat. Al fer fer t-coffee observem que Miniopterus natalensis tampoc no ha conservat aquesta cisteïna, de manera que hi ha dues explicacions possibles: potser en algun moment de l’evolució abans que microbat i M. natalensis se separessin, es va perdre la cisteïna, o bé, va ser el ratolí qui la va guanyar. Totes les altres 12 cisteïnes que ratolí i microbat tenen iguals, també es mantenen a M. natalensis.

No s’ha pogut predir cap element SECIS, de manera que pensem que després de perdre la selenocisteïna va perdre el SECIS.


PSTK

La phosphoseryl-tRNA kinase (PSTK) és una proteïna quinasa implicada en el primer pas de la síntesi de RNA de transferència de les selenoproteïnes. La seva funció consisteix en fosforilar el seryl-tRNA(Sec) per donar lloc a l’O-phosphoseryl-tRNA(Sec) [18].


En el cas de la query de ratolí, després de fer el BLAST es troba que el gen de PSTK està al scaffold LDJU01000304.1. Pel que fa a microbat, aquest presenta dues proteïnes de la família PSTK, que hem anomenat PSTK_None1 i PSTK_None2 i que després de fer el BLAST també han aparegut al scaffold LDJU01000304.1 i ocupant posicions molt semblants entre elles i en comparació amb la PSTK de ratolí. Així que considerem que el que a microbat són dues proteïnes, a M. natalensis només és una. El seu gen ocupa l’espai entre les posicions 642516 i 639944 en el cas de PSTK_None1 i, entre 642522 i 639944 en el cas de PSTK_None2, ja que es troben a la cadena reversa. Aquesta diferència de 6 nucleòtids fa que, en el cas de PSTK_None2 es predigui un exó més, 5 en total. A més, després de fer el t-coffee veiem que el nombre de cisteïnes de cada predicció també varia, n’hi ha 9 a la PSTK_None1, dues d’elles no alineades amb la seqüència de M. natalensis, mentre que en trobem 7 a la PSTK_None2, totes alineades amb M. natalensis. Després de comparar les dues seqüències predites, observem que les cisteïnes que només es troben a una de les dues estan a una regió de baix grau d’alineament, suggerint que possiblement hi ha hagut algun error en la predicció. Per aquest motiu, hem decidit utilitzar la seqüència predita amb la query de la PSTK_None2. Amb aquesta query obtenim 5 exons, com bé hem dit, localitzats a les següents regions:


Exó 1: 642369 - 642522

Exó 2: 642234 - 642290

Exó 3: 641806 - 642004

Exó 4: 640494 - 640569

Exó 5: 639944 - 639972


No s’ha predit cap element SECIS, de manera que podem predir que després de perdre la selenocisteïna també es va perdre aquest.


SEPHS2

Aquest gen codifica per un enzim que sintetitza selenofosfat de seleni i ATP. El selenofosfat és el donant de seleni utilitzat per a sintetitzar seleniocisteïna (Sec) que és co-traduccionalment incorporada a les selenoproteïnes en els codons UGA, que de forma comuna és la senyal de terminació de la traducció. Aquesta proteïna conté un residu SEC al seu lloc actiu [31].


SEPHS2 no té selenocisteïna en microbat, però sí en ratolí. Per aquest motiu hem procedit a fer-ne l’anàlisi ja que podria ser que microbat l’hagués perdut mentre que Miniopterus natalensis l’hagués conservat al llarg de l’evolució.

Després d’analitzar el BLAST s’ha observat que aquesta proteïna es troba al scaffold LDJU01000252.1 amb un e-value de 2e-24. El gen està situat entre la posició 194478 i la 221772, i té 10 exons tenint en compte l’exonerate:


Exó 1: 194478 - 194640

Exó 2: 202779 - 202787

Exó 3: 202976 - 203062

Exó 4: 203902 - 204005

Exó 5: 206493 - 206600

Exó 6: 207520 - 207674

Exó 7: 209697 - 209787

Exó 8: 211759 - 211858

Exó 9: 218194 - 218406

Exó 10: 221603 - 221802


Aquesta proteïna de la maquinària és una excepció, ja que en el cas del ratolí presenta una selenocisteïna. A partir del t-coffee podem predir que aquesta selenocisteïna no s’ha conservat. Aquesta predicció es corrobora amb la presència de SECIS en l’extrem 5’-UTR en la cadena positiva.

Podem concloure que Miniopterus natalensis, al igual que microbat, ha perdut aquesta selenoproteïna, de manera que possiblement la va perdre un avantpassat comú.