Discussió
Selenoproteïnes
Família GPx
La família Gluthatione peroxidase és una família de proteïnes (d'isoenzims) característica per tenir activitat peroxidasa. Així doncs, està implicada en la protecció de l'organisme del dany oxidatiu. Es tracta d'una família de proteïnes altament conservada en mamífers. En humans en trobem 8.
Al córrer els diferents blasts s'ha observat que la majoria dels hits significatius obtinguts de les 8 proteïnes GPx descrites en humà contra el genoma de Struthio camelus australis pertanyen als mateixos Scaffolds. Al tractar-se de la mateixa família de proteïnes, les 8 presenten un alt grau d'homologia amb els mateixos hits. Això ens indica que aquests Scaffolds que es repeteixen en l'alineament dels blasts de totes les GPx d'humà són els candidats a proteïnes (o selenoproteïnes) presents a Struthio camelus australis. Trobem 4 Scaffolds amb un bon resultat al conjunt de blasts de la familia GPx, pel que veiem que en estruç existeixen 4 proteïnes de la familia GPx. Anomenarem a aquestes proteïnes GPx1, GPx2, GPx3 i GPx4 arbitrariament.
GPx1
Scaffold KL206722.1 - L'exonerate ens prediu una proteïna amb 2 exons. L'alineament s'ha realitzat amb GPx1 i GPx2, ja que tenien un E-value molt bo al blast. Els dos T-Coffees tenen un alineament igualment bo i en els dos trobem la Sec del Scaffold alineada amb la Sec de la proteïna d'humà, però cap dels dos té Met alineada a la primera posició.
La predicció d'elements SECIS ens troba 1 element SECIS i l'anàlisi amb Seblastian troba una homologia de l'Scaffold amb GPx2 a Gallus gallus. Després d'aquest anàlisi concloem que aquest Scaffold correspon a una selenoproteïna de la familia GPx.
GPx2
Scaffold KL206556.1 - Aquest Scaffold té un E-value bo a tots els blasts. Els T-Coffes que mostren un millor alineament són GPx1 i GPx2. S'utilitza el de GPx1, ja que és lleugerament millor. La Sec de la proteïna d'humà es troba alineada amb una Cys de la proteïna d'estruç. Cap dels dos alineaments comencen per Met. L'exonerate prediu 3 exons per aquesta proteïna.
No s'han trobat elements SECIS, cosa que concorda amb l'alineament Sec - Cys que pot voler dir que ens trobem davant d'un homòleg amb cisteïna. L'anàlisi amb Seblastian ha donat negatiu.
Després d'aquest anàlisi concloem que aquest scaffold correspon a una proteïna de la familia GPx homòloga amb cisteïna.
GPx3
Scaffold KL205976.1 - A aquest Scaffold trobem bons resultats globals quan el correm contra GPx2 i contra GPx4, però tant l'E-value com el T-Coffee són millors per a GPx4. La proteïna predita no comença per metionina i segons la predicció de l'exonerate té 8 exons. Al T-Coffee observem alineament de les selenocisteines, cosa que apunta a que l'Scaffold ha de correspondre a una selenoproteïna ja que també s'ha trobat 1 elements SECIS. L'anàlisi amb Seblastian troba una homologia de l'Scaffold amb GPx4 a Canis lupus familiaris. Després d'aquest anàlisi concloem que aquest Scaffold correspon a una selenoproteïna de la familia GPx i que posiblement sigui corresponent a GPx4.
GPx4
Scaffold KL6787.1 - Aquest Scaffold no presenta cap alineament amb Sec als blasts, pel que esperem que es tracti d'una de les proteïnes homòlogues de la família GPx. L'E-value més baix del blast ha estat amb GPx5. No hem trobat elements SECIS i el Seblastian ha donat negatiu, el que reforça la idea de que es tracta d'una proteïna sense Sec. Aquesta proteïna té 3 exons tal i com prediu l'exonerate. Els T-Coffees no donen un alineament massa bo, tret del GPx7 on l'alineament no és del tot dolent però la proteïna no comença per metionina. S'han alineat la GPx7 humana amb Gpx1, per tal de conéixer quina cisteïna és la homòloga. S'ha vist que aquesta Cys està alineada amb una Cys de la proteïna predita en estruç.
Després d'aquest anàlisi concloem que aquest scaffold podria correspondre a una proteïna homòloga en cisteïna de la familia GPx, tot i que l'anotació no és molt bona i per tant no es pot assegurar.
Sel15
La selenoproteïna de 15 kD és una proteïna la funció de la qual no està ben definida. S'ha vist que pot estar implicada en l'efecte preventiu contra el càncer del seleni ingerit per dieta i en la regulació de la homeòstasi redox al reticle endoplasmàtic.
La proteïna predita es troba a l'Scaffold KL206233.1. és una proteïna de 5 exons que es situa a la cadena positiva.
Al blast s'ha trobat un sol hit, que és significatiu (E-value=7e-19), inclou pràcticament tota la proteïna i a més alinea la selenocisteïna amb un codó STOP.
Al T-Coffee es veu que la proteïna predita no està completa, ja que li falten uns 9 aminoàcids a l'inici, pel que no comença per metionina. Tot i així, l'alineament és molt bo. La predicció d'elements SECIS ha estat positiva, ja que n'ha trobat un a la mateixa cadena on es troba el gen a la regió 3'-UTR. Seblastian, a més, ha trobat homologia de l'Scaffold amb la Sel15 de Maleagris gallopavo.
Així, es pot concloure que la selenoproteïna Sel15 està conservada al genoma de l'estruç.
SelK
La selenoproteïna K s'ha associat amb la degradació del reticle endoplasmàtic (ERAD) de proteïnes mal plegades. Sembla que el seu gen també conté elements funcionals de resposta a l'estrès al RE. En fer l'anàlisi amb la proteïna humana, el hit de blast tenia un valor alt, no alineava tota la proteïna i la selenocisteïna no estava al hit. Es va repetir el blast amb la proteïna de Gallus gallus, on el hit comprenia una part més gran de la proteïna, i que encara no alineava la Sec. Per tant, es va fer l'anàlisi utilitzant la proteïna de pollastre, allargant molt la subseqüència per l'inici, per tal d'intentar trobar el fragment no alineat de la proteïna.
La proteïna predita es troba a l'Scaffold KL206989.1, a la cadena reversa i consta de 3 exons. L'alineament amb T-Coffee no és gaire bo i falta un petit fragment força gran de la proteïna al principi. A més, no ha predit cap Sec. Sorprenentment, la predicció d'elements SECIS ha estat positiva, i Seblastian ha trobat homologia entre l'Scaffold i la SelK de l'espècie Taeniopygia guttata.
SelM
La selenoproteïna M es creu que pot estar implicada junt amb Sel15 en la catàlisi de la reducció o reorganització dels ponts disulfur en proteïnes secretores o localitzades al RE. L'anàlisi amb blast donava un alineament amb un E-value de 8e-13, però que no inclou la Sec. No existeix la proteïna SelM en Gallus gallus. La proteïna predita es troba a l'Scaffold KL206710.1, consta de 4 exons i es troba a la cadena reversa. El T-Coffee dóna un alineament molt dolent, amb un grau d'homologia molt baix, a més falta un fragment de la proteïna tant al inici com al final. Tampoc s'ha predit cap Sec. No s'ha trobat cap element SECIS ni homologia amb una altra espècie mitjançant Seblastian.
Per tant, es pot concloure que la proteïna SelM no es troba al genoma de l'estruç, i com tampoc es troba anotada en Gallus gallus, podria ser que no estigués conservada en aus.
SelN
S'ha suggerit que la selenoproteïna N té un paper important en el manteniment de les cèl·lules satèl·lit i és necessària per la regeneració del múscul esquelètic després d'una lesió o estrès. La proteïna predita es troba a l'Scaffold KL205698.1, en el sentit de l'anotació. Consta de 12 exons. El blast dóna un resultat amb un E-value de 3e-23 i alinea una de les 2 Sec amb un codó STOP. L'alineament amb T-Coffee és força bo, especialment a la regió del final de la proteïna, tot i que li falta tot un fragment inicial d'uns 46 aminoàcids. De les 2 Sec de la proteïna query, una està alineada amb una Sec (on aquest alineament és millor) i l'altra no ho està. No s'ha trobat cap SECIS a la mateixa cadena que el gen.
Com a conclusió, es podria dir que és força probable que SelN estigui conservada en l'estruç. Podria ser que l'element SECIS es trobi més distant o fins i tot a un altre Scaffold, i per això no s'ha detectat.
SelO
La funció de la selenoproteïna O és desconeguda. Es troba a l'Scaffold KL206934.1, en el sentit de l'anotació. S'han trobat 19 exons.
Es van trobar 2 hits a blast, però només un d'ells alineava la Sec amb un codó STOP. El resultat del T-Coffee dóna un alineament força bo, tot i que falta un fragment d'uns 15 aminoàcids a l'inici de la proteïna. El gen predit codifica per 3 Sec, una de les quals està alineada amb la Sec de la query. No s'han trobat SECIS. Tot i això, es pot concloure que SelO està conservada en l'estruç.
SelP
Es creu que la selenoproteïna P té un paper important en el transport de seleni als teixits perifèrics, especialment cervell i testicles, i que en preserva la funció en condicions limitants de seleni. és una proteïna produïda al fetge i secretada a la sang, de manera que conté el 50% del seleni en plasma. També té la característica única de tenir múltiples residus de Sec.
La proteïna predita es troba a l'Scaffold KL206062.1 en el sentit de l'anotació i consta de 4 exons. El blast ha donat 2 hits amb un E-value menor de e-04, el segon no inclou cap de les Sec i és un fragment molt curt, per tant s'ha escollit el primer hit. El resultat amb T-Coffee té una regió molt ben alineada, on la proteïna comença per metionina, però després empitjora, introduint alguns gaps. La proteïna predita conté 5 Sec, de les quals 1 està alineada amb una de les de la query. La resta no estan alineades, però pot ser degut als gaps de l'alineament. S'han trobat 2 elements SECIS a la regió flanquejant del gen, per tant, es pot concloure que la proteïna SelP està conservada en l'estruç.
Família SelR
Les proteïnes de la família SelR o MsrB (Methionine-R-Sulfoxide Reductase) catalitzen la reparació de l'enantiòmer R dels residus oxidats de metionina de manera estereoespecífica. La família en humans consta d'una selenoproteïna i 2 proteïnes homòlogues amb cisteïna al lloc de la Sec. En fer el blast per a les 3 proteïnes query, s'han obtingut diversos Scaffolds en comú, que tenen un E-value menor que e-04. S'han triat 3 Scaffolds per a l'anàlisi i la cerca de selenoproteïnes.
SelR1
La proteïna predita es troba a l'Scaffold KL205900.1, en el sentit de l'anotació i té 3 exons. El T-Coffee dóna un alineament molt bo, però falta un fragment de la proteïna, pel que no comença per metionina. Hi ha una Sec alineada amb la Sec de la query. S'ha trobat un element SECIS i, a més, Seblastian ha trobat una proteïna homòloga en l'espècie Gallus gallus.
SelR2
La proteïna predita es troba a l'Scaffold KL206260.1, en la cadena reversa i consta de 4 exons. No és una selenoproteïna, sinó que té una cisteïna a la posició on hi hauria d'haver la Sec. El T-Coffee dóna un bon alineament, tot i que falta el fragment inicial. Les cisteïnes de la posició d'interès, amb homologia per la Sec de SelR1, estan alineades. La cerca d'elements SECIS és negativa.
SelR3
La proteïna predita està a l'Scaffold KL206175.1 a la cadena reversa i té 7 exons. No té Sec, sinó que hi ha una cisteïna a la posició homòloga. El T-Coffee dóna un alineament molt bo, tot i que la proteïna no comença per metionina. Les cisteïnes estan alineades. La cerca de SECIS ha donat un resultat positiu. Com a conclusió, es pot dir que s'ha trobat al genoma de l'estruç una selenoproteïna de la família SelR i 2 proteïnes homòlogues amb cisteïna.
SelS
La selenoproteïna S té una funció similar a SelK. Està involucrada en la reducció de ponts disulfur durant la degradació de proteïnes associada al RE (ERAD). També estan implicades en la resposta immune i inflamatòria durant la regulació de la producció de citoquines. La proteïna predita es troba a l'Scaffold KL206666.1 en el sentit de l'anotació i té 7 exons. El blast va trobar un únic hit, amb un E-value de 2e-06. L'alineament realitzat pel T-Coffee és molt bo, amb un alt grau d'homologia, tot i que falten 14 aminoàcids a l'inici de la proteïna. La Sec predita està alineada amb la de la query. La cerca d'elements SECIS ha sortit positiva, i a més s'ha trobat homologia amb la proteïna SelS de l'espècie Gallus gallus mitjançant Seblastian. Per tant, es podria concloure que SelS està conservada en l'estruç.
SelT
La Selenoproteïna T està implicada en la regulació de l'homeòstasi del Ca2+ i la funció neuroendocrina. També s'ha vist que pot tenir un paper en la regulació de les cèl·lules β del pàncrees i la homeòstasi de la glucosa. La proteïna que s'ha predit es troba a l'Scaffold KL206408.1 en el sentit de l'anotació, i conté 4 exons. S'han trobat 3 hits de blast, però s'ha escollit el primer, ja que té un E-value de 3e-22 i, a més, la Sec es troba alineada amb un codó STOP. El T-Coffee ha proporcionat un alineament molt bo, tot i que falta la regió inicial de la proteïna predita. No s'ha trobat cap Sec en la proteïna d'estruç, de manera que la Sec de la query es troba alineada amb una Serina. No s'ha trobat cap element SECIS, per tant, es pot concloure que SelT està al genoma, però probablement ha perdut o mutat la Sec.
Família SelU
Les proteïnes de la família SelU pertanyen a la superfamília de proteïnes TLR (thioredoxin like). En humans hi ha 3 SelU anotades però cap d'elles és una selenoproteïna. En canvi, en Gallus gallus només n'hi ha una però sí que és una selenoproteïna. Abans de fer els blast, es va alinear cada una de les proteïnes humanes amb la proteïna SelU de pollastre i així es van poder determinar les posicions d'interès. Es va veure que la cisteïna a la posició 85 del SelU1 està alineada amb la selenocisteïna, així com la cisteïna en la posició 68 de SelU2 i la de la posició 74 en SelU3.
Al fer els blast s'ha obtingut un hit amb SelU1 a l'Scaffold KL206988.1, dos amb SelU2 als Scaffolds KL206677.1 i KL206084.1 i un amb SelU3 a l'Scaffold KL206555.1. Tots els hits contenen les cisteïnes d'interès, però el hit obtingut amb SelU3 té un E-value massa alt i, de fet, no ha sigut possible predir una proteïna a partir d'aquest Scaffold. S'han utilitzat els altres tres Scaffolds per predir les proteïnes d'aquesta família.
SelU1
S'ha predit una proteïna que té 5 exons, comença per metionina i es troba en el sentit de l'anotació. L'alineament amb la SelU1 humana és en general bastant bo. Només falta un petit fragment de 7 aminoàcids al final de la proteïna, o potser simplement la proteïna en l'estruç és més curta. Hi ha una selenocisteïna alineada amb la cisteïna d'interès. A més, també s'ha trobat un element SECIS i el Seblastian ha donat homologia amb Gallus gallus. Per tant, es tracta d'una selenoproteïna conservada en estruç i pollastre, però que en humans ha perdut la selenocisteïna i ara és només un homòleg.
SelU2
La proteïna predita té 6 exons i es troba en la cadena reversa. Hi ha un fragment de la proteïna que està molt ben alineat amb la SelU2 humana, però la resta de l'alineament no és gaire bo i falta un fragment bastant gran al principi. La cisteïna d'interès de la SelU2 humana està alineada amb una cisteïna, no hi ha elements SECIS i, per tant, tampoc ha donat resultats el Seblastian. Podem veure que hi ha alguns residus que podrien ser Sec, però es troben en un fragment de la proteïna en què l'alineament amb la proteïna humana és dolent. Aquests resultats indiquen que probablement no es tracta d'una selenoproteïna, sinó que podria ser una proteïna homòloga en cisteïna.
SelU3
És una proteïna amb 7 exons i que es troba en el sentit de l'anotació. L'alineament amb la SelU2 humana és bastant dolent, ja que falta un fragment bastant gran al principi i la cisteïna d'interès no està alineada ni amb Sec ni amb una altra cisteïna, sinó amb una metionina. Hi ha alguns residus que podrien ser selenocisteïnes, però com que l'alineament és tan dolent no es pot afirmar que ho siguin amb seguretat. A més, no s'han trobat elements SECIS ni tampoc ha donat resultats el Seblastian. Tot indica que SelU3 no només no és una selenoproteïna, sinó que no es troba en el genoma de l'estruç.
SelW
SelW s'expressa en funció de la disponibilitat de seleni. No es coneix molt bé la seva funció, però és una de les selenoproteïnes més abundants en mamífers. En humans hi ha dues proteïnes d'aquesta família: SelW1, que és una selenoproteïna; i SelW2, que no ho és. SelW1 no ha donat cap hit al fer el blast, mentre que SelW2 n'ha donat tres. Com que no es pot comparar amb Gallus gallus perquè no hi ha cap proteïna d'aquesta família anotada, s'han alineat les dues proteïnes humanes mitjançant T-Coffee per intentar determinar la posició d'interès. S'ha vist que la cisteïna en la posició 33 de SelW2 queda alineada amb la selenocisteïna de SelW1. Aquesta posició no apareix en cap del tres hits, pel que finalment s'ha seleccionat el que té un millor E-value: Scaffold KL206266.1. A partir d'aquest Scaffold s'ha aconseguit predir una proteïna que té 5 exons i es troba en el sentit de l'anotació.
L'alineament amb la proteïna humana no és gaire bo, ja que falta un fragment al principi que és casi la meitat de la proteïna. Per tant, no comença per metionina. A més, la posició 33 està en aquesta regió, pel que la cisteïna d'interès es troba alineada amb un gap. La part que està alineada, però, sí que té una certa homologia amb la SelW2 humana. Cap al final de la proteïna es pot veure el que podria ser una selenocisteïna, però com que després d'aquest residu l'alineament deixa de ser bo, també hi hauria la possibilitat que fos un codó stop. Aquesta hipòtesi esà recolzada pel fet que no s'han trobat elements SECIS i, per tant, el Seblastian tampoc ha donat resultats.
Es pot concloure, doncs, que aquesta proteïna també està present en estruç, tot i que no és una selenoproteïna i no es troba gens conservada.
Família TR
TR1
La proteïna que s'ha predit a partir de l'Scaffold KL206566.1 té 18 axons i està en el sentit de l'anotació. L'alineament amb la TR1 humana és bastant bo, tot i que falta un fragment de la proteïna al principi i, per tant, no comença per metionina. Hi ha una Sec alineada amb la Sec de la proteïna humana. A més, s'ha trobat un element SECIS a la mateixa cadena, però el Seblastian no ha donat homologia amb cap espècie.
Encara que el Seblastian no hagi trobat cap resultat, les altres dades indiquen que sí que es tracta d'una selenoproteïna, que a més es troba bastant conservada.
TR2
La predicció d'aquesta proteïna s'ha fet amb l'Scaffold KL205919.1 i l'alineament està fet amb la TR2 humana. Es tracta d'una proteïna amb 19 exons i que es troba en el sentit de l'anotació. L'alineament és bastant bo i, a més, hi ha una selenocisteïna alineada amb una selenocisteïna de la proteïna humana. No comença per metionina perquè falta un petit fragment inicial, però són només 7 aminoàcids. S'ha trobat un element SECIS i el Seblastian ha donat homologia amb Gallus gallus. Aquests resultats indiquen clarament que TR2 és una selenoproteïna que està conservada en l'estruç.
TR3
Aquesta proteïna està predita utilitzant l'Scaffold KL206060.1. és una proteïna de 18 exons i que es troba en la cadena reversa. L'alineament amb la TR3 humana és bastant bo en general, però falta el fragment inicial de la proteïna i l'alineament al principi no és gaire bo. Al final d'aquest fragment mal alineat hi ha un residu que podria ser una Sec, però el fet que a partir d'aquí l'alineament millori podria indicar que es tracta d'un codó stop i que la proteïna no s'ha predit correctament. és a dir, aquest fragment inicial podria no ser realment part de la proteïna.
Pel que fa a la resta de la seqüència, té una Sec alineada amb una Sec de la TR3 humana i també s'ha trobat un element SECIS a la mateixa cadena. El que no ha donat resultat ha estat el Seblastian, que no ha trobat homologia amb cap altra espècie. Tenint en compte tot això, es pot concloure que és molt probable que es tracti d'una selenoproteïna, tot i que potser no està del tot ben anotada.
SelV
SelV és una de les selenoproteïnes menys conegudes. Es creu que està implicada en la reproducció masculina, ja que només s'ha detectat expressió als testicles. Només es troba en mamífers placentaris i, de fet, no está anotada en pollastre. Per tant, no s'hauria de trobar en el genoma de l'estruç. Per confirmar-ho, s'ha realitzat un blast amb la proteïna humana i, tal com s'esperava, no ha donat cap hit.
Família DI
La família de proteïnes Iodothyronine deiodinase (DI) està formada per tres proteïnes: DI1, DI2 i DI3, les quals contenen residus de selenocisteïna i són rellevants en l'activació i desactivació de les hormones tiroidees. La seva funció és transformar la T4 en T3 perquè aquesta reguli l'expressió gènica a diferents teixits. Com a model hem fet servir les proteïnes humanes degut a la seva bona anotació.
DI1
La proteïna Iodothyronine deiodinase I activa i desactiva hormones tiroidees mitjançant desiodització dels anells interior i exterior. és inhibida per propylthiouracil (PTU) i es troba al fetge i als ronyons. Hem obtingut una predicció a l'Scaffold KL206113.1, el strand té un sentit positiu, conté 4 exons i un E-value de 2e-36. No s'ha pogut alinear tota la proteïna ja que el T-Coffee revela que la proteïna manca de 46 aminoàcids al principi, pel que no comença per metionina. La selenocisteïna s'ha alineat amb una altra Sec, s'ha identificat un element SECIS amb una score de 18,85 però no s'ha trobat cap proteïna homòloga en una espècie propera. Al comparar la DI1 de Gallus gallus hem vist el mateix Scaffold tot i que amb un E-value de 1e-29 i amb un sol exó. Això ens corrobora que DI1 està present en Struthio camelus caustralis.
DI2
La Iodothyronine deiodinase II també desioditza T4 a la seva forma bioactiva T3 però només per l'anell extern. Es troba al cor, al múscul esquelètic i al teixit adipós entre d'altres. Hem obtingut una predicció a l'Scaffold KL206356.1, el strand també té un sentit positiu, 10 exons i un E-value de 2e-38. No s'ha pogut alinear tota la proteïna, li falten 25 aminoàcids al principi, pel que tampoc comença per Met. Dels dos residus de selenocisteïna de la query humana se n'ha alineat un. A més, s'ha identificat un element SECIS amb una score de 29,76 i s'ha trobat una proteïna homòloga en Gallus gallus que corrobora la nostra hipòtesi de conservació.
DI3
La Iodothyronine deiodinase III catalitza la inactivació de T3 i T4 per l'anell interior donant lloc als seus metabolits inactius respectius. Es troba a la placenta i al teixit fetal. El trobem en el mateix Scaffold que la DI2 i, igual que en les anteriors, el strand és positiu però té 6 exons i un E-value de 1e-80. L'hi falten 5 aminoàcids al principi i 8 cap al final per tenir un alineament complert però la selenocisteïna s'ha alineat amb èxit, hi ha un element SECIS a amb una score de 29,76 i un homòleg en Gallus gallus, pel que Seblastian corrobora la hipòtesi.
SelH
La selenoproteïna H és una oxidoreductasa nuclear caracteritzada per presentar un motiu CXXU, és a dir, una Cys i una Sec separades per dos altres animoàcids. Contant com a model la proteïna humana i la de Gallus gallus, veiem que SelH existeix en ambdues, però que no conté selenocisteïna en la segona. Els nostres anàlisis no han sortit ja que no s'ha pogut realitzar el blast, pel que concloem que SelH no existeix en Struthio camelus australis.
SelI
La selenoproteïna I és una proteïna transmembrana exclusiva de vertebrats que conté un domini fosfatidiltransferasa CDP-alcohol també present en les fosfotransferases colina (CHPT1) i colina/etanolamina (CEPT1). També conté 7 dominis transmembrana i 3 residus d'aspàrtic altament conservats que són necessaris per l'activitat catalítica amb un motiu DG(X)2AR(X)8G(X)3D(X)3. Es diferencia de CHPT1 i CEPT1 per un grup COOH terminal que conté un residu de selenocisteïna, tot i que la funció d'aquest és encara desconeguda. Per aquesta proteïna obtenim una predicció a l'Scaffold KL206079.1, el strand és negatiu, té 10 exons i un E-value de 5e-35. Per un alineament complet li falten 15 aminoàcids a l'inici, però la Sec s'ha alineat bé amb una altra, trobem un element SECIS i un homòleg en Meleagris gallopavo, cosa que confirma la nostra hipòtesi de conservació.
Maquinària
eEFSec
eEFSec (eukaryotic elongation factor, selenocysteine-tRNA-specific) forma part de la maquinària implicda en la síntesi de selenoproteïnes.0 Més concretament, participa en el procés de traducció reclutant el Sec-tRNA i facilitant la incorporació de Sec a la proteina que s'està traduint. Al córrer el blast obtenim 4 hits dels quals 2 tenen un E-value inferior a 0,05. L'Scaffold KL206060.1 té un E-value molt baix (e-104) cosa que ens diu que l'alineament és molt poc probable que s'hagi donat per atzar, així que el triem per seguir amb l'estudi. A l'Scaffold, l'alineament no cobreix tota la proteïna, de 596 aminàcids en cubreix 489. L'exonerate ens prediu una proteïna amb 7 exons i que es troba entre la posició 20000 i 88476. Mentrestant, la predicció d'elements SECIS no ens en troba cap, cosa esperable ja que es tracta d'una proteïna de maquinària que no conté cap selenocisteina.
El T-Cofee ens dóna un alineament molt bo tot i que al faltar els primers 106 aminoàcids (els que hem comentat que faltaven per cubrir tota la proteïna) no trobem la Met característica a l'inici de proteïna. Al trobar una homologia tan gran, podem concloure que eEFSec està present a Struthio camelus australis.
EIF4A3
EIF4A3 (Eukaryotic translation initiation factor 4A, isoform 3) és un component del EJC (complexe d'unió d'exons) implicat en la traducció, localització i vigilància (surveillance) del mRNA durant l'splicing. Al córrer el blast obtenim 31 hits dels quals fins a 24 tenen un E-value inferior a 0,05. Hem escollit l'Scaffold KL206950.1 ja que té l'E-value més petit (8e-22) i cobreix la major part de la proteïna en comparació amb la resta d'Scaffolds (de 411 en cobreix aproximadament 325). L'exonerate ens prediu una proteïna amb 16 exons i que es troba entre la posició 49568 i 95004.
El T-Coffee mostra un molt bon alineament a pràcticament tota la proteïna, tot i que no trobem la Met senyal d'inici de proteïna. A més, a la proteïna predita a l'estruç trobem una Sec alineada amb una Ser a la seqüència d'humans, la predicció d'elements SECIS no ens en troba cap i el Seblastian tampoc dóna cap resultat. Per tant, podem concloure que EIF4A3 està conservada a estruç ja que l'alineament és realment bo tot i que no està del tot clar que la Sec predita sigui realment una Sec, ja que no està ben alineada i no té elements SECIS.
SECp43
SECp43 s'uneix al Sec-tRNA formant un complex i no només té un paper en la síntesi, sinó que també regula l'expressió de selenoproteïnes mitjançant metilació d'aquest Sec-tRNA. Com que no té selenocisteïnes, d'entre els diferents hits obtinguts al fer el blast amb la proteïna humana s'ha seleccionat el que té un millor E-value i està més complet: l'Scaffold KL205982.1. A partir d'això s'ha fet la predicció d'una proteïna, que té 9 exons i es troba en el sentit de l'anotació. L'alineament d'aquesta proteïna amb la humana és molt bo, tot i que falten els 6 primers aminoàcids i, per tant, no comença per metionina. Es pot concloure que aquesta proteïna es troba conservada en l'estruç.
SEPSECS
SEPSECS és important per la síntesi de selenocisteïna, ja que catalitza el pas final de la reacció, on s'incorpora un selenofosfat. En aquest cas el blast amb la proteïna humana només ha donat un hit: el Scaffold KL206236.1. Amb aquest Scaffold s'ha predit una proteïna que té 11 exons i es troba a la cadena reversa. Al fer l'alineament amb la proteïna humana es pot veure que falta un fragment de la proteïna al principi i un altre al final, però la resta de l'alineament és molt bo. Encara que falti un tros de la proteïna i que aquesta no comenci per metionina, es pot concloure que aquesta proteïna està conservada en l'estruç.
MsrA
La proteïna Methionin-S-sulfoxide reductase A catalitza la reducció del isòmer Methionin-S-sulfoxide, mentres que Methionin-R-sulfoxide reductase 1 (MsrB1), una selenoproteïna que conté zinc, catalitza la reducció de l'isòmer R. MsrA i MsrB1 tenen estructures i seqüències diferents alhora que funcions complementàries. S'ha vist que en alguns eucariotes unicel·lulars i bacteris anaerobis MsrA conté un residu Sec que en organismes superiors s'ha substituït per una Cys reduint entre 10 i 50 vegades la seva activitat catalítica.
Hem obtingut una predicció a l'Scaffold KL205924.1, el strand té un sentit negatiu, 8 exons i un E-value de 2e-20. No s'ha pogut alinear tota la proteïna, li falta un bon tros al principi, pel que no comença per Met. Per molt que no té residus de selenocisteïna s'ha identificat un element SECIS que no podem ignorar degut a la seva score de 14,25. El SECIS pot ser que estigui present degut a la conservació de la seva estructura des dels organisme unicel·lulars.
RPL30
La proteïna ribosomal L30 és sintetitzada a la subunitat 60S dels ribosomes i es troba al citoplasma. La seva funció és incorporar Sec a les selenoproteïnes durant la traducció. Hem obtingut una predicció a l'Scaffold KL206368.1, el strand té un sentit positiu, 4 exons i un E-value de 2e-24. Presenta un alineament quasi perfecte per molt que no comença per Met. Concluim que la RPL30 existeix en l'estruç i confirma la presència de selenoproteïnes.
SBP2
La SECIS binding protein 2 s'associa als ribosomes i als elements SECIS alhora que interacciona amb eEFSec que recluta el Sec-tRNA i facilita la incorporació de Sec durant la traducció. L'hem predit a l'Scaffold KL206825.1, a la cadena negativa. Té 21 exons i un E-value de 1e-27. L'alineament no és complert ja que li falten 8 aminoàcids al començament (no comença per Met) i uns 50 cap al final, però com que la resta és prou bo considerarem que aquesta proteïna està present en Struthio camelus australis.
SecS
La proteïna Selenocysteine Synthase forma selenocistenil-tRNA a partir de selenofosfat i o-fosfoesteril-tRN, participant així en el procés de síntesi de selenoproteïnes. SecS ha estat predita a l'Scaffold KL206236.1, en la cadena negativa, té 11 exons i un E-value de 7e-45. No té un alineament complet ja que li falten 30 aminoàcids al principi i 28 més cap al final. Com que la resta del T-Coffee és correcte considerem que SecS està present en Struthio camelus australis.
Família SPS
Hi ha dues proteïnes que sintetitzen selenofosfat, la SPS1 i la SPS2. Ambdues són homòlogues a SelD d'E. coli però SPS2 té la capacitat de generar selenofosfat de novo mentres que SPS1 no.
SPS1
Es creu que SPS1 juga un rol en el reciclatge de Sec degut a que no el pot sintetitzar de novo, sinó que el requereix prèviament al medi. El trobem a l'Scaffold KL206610.1, el strand és positiu, presenta 8 exons i té un E-value de 4e-39. Presenta un alineament quasi perfecte que confirma la presència de selenoproteïnes en Struthio camelus australis.
SPS2
SPS2 és ella mateixa una selenoproteïna i està implicada en la biosíntesi tant de Sec com de Cys en situacions de deficiència de selenocisteïna. En vertebrats té un paper important en l'autoregulació de la síntesi de selenoproteïnes, mentre que en eucariotes inferiors no, ja que l'aminoàcid Sec està substituit per una Cys. Aquesta selenoproteïna es localitza al mateix Scaffold que SPS1, també a la cadena positiva i té un E-value de 1e-29. La predicció inclou 13 exons i no s'han trobat elements SECIS ni tampoc homòlegs en espècies properes. L'hi falten uns 50 aminoàcids cap al final però tret d'això, l'alineament és bo, cosa que confirma la seva presència en Struthio camelus australis.
Cerca de tRNA
El tRNA per a selenocisteïna és necessari per a la introducció d'aquest aminoàcid durant el procés de traducció de les selenoproteïnes. El fet d'haver trobat un tRNA per a Sec al genoma de l'estruç serveix per a confirmar que molt probablement aquesta espècie té selenoproteïnes codificades al seu genoma. S'han trobat 3 Sec-tRNAs d'humans i 1 Sec-tRNA de pollastre. D'aquestes 4 querys, en alinear-les amb el genoma de l'estruç mitjançant blast s'han trobat hits a 2 Scaffolds diferents: KL206555.1, que s'alinea amb un dels tRNA d'humans i KL206796.1 que s'alinea amb el tRNA tant de humà com de pollastre. El programa ARAGORN ha detectat un tRNA per a selenocisteïna a l'Scaffold KL206796.1.