Discussió
Discussió per a la família GPx
Phytophthora Capsici
El tBLASTn contra la selenoproteïna GPx humana amb el genoma del protista ha rebel·lat cinc hits amb un e-value estadísticament significatiu:
HIT REGIÓ INICI FINAL e-value Hit0 PHYCAscaffold_71 108831 108319 4e-40 Hit1 PHYCAscaffold_4 998335 998832 2e-24 Hit2 PHYCAscaffold_3 1018119 1017634 1e-23 Hit3 PHYCAscaffold_1 172045 172215 2e-12 Hit4 PHYCAscaffold_77 56616 56293 4e-05
Dels quals, l'últim (scaffold 77) no s'ha pogut annotar amb exonerate, però si amb genewise. El primer hit que observem, hit0, alinea una cisteïna amb la selenocisteïna de la query (a exonerate i T-Coffee), però l'anàlisi amb SECISsearch no rebel·la cap element vàlid.
El hit1 alinea una cisteïna amb la selenocisteïna de la query (a exonerate i T-Coffee) i no s'han observat elements SECIS vàlids.
El hit2 alinea una cisteïna amb la selenocisteïna de la query i mostra un possible SECIS aproximadament a 5kb downstreem.
>PHYCAscaffold_3:subseq(997634,50000):[14965,14873] CTCCGCTAAT TTCGGGT CACTGCGACTGCC ATGAT ACGGGAAGTC AA AGCTCACGAACT TGGTCTCTGT TGAA TTGA ACTCTG TAGAGTAGCT
El hit3 s'alinea la selenocisteïna de la query amb una cisteïna del genoma del protista. No s'han trobat elements SECIS.
Exonerate ha fallat en l'annotació del hit4, no obstant, amb Genewise hem pogut recuperar la seqüència. En aquest cas també s'alinea una cisteïna en el lloc de la selenocisteïna de la GPx humana, seguit d'un gap. Tanmateix, el T-Coffee alinea la selenocisteïna amb un gap i la cisteïna amb el següent aminoàcid (G). Tenint en compte que la selenocisteïna (o els seus homòlegs amb cisteïna) es troba en el centre catalític de la proteïna a la que donara lloc (i per tant juga un paper molt important en el seu funcionament), pensem que l'annotació de GeneWise és més acurada. És a dir, considerem que és més probable l'alineament de la Sec amb una Cis, que amb un gap, ja que aquest segon alineament indicaria que la seqüència del genoma del protista donaria lloc a una proteïna no funcional. Tot i així, tampoc descartem la opció que dóna el T-Coffee.
Hem realitzat un alineament múltiple mitjançant T-Coffee amb tots els hits. Tots tenen la selenocisteïna alineada amb una cisteïna del genoma del protista. L'annotació del hit1 és més llarga que la query.
Hem dut a terme un blastp contra la base de dades no redundant de NCBI. No hem trobat que cap dels hits estigui annotat, però pràcticament tots els resultats obtinguts com a seqüències similars són GPx. Podeu veure els resultats aquí: hit0, hit2, hit6 i hit7.
Pel que fa a la maquinària, hem trobat les seqüències de eEF-Sec, SLA/LP i SPS2.