En fer tBLAST contra l'organisme H.arabidopsidis obtenim 6 hits amb e-values significatius (e<10-4), i tot i que alguns d'ells es troben situats a la mateixa regió genòmica, aparentment no s'estan solapant. Analitzant-los amb detall veiem que:
ALINEA E-VALUE hit0: Cisteïna 6e-38 hit1: Null 6e-38 hit2: Cisteïna 3e-23 hit3: Cisteïna 3e-22 hit4: Gap 8e-12 hit5: Cisteïna 8e-11
No obstant, al executar l'Exonerate observem que en els 6 hits la selenocisteïna de la query alinea amb una cisteïna. De manera que de moment podem afirmar que els homòlegs de GPx en aquest organisme no tenen selenocisteïna en la seva seqüència.
Per altra banda, observant els resultats tant de l'Exonerate i el fastatranslate, com del Genwise veiem que per dos dels hits que es trobaven en la mateixa regió (hits 0 i 1) predim la mateixa proteïna, com podem observar si fem un TCoffee.
L'explicació que atribuïm al fet que a partir de dos hits aparentment no solapats obtinguem la mateixa proteïna és que, probablement, cada hit correspongui a un o més exons diferents de la proteïna. Per tal de verificar aquesta hipòtesi vam comparar els hits aportats pel tBLASTn amb els diferents exons de la proteïna predita per l'Exonerate i vam veure que, efectivament, hi havia una correspondència hit-exó.
Finalment, tot i no ser una selenoproteïna, vam observar elements SECIS en el genoma d'aquest organisme.
Un altre aspecte que ens va cridar l'atenció va ser que l'Exonerate dels hits 2, 3 i 4 (situats a la mateixa regió genòmica segons el tBLASTn) predeia tres proteïnes diferents per a cada hit, però idèntiques entre hits.
Observant on començava i on acabava cada proteïna vam veure que la primera que ens reportava l'Exonerate englobava les altres dues, de manera que obteniem una proteïna predita molt llarga. Tal i com mostra el resultat del BLASTp aquesta proteïna (en els tres hits) conté en la seva seqüècia la GSH peroxidase i altres dominis proteics situats upstream i downstream de la mateixa.

Això encara s'evidenciava més pel fet que en els TCoffee d'aquestes proteïnes predites amb la nostra query (GPx) només s'alineava un tros de les mateixes amb la query de la GPx.
Pel que fa als elements SECIS d'aquests tres hits que acabem de comentar, només un d'ells en presenta. Això pot ser a causa que com que els elements SECIS es troben a partir de la subseqüència generada amb el fastasubseq, si una subseqüència no és prou llarga no els trobarà. A més, el fet que els trobi en la subseqüència del hit5 ens indica que aquests elements estan situats a la regió 3' del gen.
Finalment comentar que l'Exonerate de l'últim hit significatiu que ens reporta el tBLASTn, presenta un raw score significatiu i al comparar els resultats amb el Genwise obtenim que aquests concorden perfectament. D'altra banda, el TCoffee ens dóna un alienament amb un score > 90 fet que demostra que probablement es tracta d'un altre homòleg amb cisteïna de la GPx, que a més, presenta elements SECIS en la seva seqüència.
