Les selenoproteïnes són un conjunt de proteïnes implicades en diferents processos fisiològics com la senyalització redox, la defensa antioxidant, el metabolisme de les hormones tiroidees i la resposta immunològica, que contenen una o més selenocisteïnes a la seva seqüència primària. Aquest és l’aminoàcid número 21, codificat per un codó UAG i format pel seleni, un micronutrient essencial. Per ser sintetitzades necessiten una maquinària específica. La coincidència del codó que codifica per selenocisteïna amb el codó STOP ha dificultat la tasca d’analitzar i anotar aquestes proteïnes amb una aproximació bioinformàtica.

En aquest projecte hem tractat d’identificar el selenoproteoma d’un organisme que ha estat seqüenciat a l’any 2018: el Xiphophorus hellerii, un peix de la família dels pecílids que habita a centreamèrica. Hem dissenyat un programa de Perl per fer prediccions de les selenoproteïnes i les seves seqüències nucleotídiques de forma automàtica, basant-nos en les selenoproteïnes de l’espècie Danio rerio notades al SelenoDB 2.0. Hem utilitzat programes bioinformàtics com tBLASTn, Exonerate, Genewise, T-coffee, SECISearch3 i Seblastian.

Després d’un anàlisi exhaustiu de 49 proteïnes mitjançant la comparació amb el genoma del Danio rerio, hem pogut predir en el Xiphophurus hellerii un total de 32 selenoproteïnes, 9 homòlogues amb cisteïna i 6 proteïnes de maquinària implicada en el processament de les selenoproteïnes.