L’objectiu d’aquest projecte era identificar les selenoproteïnes, proteïnes homòlogues amb cisteïna i la maquinària de síntesi en el genoma de l’espècie Condylura cristata. Per fer-ho, s’han utilitzat diferents programes informàtics, entre els quals el tBLASTn, l’exonerate i el t-coffee. També es van intentar obtenir resultats amb el genewise, però sense saber el motiu el programa no alineava les querys introduïdes amb el genoma de l’espècie analitzada.
Les querys utilitzades en l’anàlisi pertanyen a dues espècies: Mus musculus i Homo sapiens. La primera ha estat escollida ja que és una espècie amb les selenocisteïnes ben anotades i propera a Condylura cristata, i la segona per tal de corroborar els resultats obtinguts amb l’anàlisi realitzat a partir de les querys de Mus musculus.
Els resultats obtinguts ens permeten saber quines selenoproteïnes conserven la selenocisteïna a Condylura cristata, i quines han canviat aquest aminoàcid per una cisteïna.
Per començar, cal dir que de les proteïnes considerades com a participants en la síntesi de selenoproteïnes s’han trobat totes presents en el genoma analitzat. Aquestes serien eEFSec (Eukaryotic Elongation Factor), MrSA (Methionine Sulfoxide reductase A), Pstk (Phosphoseryl-tRNA kinase), SBP2 (SECIs Binding Protein 2), SECp43 (tRNA selenocysteine associated protein), SecS i SPS (Selenophosphate Synthetase). Es podria dir que aquest resultat era l’esperat, ja que totes aquestes proteïnes són necessàries per tal que es dugui a terme la síntesi de la selenocisteïna i les selenoproteïnes que la continguin. Tot i això, de les dues proteïnes integrants de la família SPS tan sols se n’ha pogut trobar una, SPS1, sense cap selenocisteïna.
Les altres querys analitzades corresponen a proteïnes identificades com a selenoproteïnes o homòlegs amb cisteïna en les espècies Mus musculus i Homo sapiens. Moltes d’elles es troben conservades en Condylura cristata, com ara la família de proteïnes DI (Iodothyronine deiodinase), resultat esperat ja que és una família altament conservada en mamífers. També Sel15, la família TR (Thioredoxin reductases), SelR1, però no SelR2 ni 3, que si que es troben al genoma de Condylura però en forma d’anàlegs amb cisteïna, SelW1, GPx1, GPx2, GPx3, GPx4, GPx5 i GPx6, que no conserva la selenocisteïna ni en Homo sapiens ni en Mus musculus, però sí en Condylura cristata, SelT, SelP, SelH, SelI i SelM. Per altre cantó tenim la família de proteïnes SelK, amb una sola proteïna a l’espècie Homo sapiens, però amb dotze a Mus musculus. De totes aquestes querys s’han aconseguit identificar al genoma de Condylura dos duplicacions o pseudogens de la proteïna, i a més a més la seqüència que codifica per la proteïna funcional, que segons els resultats pot incloure’s dins el grup de selenoproteïnes amb la selenocisteïna conservada.
Dins el grup de proteïnes identificades com a anàlegs amb cisteïna enlloc de selenocisteïna es troba la família de SelU, formada per SelU1, SelU2 i SelU3, dos membres de la família GPx, GPx7 i GPx8, SelO i SelS.
Per últim, en aquest projecte s’han inclòs querys d’Homo sapiens no presents en ratolí, entre elles SCLY, EIF4A3, SELENBP, XPO1, SARS2, CELF1, G6PD, TTPA i RPL30.
L’anàlisi dels resultats ha permès classificar a G6PD, TTPA, SCLY, EIF4A3 i XPO1 com a selenoproteïnes en forma d’anàlegs amb cisteïna. Per últim, les proteïnes SARS2, SELENBP, RPL30 i CELF1 han sigut considerades inexistents a l’espècie Condylura cristata.
Cal remarcar que aquest estudi es basa en la identificació de seqüències homòlogues, és a dir, en l’alineament de seqüències de selenoproteïnes ja conegudes d'una espècie, amb el genoma de l'espècie en estudi. Així doncs, aquest mètode no permet trobar noves selenoproteïnes, ja que aquestes no estan anotades en una altra espècie, cosa que fa necessari altres estudis per poder determinar-les.
A més a més, sí que ha sigut estudiat el selenoproteoma de diverses espècies, però actualment, encara no hi ha prou informació sobre el funcionament i la rellevància de les selenoproteïnes existents. Per tal d’arribar a conèixer aquesta informació és necessari el processat i anàlisi d’un gran volum de dades, per això és important destacar l’ús de la bioinformàtica com a eina per a poder seguir investigant i extraient conclusions en aquest camp.
Es pot dir que gràcies a aquest projecte s’han aconseguit entendre i saber utilitzar tots els programes necessaris per tal d’identificar proteïnes conegudes en un genoma a partir d’homologia de seqüència. A més a més, partint del desconeixement, la realització d’un programa automatitzant tot el procés ha permès la familiarització amb els llenguatges de programació perl i bash. Per últim el fet de presentar els resultats obtinguts en format web, ha servit per adquirir lleugeresa en l’ús del llenguatge html.