Les selenoproteïnes són un conjunt de proteïnes que es caracteritzen per contenir aminoàcids selenocisteina (Sec), codificat amb el codó UGA, el qual en condicions normals funciona com un codó STOP parant la traducció. Per tal de que continuï la síntesi de la proteïna després d’aquest codó, es necessita la inserció d’elements SECIS (seqüències d’inserció de selenocisteïna). La doble funció d’aquest codó UGA explica perquè és tant difícil anotar i predir les selenoproteïnes i per això han sigut descartades o mal catalogades durant tant de temps. Aquest tipus de proteïnes tenen funcions essencials en molts processos cel·lulars actuant com a antioxidant, protegint contra l’estrès oxidatiu, participant al metabolisme tiroïdal o al plegament de les proteïnes, entre d’altres.
L’objectiu principal d’aquest estudi és determinar i localitzar les selenoproteïnes del genoma de Callorhinus ursinus. L’espècie de referència escollida per a comparar el genoma ha sigut l’Homo sapiens, ja que, tot i no ser molt proper filogenèticament, el seu genoma està molt ben anotat.
Per a realitzar aquest projecte s’ha creat un programa informàtic en llenguatge Bash que automatitza el procés d’anàlisi de les selenoproteïnes mitjançant diferents programes d'alineació de seqüències per obtenir la seqüència predita de Callorhinus ursinus.