Las selenoproteínas son un conjunto de proteínas que se caracterizan por contener aminoácidos selenocisteína (Sec), codificado con el codón UGA, el cual en condiciones normales funciona como un codón STOP parando la traducción. Con el fin de que continúe la síntesis de la proteína después de éste codón, se necesita la inserción de elementos SECIS (secuencias de inserción de selenocisteína). La doble función de éste codón UGA explica porqué es tan difícil anotar y predecir las selenoproteínas y por eso han sido descartadas o mal catalogadas durante tanto tiempo. Este tipo de proteínas tienen funciones esenciales en muchos procesos celulares actuando como antioxidantes, protegiendo contra el estrés oxidativo, participando en el metabolismo tiroideo o en el plegamiento de las proteínas, entre otras.
El objetivo principal de este estudio es determinar y localizar las selenoproteínas del genoma de Callorhinus ursinus. La especie de referencia elegida para comparar el genoma ha sido l’Homo sapiens, ya que, aunque no son muy cercanos filogenéticamente, su genoma está muy bien anotado.
Para realizar este proyecto se ha creado un programa informático en lenguaje Bash que automatiza el proceso de análisis de las selenoproteínas mediante programas diferentes de alineación de secuencias para obtener la secuencia predicha de Callorhinus ursinus.