Selenoproteinek proteinen talde bat osatzen dute, eta haien ezaugarri nagusia selenozisteina (Sec) izeneko aminoazido bat dutela da. Aminoazido hau UGA kodonak kodifikatzen du eta egoera normaletan, amaiera kodon bat balitz bezela aritzen da, itzulpena geldiaraziz. Baina, kodon honen ondoren proteinen sintesiak jarraipena izan dezan, SECIS (selenozisteina txertatze sekuentziak) elementuak behar izaten dira. UGA kodon honek daukan funtzio bikoitz honek hainbat gauza azaltzen dizkigu; izan ere, selenoproteinen anotazioa eta aurreikuspena zailtzen ditu eta beraz, denboran zehar baztertuak edota gaizki sailkatuak izan dira. Proteina mota hauek ezinbesteko funtzioak dauzkate prozesu zelularretan, hala nola, antioxidatzaile bezela, estres oxidatzailearen babesle bezala, metabolismo tiroidalean edota proteinen biribilketan.
Lan honen helburu nagusia Callorhinus ursinus genoman aipatutako selenoproteinak aurkitzea eta zehaztea da. Konparaketak egiteko, Homo Sapiens espeziea hartu dugu erreferentziatzak, filogenetikoki oso gertua ez bada ere, bere genoma oso ongi anotatua dagoelako.
Proiektu hau aurrera eraman ahal izateko, programa informatiko bat sortu dugu, Bash hizkuntzan. Programa honetan, selenoproteinen analisiaren prozesu osoa automatizatu dugu, sekuentzien alineaziorako programen bidez, horrela Callorhinus ursinus espeziean proteinaren sekuentzia lortu ahal izateko.