En la cerca de noves selenoproteïnes primerament s'intenta trobar la possible presència d'elements SECIS mitjançant un programa que prediu la possible formació d'una estructura secundària semblant a la d'un element SECIS en el genoma de P.marinus. S'obtenen 1434 possibles elements SECIS classificats segons l'energia lliure que produeix adquirir la conformació d'element SECIS.
La presència de tots aquest elements en P.marinus és impossible, per això es decideix fer un cribatge segons l'energia lliure.
Primer es seleccionen aquelles conformacions amb una energia lliure menor de -30 J, obtenint només set possibles elements SECIS
Per veure el fitxer clica aquí
El problema és que alguns dels elements SECIS trobats en P.marinus de selenoproteïnes conegudes no apareixen, per això es decideix fer un cribatge a partir de l'energia lliure dels elements SECIS obtinguts en la cerca de selenoproteïnes conegudes. D'aquesta manera s'obtenen tots el possibles elements SECIS amb una energia lliure de conformació menor a -20 J.
Per veure el fitxer clica aquí
S'obtenen quasi 400 possibles elements SECIS, per això es decideix utilitzar un programa en Perl per analitzar-los i acabar extraient la seqüència corresponent a la regió upstream del possible element SECIS dels contigs, per obtindre la regió peptídica.
Per veure el fitxer clica aquí
El resultat de fer un Blastcl3 nr mitjançant la terminal, per comparar les regions peptídiques extretes amb la base de dades proteiques del NCBI per saber si hi ha proteïnes conegudes, són 1721 alineaments.
Aquests són analitzats amb un programa en Perl que extreu aquells resultats en els que s'ha alineat una selenocisteïna del genoma de P. marinus amb un codó stop o una cisteïna de les seqüències de la base de dades del NCBI.
Tots el alineaments realitzats, 1721, es troben disposats en només 58 dels querys del genoma de P.marinus.
Per veure arxiu amb els querys clica aquí
Discussió
La cerca de noves selenoproteïnes ha donat forces problemes ja que en un inici, en la predicció de possibles SECIS, es va obtindre un gran nombre de prediccions. Mitjançant diferents programes s'ha anat reduint el nombre de possibles selenoproteïnes noves, fins a trobar-nos que poden estar ubicades en les seqüències de 58 querys diferents del genoma P.marinus.