SecS (selenocisteína sintetasa)
Función: la proteína selenocisteína sintetasa convierte O-fosfo-L-seril-tRNA[Ser]Sec en selenocisteil-tRNA[Ser]Sec utilizando el selenofosfato como compuesto donador de selenio.
Resultados
Tblastn
Homo sapiens
Hits con un e-value significativo en dos regiones distintas:
Genewise
Predicción de la proteína del Contig9310.rep:
VRAGFIPVAIPNLLEGDEVRTDLPALERKIAELGADSILCVLSTSSCFAPRAPDRIAEIAQVCKASGIGHIINNAYGVQTSKSMHLI
Predicción de la proteína del Contig9680_Contig5223:
RQACRLGRVDCFVQSTDKNFLVPVGGAIVAGPSKKFIEELNKAYPGRASASPLVDLFITLLSLGGXGWKTLLRERKELFGYFTA
EMAKVAEKHGERFLATPNNPISFGMTLERLGDVKEGPTMLGSMLFSRCCSGTRIVTGKEKKVVAGITFEGYGAHIDSYPTAYAT
AACALGLTRGEVDLFLTRLDKTLTELHHQKRKK
Protein blast
Homo sapiens:
El primer péptido contra todos los organismos
El segundo péptido contra Homo sapiens:
El segundo péptido contra todos los organismos
Discusión
Se hace un tcoffee con las dos proteínas hipotetizadas contra SecS de humano. Se observa que las dos secuencias van consecutivas en su alineamiento respecto a SecS humano.
Al unir las dos proteínas hipotetizadas y hacer BLAST contra las proteínas de Homo sapiens en el NCBI, el score es mayor el de ambas por separado.
Al estar los dos péptidos en regiones teóricamente separadas pero a la vez sugerirse una relación entre ellos (ambos serían fragmentos de una misma proteína mayor), puede ser que haya habido errores cuando se secuenció el genoma o que un intron muy amplio separe las dos secuencias.
Se analizan en el Pfam los dominios de la proteína fusionada, y se ve que el dominio "Soluble liver antigen/liver pancreas antigen" esta truncado en el extremo 5' del mismo.
Para indagar qué era lo que ocurría y buscar posibles respuestas, se han eliminado las "N" consecutivas no informativas del Contig9680_Contig5223, que se usó para llevar a cabo el análisis de GW del segundo péptido. Una vez hecho esto, el GW pronostica un péptido bastante mayor:
HGIGRSGDIAAVQPKAAGTYTFASLTNHLPQLTQGSSLLVKLTNALALHALRIAGGGNKAFAESCLVLPLATGMAVSLALLTLKQMR
PDTARYVLWPRMDQKSCLKSIQTAGMPTHTHTHDTRHTTHTTHTTGTRTHELCTVRLLITVSARQACRLGRVDCFVQSTDKNFL
VPVGGAIVAGPSKKFIEELNKAYPGRASASPLVDLFITLLSLGGXGWKTLLRERKELFGYFTAEMAKVAEKHGERFLATPNNPISFG
MTLERLGDVKEGPTMLGSMLFSRCCSGTRIVTGKEKKVVAGITFEGYGAHIDSYPTAYATAACALGLTRGEVDLFLTRLDKTLTEL
HHQKRKK
Al analizar en el Pfam este nuevo péptido y hacer un t_coffee con la proteína SecS en humano, se observa que falta un trozo de dominio interior. Casualmente o no, al hacer otro t_coffee acoplando en este lugar la secuencia peptídica del Contig9130.rep, se ve que corresponde con ese dominio o fragmento de dominio ausente.
HGIGRSGDIAAVQPKAAGTYTFASLTNHLPQLTQGSSLLVKLTNALALHALRIAGGGNKAFAESCLVLPLATGMAVSLALLTL
KQMRPDTARYVLWPRMDQKSCLKSIQTAGMPTHTHTHDTRHTTHTTHTTGTRTHELCTVRLLITVSA(VRAGFIPVAIPNLLEGDEV
RTDLPALERKIAELGADSILCVLSTSSCFAPRAPDRIAEIAQVCKASGIGHIINNAYGVQTSKSMHLI)RQACRLGRVDCFVQSTDKNF
LVPVGGAIVAGPSKKFIEELNKAYPGRASASPLVDLFITLLSLGGXGWKTLLRERKELFGYFTAEMAKVAEKHGERFLATPNNPISFG
MTLERLGDVKEGPTMLGSMLFSRCCSGTRIVTGKEKKVVAGITFEGYGAHIDSYPTAYATAACALGLTRGEVDLFLTRLDKTLTELH
HQKRKK
El péptido resultante tiene un dominio "Soluble liver antigen/liver pancreas antigen" completo:
La hipótesis más lógica es que la posición correcta del Contig9130.rep es el interior del Contig9680_Contig5223, aunque también se puede haber dado un reordenamiento exónico.
Si se realiza un protein BLAST contra todos los organismos:
- No se puede predecir la Met inicial de la proteína final, puesto que al hacer el Expasy encontramos en el frame correspondiente a nuestra proteína un codón STOP antes que uno para Met. Nuestra proteína debe tener un exón adicional.
- Se puede concluir que la proteína SecS está presente en el genoma de Acanthamoeba castellanii.