Resultados
La tabla inferior refleja los resultados obtenidos en la búsqueda de selenoproteínas en Phytophthora ramorum.
Phytophthora ramorum |
||||||||
---|---|---|---|---|---|---|---|---|
Hits | E-value | GFF | cDNA | Proteína | T coffee | Secis | ||
GPX1 | TBlastN | Hit 1 | 5e-24 | |||||
GPX2 | TBlastN | Hit 1 | 4e-28 | |||||
GPX3 | TBlastN | Hit 1 | 2e-20 | |||||
GPX4 | TBlastN | Hit 1 | 8e-37 | |||||
GPX5 | TBlastN | Hit 1 | 1e-24 | |||||
GPX6 | TBlastN | Hit 1 | 3e-22 | |||||
GPX7 | TBlastN | Hit 1 | 6e-25 | |||||
Hit 2 | 6e-17 | |||||||
GPX8 | TBlastN | Hit 1 | 9e-26 | |||||
Hit 2 | 2e-15 |
Discusión
Como podemos ver en la tabla hemos encontrado un hit utilizando como query las GPX humanas, excepto en GPX7 y GPX8 en las cuales obtenemos dos.
En el caso de GPX1, vemos que en el tBLASTn aparecen dos contigs con E-values significativos y que alinean U de la query con C de nuestra secuencia. Estos dos hits serán los que estudiaremos. Al realizar todo el proceso explicado en el protocolo con el primer hit (gi|113920737|gb|AAQX01000432.1|) vemos que este codifica para una proteína con un alto grado de homología con las GPX humanas.
En el caso del segundo contig ni el exonerate ni el genewise nos da ningún resultado. Si miramos en detalle la secuencia y la comparamos con la anterior podemos ver que se trata de un fragmento del primer contig.
Lo mismo sucede con las 6 primeras GPX analizadas: el segundo hit siempre resulta ser una región del primero y no nos permite realizar ni el genewise ni el exonerate. En algún caso, como en GPX6, el exonerate sí que da un resultado, pero encontramos el problema de que al llegar al tcoffee no alinea la X de la secuencia que corresponde a U, por lo tanto este contig no nos interesa [1].
En el caso de GPX7 y GPX8 obtenemos dos hits significativos correspondientes a los scaffolds gi|113920737|gb|AAQX01000432.1| y gi|113920845|gb|AAQX01000324.1|. En estos dos casos, ambos hits nos dan un resultado lógico.
Si analizamos los hits, podemos ver que los hits 1 encontrados usando las GPX humanas como query corresponden a un mismo scaffold. El segundo hit de GPX7 y 8, sin embargo, corresponde a un scaffold diferente, y por lo tanto, se trata de otro gen. Esto indica que lo más probable sea que en el genoma de este protista existan dos genes distintos que codificarán para proteínas que sean homólogas en cisteína de una selenoproteína ancestral.
Para comprobar esto, realizamos un Tcoffe [Tcoffe fasta] Tcoffe html en el que utilizamos las 8 GPX humanas que nos sirvieron de query junto a las dos proteínas encontradas en P. ramorum.
En el resultado obtenido vemos la gran similitud entre todas las secuencias obtenidas, sobre todo en lo que se refiere al dominio de las proteínas que contienen la cisteína, mientras que son más divergentes en las zonas 3' y 5'.
Únicamente podemos decir que son de la misma familia ya que no podemos determinar a que GPX humana corresponden debido al gran parecido entre ellas.
Finalmente intentamos buscar elementos Secis en las proteínas obtenidas, y solamente logramos encontrarlos si usamos como pattern Loose (canonical and not canonical), por lo que puede que se traten de falsos positivos. Esto no sería de extrañar ya que nuestras proteínas son homólogos en cisteína, por lo que no necesitan esta estructura para su traducción.