SELENOPROTEINAS en Dictyostelium purpureum

UPF
{ Presentación | Organismo | Genoma | Selenoproteínas | Métodos | Información | Nosotros }



Métodos

Protocolo | Programas
Enlaces

UPF


Biblioteca


Licenciatura en Biologia


PRBB


CRG


Bioinformatics and Genomics


Contact us



Protocolo


Para encontrar posibles selenoproteínas codificadas en el genoma de Dictyostelium purpureum, así como proteínas que participan en su metabolismo, hemos seguido los pasos siguientes:


1.Alinear todas las selenoproteínas (proteina.fa) de la página web www.selenodb.org con el genoma de D. purpureum (genoma_dpu.fa) mediante el programa blastall:

$ blastall -p tblastn -i proteina.fa -d genoma_dpu.fa -o archivo_salida.txt

2.Apuntar los resultados de cada alineamiento (longitud y posición del alineamiento, puntuación, e-value, etc).

3.Si la proteína en estudio contiene selenocisteína, anotar si ésta ha sido alineada y contra qué codón.

4.Seleccionar y guardar en archivos aparte los scaffolds en los que se han obtenido buenos alineamientos:

$ fastafetch genome_dpu.fa genome_dpu.index "scaffold_XXX" > scaffold_XXX.fa

5.Correr el programa exonerate (con la opción --exhaustive yes) para determinar exones provisionales:

$ exonerate -m p2g --showtargetgff --exhaustive yes -q proteina.fa -t scaffold_XXX.fa

6.Guardar en un archivo tipo gff las posiciones de los exones obtenidos en el mejor resultado:

$ exonerate -m p2g --showtargetgff --exhaustive yes -q proteina.fa -t scaffold_XXX.fa | egrep -w exon > archivo.gff

7.En el archivo anterior, modificar los números de las posiciones de inicio del primer exón y terminación del último para obtener, más tarde, la secuencia mínima que englobe los buenos alineamientos anteriores. Obtener el cDNA correspondiente a este fragmento quitando los intrones (según el programa fastaseqfromGFF.pl de Roberto Castelo):

$ perl fastaseqfromGFF.pl scaffold_XXX.fa archivo.gff

8.Traducir la secuencia obtenida a proteína mediante la herramienta fastatranslate del progrma Exonerate o con la ayuda del servicio de traducción de Expasy tools disponible online. Guardar la traducción (seis en realidad) en un archivo (nombre_aa.fa):

$ fastatransalte nombre.fa > nombre_aa.fa

9.Abrir el archivo que contiene la traducción y seleccionar sólo la traducción del marco de lectura correcto. Sobreescribir el archivo.

10.Con el archivo obtenido, hacer un blastp contra todas les proteínas de NCBI. Guardar los datos obtenidos.

$ blastcl3 -p blastp -i nombre_aa.fa -d nr > salida.out

11.Determinar si las proteínas que se obtienen son homólogas a la que estamos analizando. En caso de obtener proteínas de la misma familia que la de partida, proseguir. En caso contrario, y si las proteínas obtenidas son distintas pero están relacionadas con la de partida, analizar con cuidado los resultados. En caso negativo, el genoma de D. purpureum no contiene homólogos de la proteína analizada.

12.Descargar la secuencia de la proteína que haya dado un mejor resultado.

13.Correr exonerate con esta proteína y el scaffold de D. purpureum seleccionado en los pasos previos. Terminar de determinar la estructura del gen: buscar exones e intrones definitivos, metionina inicial, codón STOP y codón UGA si es el caso (ampliando o reduciendo si es necesario la región del genoma recortada anteriormente).

14.Si es el caso, buscar elementos SECIS en el scaffold donde se encontró la selenoproteína. Usar el programa de predicción de elementos SECIS que se encuentra en la web http://genome.unl.edu/SECISearch.html

Organismos



L. infantum


C. hominis


L. major


T. vaginalis


P. gallinaceum


T. brucei


P. knowlesi


P. tetraurelia


P. vivax


P. infestans


P. yoelii


B. bigemina




Años anteriores