|
En este módulo partimos de las regiones candidatas a contener selenoproteínas y usamos las selenoproteínas de selenodb como query para predecir la secuencia de las posibles selenoproteínas con exonerate y genewise. Para exonerate usamos las selenoproteínas con X en vez de U y con genewise usamos las selenoproteínas que tienen U. Usamos la variable $trev que informa sobre la orientación del hit de tblastn para hacer la predicción en la orientación pertinente. Cambiamos el nombre del output de exonerate y de genewise para que contengan el nombre del programa y el id de la proteína de selenodb que ha usado como query junto con el cromosoma de la región. También ejecutamos SelenoProfiles a partir del genoma.
############################################################################################### ##################################### - MÓDULO 2 - ################################### ############################################################################################### ########################### ANÁLISIS: Predicción proteínas ########################### ############################################################################################### ############################################################################################### #!/bin/bash #$ -o our.stdout #$ -e our.stderr #$ -q llicen.q #$ -N OurJob #$ -cwd export PATH=/cursos/BI/soft/exonerate/i386/bin:$PATH export PATH=/cursos/BI/bin:$PATH export WISECONFIGDIR=/cursos/BI/soft/wise-2.2.0/wisecfg ######################################### EXONERATE ########################################## n=$(wc -l ~/perlscripts/scripts_output/candidates | cut -d ' ' -f1); for line in $(seq 1 $n); do chr=$(head -$line ~/perlscripts/scripts_output/candidates | tail -1 | cut -f2 | tr -d ' '); id=$(head -$line ~/perlscripts/scripts_output/candidates | tail -1 | cut -f1 | tr -d ' '); exonerate -m p2g --showtargetgff --exhaustive yes -q ~/gallopavodb/selenoprots/Xselenoprots/$id.X.aa.fa -t ~/gallopavodb/regions/$id.$chr.region.fa | egrep -w exon > ~/our_results/exonerate/$id.$chr.exonerate.gff; fastaseqfromGFF.pl ~/gallopavodb/regions/$id.$chr.region.fa ~/our_results/exonerate/$id.$chr.exonerate.gff > ~/our_results/exonerate/$id.$chr.exonerate.cdna; fastatranslate -F 1 -f ~/our_results/exonerate/$id.$chr.exonerate.cdna > ~/our_results/exonerate/aa/$id.$chr.exonerate.aa; #renameexonerate.pl > Cambiamos el nombre del output de exonerate y de genewise para que contengan el nombre del programa y el id de la proteína de selenodb que ha usado como query junto con el cromosoma de la región en la que se ha hecho la predicción. ~/perlscripts/renameexonerate.pl < ~/our_results/exonerate/aa/$id.$chr.exonerate.aa $id $chr > ~/our_results/exonerate/aa/$id.$chr.rexonerate.aa; done; ######################################### GENEWISE ############################################ n=$(wc -l ~/perlscripts/scripts_output/candidates | cut -d ' ' -f1); for line in $(seq 1 $n); do chr=$(head -$line ~/perlscripts/scripts_output/candidates | tail -1 | cut -f2 | tr -d ' '); id=$(head -$line ~/perlscripts/scripts_output/candidates | tail -1 | cut -f1 | tr -d ' '); trev=$(head -$line ~/perlscripts/scripts_output/candidates | tail -1 | cut -f7 | tr -d ' '); #la variable $trev que informa sobre la orientación del hit de tblastn para hacer la predicción en la #orientación pertinente. genewise -pep -pretty -cdna -gff $trev ~/gallopavodb/selenoprots/Uselenoprots/$id.U.aa.fa ~/gallopavodb/regions/$id.$chr.region.fa > ~/our_results/genewise/$id.$chr.genewise; #genewisepep.pl > extrae la secuencia peptídica que está comprendida entre las líneas que contienen #las expresiones /pep/ y /\//. ~/perlscripts/genewisepep.pl < ~/our_results/genewise/$id.$chr.genewise $id $chr > ~/our_results/genewise/aa/$id.$chr.genewise.aa; done; ########################################## SELENOPROFILES ################################## #debido a problemas en la instalación al principio tubimos problemas. es muy importante no olvidar el export WISECONFIGDIR=/cursos/BI/soft/wise-2.2.0/wisecfg Selenoprofiles results_folder -t /homes/users/U63748/gallopavo.fa -s "Meleagris_gallopavo" -p eukaryotic