Autoextracció.sh
#!/bin/bash
adreça="/cursos/BI/genomes/project_2014/Chrysochloris_asiatica/"
for protein in prueba/x*; do {
echo $protein
### Per emagatzemar la regioacute; on apareix el hit
regio=`cat $protein | cut -f 2`
echo $regio;
name=`cat $protein | cut -f 1`;
echo $name;
fastafetch $adresa/genome.fa ca.index "$regio"
>./regions/$name.fa;
# fastafetch $adresa/genome.fa
/home/U73962/luke/automatitzacio/ca.index "$regio" > ./regions/$protein.fa
### Definim l'inici i el final del hit en la regio
start=`cat $protein | cut -f 3`;
echo $start
length="300000";
### FASTASUBSEQ : Retalla una regió al voltant del gen que volem fer servir
fastasubseq ./regions/$name.fa $start $length > ./subseq/$name.fa 2> error_msg.temp
### Modificar variables en cas que no hi hagi prou bases en la regió o que l'inici estigui massa aprop
error=`cat error_msg.temp`
if [ "$error" != "" ]; then
error_llarg=`cat error_msg.temp | egrep "before end"`
### Si es passa de llarg, establim la llargada perquè arribi al final
if [ "$error_llarg" != "" ]; then
llargada=$error_llarg
echo $llargada
llargada=${llargada##*(}
echo $llargada
llargada=${llargada%)}
echo $llargada
length=$(( $llargada - $start ))
echo $length
if [ "$start" -eq "0" ]; then
start="1";
echo $start;
length="69000";
echo $lenght; fi
fastasubseq ./regions/$name.fa
$start $length > ./subseq/$name.fa; 2> error_msg2.temp
fi
error2=`cat error_msg2.temp`
if [ "$error2" != "" ]; then
fastasubseq ./regions/$name.fa 1 900 > ./subseq/$name.fa;
fi
fi
} done
rm *.temp