Autoextracció.sh

#!/bin/bash

adreça="/cursos/BI/genomes/project_2014/Chrysochloris_asiatica/"

for protein in prueba/x*; do {

echo $protein

### Per emagatzemar la regi&#oacute; on apareix el hit

regio=`cat $protein | cut -f 2`

echo $regio;

name=`cat $protein | cut -f 1`;

echo $name;

fastafetch $adresa/genome.fa ca.index "$regio"

>./regions/$name.fa;

# fastafetch $adresa/genome.fa

/home/U73962/luke/automatitzacio/ca.index "$regio" > ./regions/$protein.fa

### Definim l'inici i el final del hit en la regio

start=`cat $protein | cut -f 3`;

echo $start

length="300000";

### FASTASUBSEQ : Retalla una regió al voltant del gen que volem fer servir

fastasubseq ./regions/$name.fa $start $length > ./subseq/$name.fa 2> error_msg.temp

### Modificar variables en cas que no hi hagi prou bases en la regió o que l'inici estigui massa aprop

error=`cat error_msg.temp`

if [ "$error" != "" ]; then

error_llarg=`cat error_msg.temp | egrep "before end"`

### Si es passa de llarg, establim la llargada perquè arribi al final

if [ "$error_llarg" != "" ]; then

llargada=$error_llarg

echo $llargada

llargada=${llargada##*(}

echo $llargada

llargada=${llargada%)}

echo $llargada

length=$(( $llargada - $start ))

echo $length

if [ "$start" -eq "0" ]; then

start="1";

echo $start;

length="69000";

echo $lenght; fi

fastasubseq ./regions/$name.fa

$start $length > ./subseq/$name.fa; 2> error_msg2.temp

fi

error2=`cat error_msg2.temp`

if [ "$error2" != "" ]; then

fastasubseq ./regions/$name.fa 1 900 > ./subseq/$name.fa;

fi

fi

} done

rm *.temp