TblastN

  • blastall -p tblastn -i SEQÜÈNCIA_PROTEÏNA_CONEGUDA.fa -d GENOMA -o FITXER_SORTIDA -F F
  • blastall -p tblastn -i SEQÜÈNCIA_PROTEÏNA_CONEGUDA.fa -d GENOMA -o FITXER_SORTIDA_TBLASTN -m 9 -F F
  • torna a materials i mètodes      

    Fastefetch

  • fastafetch GENOMA GENOMA.INDEX NOM_SEQÜÈNCIA > FITXER_SORTIDA_FASATFETCH
  • torna a materials i mètodes      

    Fastasubseq

  • fastasubseq GENOMA INICI LLARGADA > FITXER_SORTIDA_FASTASUBSEQ
  • torna a materials i mètodes      

    Exonerate

  • exonerate -m p2g –showtarget -q SEQÜÈNCIA_PROTEÏNA_CONEGUDA.fa -t FITXER_SORTIDA_FASTASUBSEQ | egrep -w exon FITXER_SORTIDA_EXONERATE
  • torna a materials i mètodes      

    Genewise

  • genewise -pep -pretty -cdna -gff SEQÜÈNCIA_PROTEÏNA_CONEGUDA.fa FITXER_SORTIDA_FASTASUBSEQ > FITXER_SORTIDA_GENEWISE
  • genewise -pep -pretty -cdna -trev -gff SEQÜÈNCIA_PROTEÏNA_CONEGUDA.fa FITXER_SORTIDA_FASTASUBSEQ > FITXER_SORTIDA_GENEWISE
  • torna a materials i mètodes      

    T_coffee

  • t_coffee FITXER_FASTA1 FITXER_FASTA2 > FITXER_SORTIDA_TCOFFEE
  • torna a materials i mètodes      

    Cerca d'elements SECIS

    fastasubseq SEQÜÈNCIA_PROTEÏNA_TROBADA INICI 1000 > FITXER_SORTIDA_FASTASUBSEQ_SECIS

    torna a materials i mètodes      

    Cerca del tRNAsec

  • fastasubseq SEQÜÈNCIA_SECIS INICI LLARGADA > FITXER_SORTIDA_FASTASUBSEQ
  • torna a materials i mètodes      

    Cerca de noves selenoproteïnes

  • perl -e 'my $n; my $score; my $s; while(<>){if(/(>.+)/){$n=$1; /gy:\s(-\d+\.)/; $score=$1} else{chomp; print "$n\n$_\n" if $score-25; }}' genome.fa.std.secis
  • egrep ">" FITXER_NOMS_CONTIGS | grep -v complemen | gawk -F: '{print $1}'| sed 's/>//' > FITXER_SORTIDA_PATRÓ
  • egrep ">" FITXER_NOMS_CONTIGS | grep complemen | gawk -F: '{print $1}'| sed 's/ >//' > FITXER_SORTIDA_COMPLEMENTÀRIA
  • retrieveseqs.pl -vf GENOMA FITXER_SORTIDA_PATRÓ > FITXER_SORTIDA_PATRÓ.fa
  • retrieveseqs.pl -vf GENOMA FITXER_SORTIDA_COMPLEMENTÀRIA > FITXER_SORTIDA_COMPLEMENTÀRIA.fa
  • fastarevcomp FITXER_SORTIDA_COMPLEMENTÀRIA.fa > FITXER_SORTIDA_REVCOMP.fa
  • trans.pl FITXER_SORTIDA_PATRÓ.fa > FITXER_SORTIDA_PATRÓ.pep
  • trans.pl FITXER_SORTIDA_REVCOMP.fa > FITXER_SORTIDA_REVCOMP.pep
  • cat FITXER_SORTIDA_*.pep > FITXER_SORTIDA_CONTIGS
  • grep ">" genome.fa.std.secis | grep -v comple | perl -ne '/>(.+?):\[(\d+)/; my $a=$2-500; my $b=$2; my $name=$1; $name=~/gi.(\d+)/; my $outname=$1; if ($b>=500){print STDERR "retrieveseqs.pl -vfn GENOMA \"$name\" > > FITXER_SORTIDA; fastasubseq -s $a -l 500 FITXER_SORTIDA > $outname.$b.subseq.fa\n"; system("retrieveseqs.pl -vfn GENOMA \"$name\" > FITXER_SORTIDA; fastasubseq -s $a -l 500 FITXER_SORTIDA > $outname.$b.subseq.fa") }' 2 > FITXER_SORTIDA_ERRORS_PATRÓ
  • grep ">" genome.fa.std.secis | grep comple | perl -ne '/>(.+?):\[\d+,(\d+)/; my $a=$2-500; my $b=$2; my $name=$1; $name=~/gi.(\d+)/; my $outname=$1; if ($b>=500){print STDERR "retrieveseqs.pl -vfn FITXER_SORTIDA_REVCOMP.fa> \"$name\" FITXER_SORTIDA; /fastasubseq -s $a -l 500 FITXER_SORTIDA > $outname. $b.menos.subseq.fa\n"; system("retrieveseqs.pl -vfn FITXER_SORTIDA_REVCOMP.fa \"$name\" > contig_temp.fa; fastasubseq -s $a -l 500 FITXER_SORTIDA > $outname. $b.menos.subseq.fa") }' 2 > FITXER_SORTIDA_ERRORS_COMPLEMENTÀRIA
  • blastcl3 -p tblastn -i FITXER_SORTIDA_CONTIGS -d nr > FITER_SORTIDA_CONTIGS.NR
  • wget http://crg.es/~cchapple/p.marinus-nr.out
  • rm p.marinus-nr.out; wget http://crg.es/~cchapple/p.marinus-nr.out; grep -c y= p.marinus-nr.out; ./Kike_opus.pl < p.marinus-nr.out > aliniament.out
  • grep y= alineaments.out | sort | uniq > aliniaments_queris.out
  • torna a materials i mètodes      

     

    Universitat Pompeu Fabra