Findorf 2003 versió 1.0 és un programa creat amb lŽobjetiu de buscar orfs en seqüències genòmiques i traduir-les a proteïna. Ha estat programat al febrer del 2003 utilitzant Perl per Ramírez-Soriano A i Molina-Tomàs MC.
És molt fàcil. Només has de clicar el link de download i guardar el programa al disc. El programa està comprimit amb zip, de manera que el necessitaràs per a descomprimir el programa i utilitzar-lo (per a descarregar gratuïtament Winzip per a Windows clica aquí).
Findorf 2003 versió 1.0 està pensat per a ser executat des de Linux. Un cop descarregat se li han de donar permisos dŽexecució utilitzant la comanda chmod u+x seguit pel nom de lŽarxiu (Findorf.pl). Després només has dŽescriure ./Findorf.pl. No necessita cap argument, ja que el programa et demana tots els paràmetres que necessita.
Desafortunadament sí. Findorf 2003 versió 1.0 només accepta seqüències en format fasta. Si la seqüència no està en aquest format, pots utilitzar Transfasta 2003 versió 1.0 per a convertir-lo.
Una seqüència en format fasta comença amb una sola línia de descripció seguida per línies que contenen la seqüència. La línia de descripció es distingueix de la seqüència pel símbol major que (">") a lŽinici. Es recomana que les línies de text tinguin una longitud menor de 80 caràcters. Un exemple de seqüència en format fasta és:
>gi|532319|pir|TVFV2E|TVFV2E proteïna del tegument
ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRT
QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWC
HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCK
MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKK
TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGF
APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNL
LAAVEAQQQMLKLTIWGVK
Les seqüècies han dŽestar representades en els codis estàndard IUB/IUPAC tant per a nucleòtids com per a aminoácids, amb lŽexcepció que sŽaccepten les lletres minúscules. Els codis dŽàcids nucleics acceptats per Findorf 2003 versió 1.0 són:
A --> Adenosina |
C --> Citidina |
G --> Guanina |
T --> Timidina |
I els codis aminoacídics acceptats són:
A alanina | P prolina | |||
B aspartat o asparragina | Q glutamina | |||
C cisteïna | R arginina | |||
D aspartat | S serina | |||
E glutamat | T treonina | |||
F fenilalanina | U selenocisteïna | |||
G glicina | V valina | |||
H histidina | W triptòfan | |||
I isoleucina | Y tirosina | |||
K lisina | Z glutamat o glutamina | |||
L leucina | X qualsevol | |||
M metionina | * traducció stop | |||
N asparragina |
Pots escollir tant el nom de lŽarxiu de sortida com el seu format: el programa et demana aquesta informació quan comença a executar-se. Tot i així, és recomanable utilitzar una extensió del tipus .txt, ja que et permet visualitzar els resultats utilitzant qualsevol editor de text.
Findorf 2003 versió 1.0 és un programa complert per a trobar orfs que et permet escollir les característiques dels orfs trobats, mostrant només aquells que sŽajusten a les seves necessitats. Aquestes opcions són:
Els orfs es mostren traduïts i en format fasta.
Naturalment. Es pot elegir la longitud de las línias sense cap mena de restricció. Encara que, recorda que la longitut màxima recomenada sòn 80 caràcters.
La línia de descripció inclou la línia de descripció de la seqüència original més les posicions dŽinici i final de cada orf. Si lŽorf ha estat troabt a la cadena complementària, la paraula "complem" precedirà les posicions.
Findorf 2003 versió 1.0 ha estat creat utilitzant GNU Emacs 2.1 (per a Linux) com a editor de text. Si lŽobres amb un editor diferent o amb una altra versió dŽemacs poden generar-se errores quan troba accents o dŽaltres lletres o símbols no emprats a lŽanglès (per exemple ç).
El català és la nostra llengua, de manera que el programa original està escrit en català. De moment, lŽúnica part traduïda són les preguntes. Versions posteriors inclouran també la traducció de lŽscript.