EXEMPLE D'UN ALINIAMENT



El primer exemple es realitza amb dues seqüències molt curtes per poder analitzar millor tots els resultats intermitjos i mostrar la matriu d'aliniament.
  • Exemple 1:

Partim de dues seqüències en format FASTA:

>seq_prova1
GKTSA

>seq_prova2
RKTRS

Indiquem al programa la matriu que ha d'utilitzar(utilitzem la BLOSUM62 en aquest cas), i també els valors de la penalització per obertura i extensió de gap, que en aquest exemple hem fet servir -1 en els dos casos.

A partir d'aquestes dues seqüències construïm una matriu en la que en cada posició hi haurà la puntuació màxima entre les possibilitats de que l'aliniament ens vingui de l'esquerra, de dalt o de la diagonal.
La matriu resultant és:
           -      G         K        T         S         A
-          0      -1(E)    -2(E)   -3(E)    -4(E)    -5(E)
R         -1(A)   -2(D)     1(D)    0(E)    -1(E)    -2(E)
K         -2(A)   -3(D)     3(D)    2(E)     1(E)     0(E)
T         -3(A)   -4(D)     2(A)    8(D)     7(E)     6(E)
R         -4(A)   -5(D)     1(A)    7(A)     7(D)     6(D)
S         -5(A)   -4(D)     0(A)    6(A)    11(D)    10(E) 
    
Partint de la última posició d'aquesta matriu anem recuperant l'aliniament òptim final, que serà el següent,indicant també l'score, la similaritat i la identitat entre les dues seqüències aliniades.
                          

ALINIAMENT FINAL:

% d'identitat = 50% % similaritat = 50%

>seq_prova2 RKTRS- >seq_prova1 GKT-SA ** *

  • Exemple 2:

En aquest segon exemple, mostrarem l'aliniament òptim de dues seqüències més llargues, i ja no mostrarem la matriu de l'aliniament, que seria massa gran; només mostrarem les dues seqüències, que són:
NM_00798
MLWIWAVLPLVLAGSQLRVHTQGTNSISESLKLRRRVHETDKNCSEGLYQ
GGPFCCQPCQPGKKKVEDCKMNGGTPTCAPCTEGKEYMDKNHYADKCRRC
TLCDEEHGLEVETNCTLTQNTKCKCKPDFYCDSPGCEHCVRCASCEHGTL
EPCTATSNTNCRKQSPRNRLWLLTILVLLIPLVFIYRKYRKRKCWKRRQD
DPESRTSSRETIPMNASNLSLSKYIPRIAEDMTIQEAKKFARENNIKEGK
IDEIMHDSIQDTAEQKVQLLLCWYQSHGKSDAYQDLIKGLKKAECRRTLD
KFQDMVQKDLGKSTPDTGNENEGQCLE

NM_139194
MLWIMAVLPLVLAGPELNVRMQGTDSIFEGLELKRSVRETDNNCSEGLYQ
VGPFCCQPCQPGERKVKDCTTSGGAPTCHPCTEGEEYTDRKHYSDKCRRC
AFCDEGHGLEVETNCTRTQNTKCRCKENFYCNASLCDHCYHCTSCGLEDI
LEPCTRTSNTKCKKQSSNYKLLWLLILPGLAILFVFIYKRYRKRQPGDPE
SGIPSPESVPMNVSDVNLNKYIWRTAEKMKICDAKKFARQHKIPESKIDE
IEHNSPQDAAEQKIQLLQCWYQSHGKTGACQALIQGLRKANRCDIAEEIQ
AMVWEDHENSISNSRNENEGQSLE

l'aliniament òptim que ens ha resultat amb l'analisi amb el programa que hem desenvolupat, introduint la mateixa matriu de substitució que abans i diferents penalitzacions: -4 per obertura de gap i -1 per extensió de gap:


                                El % d'identitat és: 61.75%
                                El % de similaritat és: 73.80%
                                Score: 1088

NM_007987          MLWIWAVLPLVLAGSQLRVHTQGTNSISESLKLRRRVHETDKNCSEGLYQ
NM_139194          MLWIMAVLPLVLAGPELNVRMQGTDSIFEGLELKRSVRETDNNCSEGLYQ
                   **** ********* :* *  ***:** * *:*:* * *** ********

NM_007987          GGPFCCQPCQPGKKKVEDCKMNGGTPTCAPCTEGKEYMDKNHYADKCRRC
NM_139194          VGPFCCQPCQPGERKVKDCTTSGGAPTCHPCTEGEEYTDRKHYSDKCRRC
                    ***********::**:**  :** *** *****:** *: **:******
 
NM_007987          TLCDEEHGLEVETNCTLTQNTKCKCKPDFYCDSPGCEHCVRCASC--EHG
NM_139194          AFCDEGHGLEVETNCTRTQNTKCRCKENFYCNASLCDHCYHCTSCGLE-D
                     *** ********** ******:** :***::  *:**  * **  *
 
NM_007987          TLEPCTATSNTNCRKQSPRNR-LWLLTILV-LLIPLVFIYRKYRKRKCWK
NM_139194          ILEPCTRTSNTKCKKQSSNYKLLWLL-ILPGLAILFVFIYKRY--R---K
                    ***** **** *:***   : **** **  * *  ****::*  *   *
 
NM_007987          RRQDDPESRTSSRETIPMNASNLSLSKYIPRIAEDMTIQEAKKFARENNI
NM_139194          RQPGDPESGIPSPESVPMNVSDVNLNKYIWRTAEKMKICDAKKFARQHKI
                   *:  ****   * *::*** *:::*:*** * ** * * :******:: *
 
NM_007987          KEGKIDEIMHDSIQDTAEQKVQLLLCWYQSHGKSDAYQDLIKGLKKA-EC
NM_139194          PESKIDEIEHNSPQDAAEQKIQLLQCWYQSHGKTGACQALIQGLRKANRC
                    * ***** *:* ** ****:*** ********: * * **:**:**  *
 
NM_007987          RRTLDKFQDMVQKDLGKSTPDTGNENEGQCLE
NM_139194          -DIAEEIQAMVWEDHENSISNSRNENEGQSLE
                       :: * ** :*   *  :: ****** **