Predicció de proteïnes a la seqüència


La presència de diferents prediccions suportades per ESTs, fa pensar que realment en aquelles regions existeixen gens codificants. És per això que s'ha procedit a comparar-les amb bases de dades de proteïnes existents a tots els organismes.

- Predicció de les proteïnes:

Per tal d'identificar per a què codifiquen els gens millor predits es van seguir els següents passos:

  1. Seleccionem la seqüència proteica del millor gen predit de cada bloc.
  2. Enviem aquests pèptids predits al programa BLASTP primer utilitzant la base de dades de SwissProt i, posteriorment, la nr (no redundant) per tots els organismes.
  3. Obtenim les següents dades:
  4. Taula 4. Definició dels blocs

    Nom del bloc
    Gen escollit
    Resultats
    hg16dna_A
    Gen 1 del Geneid
    SwissProt_A    NR_A
    hg16dna_B*
    ---
    ---
    hg16dna_C
    Gen 3 del Genscan**
    Gen 2 del Geneid
    SwissProt_C    NR_C
    SwissProt_C'    NR_C'
    hg16dna_D
    Gen 5 del FGenes
    Gen 7 del Grail
    SwissProt_D    NR_D
    SwissProt_D'    NR_D'
    hg16dna_E*
    ---
    ---
    hg16dna_F
    ---
    ---
    *Donada la mala predicció de gens en aquestes regions, no s'ha determinat la presència de proteïnes
    **Es va utilitzar tota la proteïna predita pel Genscan codificada per aquest gen.
  5. Busquem els dominis existents en les proteïnes predites al servidor Protein Families database of alignments and HMMs (Pfam).


    - Caracterització de les proteïnes:

    Per a més informació sobre les proteïnes: