Per tal d'identificar per a què codifiquen els gens millor predits es van seguir els següents passos:
Gen 2 del Geneid |
SwissProt_C' NR_C' |
|
Gen 7 del Grail |
SwissProt_D' NR_D' |
|
Gen 2 del Geneid:
- Caracterització de les proteïnes:
Gen 1 del Geneid:
La proteïna predita presenta identitat amb la proteïna THO2 humana (identitat= 79%; e-value= 0'0) i d'altres espècies, com R. norvergicus o M. musculus.
Tot i així podem determinar que la predicció del Geneid no ha estat correcta: la proteïna predita (369 aminoàcids) és molt més curta que la proteïna real (1593 aminoàcids), potser perquè el programa ha predit un exó terminal no real; aquest fet concorda amb la manca de suport per ESTs que havíem esmentat per la regió 3' d'aquest gen. A més, comprovem que la proteïna predita no presenta correspondència amb dues regions de THO2, degut a la no predicció exònica esmentada en l'anàlisi de la validació d'aquest gen.
Cal esmentar que al realitzar l'alineament de la proteïna query amb la humana s'observa que aquesta comença a partir de l'aminoàcid 11, a pesar que l'inici de les seves seqüències és idèntic.
THO2 participa en la transcripció depenent de la RNA-polimerasa II i és necessària per l'estabilitat de les regions repetitives1.
La proteïna predita per Geneid presenta tres dominis: TSC_22, AFOR_C i RasGEF_N, els quals presenten un e-value no gaire elevat. El primer d'ells és un domini conservat a la majoria de proteïnes amb dominis leucine-zipper, el que estaria relacionat amb la interacció amb ADN.
Aquesta proteïna s'alinia amb la Baculoviral Apoptosis Inhibitor Protein (XIAP o BIRC4) humana (identitat= 97%, e-value=0'0), que presenta homòlogues en altre espècies com M. musculus, G. gallus, X. laevis , etc.
L'aliniament comença a la posició 105 de la proteïna query, el que indica una predicció dels exons inicials errònia per part del Geneid, confirmant així les nostres suposicions a l'hora d'analitzar els esquemes de les validacions amb ESTs.
La funció de BIRC4 consisteix en inhibir l'apoptosi mitjançant el bloqueig de l'activitat catalítica de les caspases, principalment la caspasa 92.
Hem trobat que la proteïna predita conté tres dominis BIR, els quals són imprescindibles per dur a terme la seva acció. Tots tres presenten un e-value inferior a e-32.Gen 3 del Genscan:
Aquest gen predit, presenta una gran longitud, el que ha fet que es pogués aliniar amb dues proteïnes diferents, confirmant que la predicció no és correcta.
Una de les proteïnes aliniades és la BIRC4 (identitat= 98%, e-value=0'0) esmentada anteriorment, la qual es localitzaria entre els aminoàcids 199 i 492 de la proteïna predita, no incloent la segona meitat de la proteïna BIRC4. Aquest fet explicaria perquè el Genscan ha unit els exons provinents d'aquest gen amb els del següent, ja que no ha trobat l'exó terminal del gen BIRC4.
L'altre aliniament que s'ha trobat ha estat a 300 aminoàcids de l'explicat anteriorment. Aquest correspon a part de la proteïna Cohesin subunit Stromal Antigen 2 (STAG2)(identitat= 87%, e-value= 0'0), de 1231 triplets, degut a que el Genescan no ha pogut predir l'últim exó de la proteïna (aliniament fins el codó 1197). Aquesta també ha estat predit pels gens del bloc D.
Observem que conté tres dominis BIR i un domini STAG*, tots ells amb un e-value molt baix. Aquest últim domini el comentarem en el gen 7 del Grail, ja que es troba involucrat en la funció del STAG2, millor predit per aquest programa.
*En alguns sistemes operatius, la imatge dels diferents dominis d'aquest gen es representa dividida en dues línies; en realitat a les dues meitats de la seqüència.
Gen 5 del FGenes:
Aquest gen correspon, en la seva regió 3', a l'inici del STAG2 comentat anteriorment, mentre que la meitat 5' no presenta homologia elevada amb cap proteïna, el que confirmaria la no validació per part d'ESTs d'aquesta regió (mapa 9).
Com la predicció no representa una proteïna real, no determinem l'existència de dominis estructurals ni possibles funcions.Gen 7 del Grail:
La proteïna predita correspon íntegrament a la Cohesin subunit Stromal Antigen 2 (STAG2). Coincideixen tant les coordenades d'inici com de final de la proteïna, mentre que es troben certes regions internes en què la predicció per part del software no ha estat adequada.
La cohesina és un complexe proteic que juga un rol essencial en la unió de les dues cromàtides germanes, ja que les manté unides durant la interfase. Existeixen dos tipus de complexes: SA1 i SA2, essent aquest últim majoritari a teixits somàtics d'humans3.
Aquesta proteïna predita presenta un únic domini significatiu, corresponent a un domini STAG, el qual està present en la família proteica relacionada amb el Stromal Antigen, però que encara no té una funció identificada. Per a més informació sobre les proteïnes: