Aquest treball ens ha permés caracteritzar la seqüència anònima Apo Cluster, identificant-ne 4 gens i les seves corresponents proteïnes.
Per poder desenvolupar el treball i poder arribar a unes conclusions finals ha sigut necessari l'ús d'eines computacionals, sense les quals la caracterització de la seqüència no hagués estat possible.
El primer que vam haver de fer per començar l'anàlisi va ser emmascarar totes les regions de la seqüència que tinguessin elements repetitius i que per tant no eren codificants. El fet de tenir un 40% d'elements repetitius ha facilitat l'anàlisi de la seqüència i ens ha permés anar una mica més ràpid en el procés d'anàlisi.
Un cop emmascarada la seqüència vam procedir a la predicció de gens i estructures ex&oagrave;niques utilitzant tres programes diferents de predicció de gens Ab initio: Geneid, Genscan i Fgenesh. Els resultats obtinguts han estat lleugerament diferents en els tres programes, ja que el Geneid predia 9 gens, el Genscan 7 i Fgenesh 8 per apo1 i per apo2, 4, 5 i 5 respectivament. D'aquests, només 6 estaven ben suportats per spliced ESTs:
Per apo1:
Per apo2:
Observant els gràfics obtinguts per cadascuna de les dues subseqüències, vam poder veure que el gen 9 de Geneid i el 5 de Genscan d'apo1, estaven localitzats en la regió de solapament entre les dues subseqüències i que els dos gens suportats per ESTs en apo2, és a dir, el gen 4 de Geneid i el 2 de Genscan també estaven localitzats en aquesta mateixa regió de solapament i que a més a més, l'estructura exònica inicial d'aquest dos últims era semblant a la predita pels gens d'apo1. Finalment després d'analitzar molt bé els dos gràfics, vam arribar a la conclusió que es tractava dels mateixos gens. Per tal de d'estar segures que agafàvem tot el gen sencer, vam decidir analitzar els dos gens de la subseqüència apo2. Així doncs, els gens ben suportats per spliced ESTs són en realitat 4 (3 de Geneid i 1 del Genscan):
Per apo1:
Per apo2:
Davant d'aquest resultat podem dir que en el nostre cas la predicció obtinguda per Fgenesh no ens ha estat gaire útil a la hora de predir les estructures gèniques.
Tant per apo1 com per apo2 hi havia una àmplia zona en la qual no trobàvem evidències d'ESTs però en canvi els programes sí que predien gens. Per tal de veure si els gens localitzats en aquestes zones podrien ser vàlids o no, vam recórrer a la validació mitjançant TBlastX. Els resultats van ser que cap gen estava suportat per TBLastX. Davant aquest fet, definitivament vam decidir que les prediccions realitzades en aquelles regions no estaven suficientment suportades i que per tant cap de les estructures gèniques podia incloure's en l'anàlisi de les proteïnes.
En l'anàlisi de proteïnes ens vam trobar que la proteïna 4 predita pel Geneid no estava caracteritzada, és a dir, no vam trobar ni proteïnes homòlogues a BlastP ni dominis funcionals a Interpro. Per a sorpresa nostra, vam trobar que a Rattus norvegicus hi havia una proteïna caracteritzada que tenia un domini funcional com el de la nostra i que estava caracteritzat com un domini NF-kappa activating factor. A més a més, vam trobar que en el cromosoma 4 d'humans hi havia una proteïna que també tenia aquest domini funcional. Amb les tres seqüències d'aminoàcids vam decidir fer un Clustalw, per tal d'intentar definir si aquesta funció podia ser la de la nostra proteïna predita i desconeguda. Els resultats obtinguts no van ser gaire bons en l'alineament conjunt de les tres seqüències d'aminoàcids, ja que la proteïna de rata era força diferent a les altres dues. En fer alineaments dos a dos, els resultats obtinguts no van ser gaire més bons que en el cas anterior, ja que no vam trobar gaire similitud en les proteïnes. Així doncs, ara per ara, no podríem afirmar que la proteïna 4 de Geneid desconeguda fos un NF-kappa activating factor.
Pel que fa a la resta de proteïnes, hem observat que el gen 5 del geneid codifica per un domini Zinc finger ZPR1, mentre que en la subseqüència apo2 el gen 2 de Genscan codifica per una apolipoproteïna i el 4 de Geneid codifica per una proteïna Serina/Treonina Kinasa i una apolipoproteïna. Si mirem els resultats podem observar com aquestes dues proteïnes es troben aliniades en els dos extrems de la nostra seqüència. Això ens ha fet pensar que potser el Geneid ha predit un únic gen i que potser en realitat en són dos. A més a més, els dos dominis funcionals trobats a Interpro són molt diferents.
El fet d'observar dues apolipoproteïnes creiem que té sentit si tenim en compte que estem analitzant la seqüència Apo Cluster.
Inici | Conclusions |