INICI ~ OBJECTIU ~ INTRODUCCIÓ ~ MATERIALS ~ MÈTODES ~ EXPLICACIÓ DETALLADA DEL SCRIPT ~ RESULTATS ~ CONCLUSIÓ ~ REFERÈNCIES ~ AUTORES ~ |
CONCLUSIÓ |
En primer lloc, volem comentar que ha estat un projecte força costós per la gran quantitat de feina i entrebancs que ens ha suposat el seu desenvolupament. Esmentar que en un primer moment, l'objectiu inicial del treball era molt més llarg que el que hem realitzat nosaltres, ja que hi havia dos punts més que es podien fer. S'havien d'extreure les coordenades de les regions ENCODE on no hi havia cap anotació de RefSeq, Ensembl, genscan i geneid, i fer un fitxer multifasta amb les diferents seqüències trobades. I a més a més, executar geneid sobre el fitxer multifasta anterior, i intentar verificar l'existència real de les prediccions amb EST i proporcionar les anotacions dels gens que podien estar verificades d'aquesta forma.
El problema era que aquest projecte era nou, i que per tant, no teniem cap base i ben bé no sabiem com ho havien de fer. Ja que per aquest projecte calia treballar sobre unes dades genòmiques amb les que ni nosaltres ni ningú sabia enfrontat encara. Per tant, no sabiem ni la quantitat de feina,ni de temps que ens portaria dur-lo a terme. Per aquest motiu, hem hagut de repetir alguns punts fins arribar al resultat desitjat, tal i com ha quedat reflexat a l'apartat d'annex.
També comentar que nosaltres hem buscat amb ESTS l'evidència experimental de que els gens podien ser reals únicament amb geneid,ja que hi havia 32 anotacions, i per tant, era un nombre bastant assequible per poder arribar a un bon resultat. A més a més, aquest programa proporciona anotacions més fiables que no pas les que proporciona geneid.
Un altre objectiu inicial del treball era donar l'informació amb castellà i anglès, però per la gran extensió que ens ha suposat la part procedimental, hem cregut convenient fer-ho més extensament només en català que no pas fer-ho amb més idiomes pero menys complet.
El fet de no tenir cap ESTS que es solapi exactament amb els exons dividint-se a causa dels introns del gen. Fa pensar el següent:
- Que alguns ESTS siguin falsos positius.
- Quan es treballa amb ESTs s'ha de tenir en compte si és tracten d'EST 3' o 5'. El nostre problema és que en una mateixa regió s'hi han aparellat tan ESTs 5' com ESTs 3'. Nosaltres concluïm dient, que probablemt hi ha un mal anotament d'alguns ESTs.
Per comprovar que es tracta realment d'un error, s'hauria de fer un alineament entre dos ESTs que coincidissin en el patró ique divergissin en l'anotació amb el programa CLUSTALW.
- El resultats del programa d'alineament de Megablast no són del tot informatius ja que la majoria d' ESTs obtinguts no coincideixen en cap dels exons predits pel programa geneid.
- A més a més, com que nosaltres estem treballant amb unes anotacions de gens que han estan "predites", aquestes prediccions poden ser errònies. El que pot passar, és que a la predicció del gen li falti alguna part codificant upstream i per tant, sembla que l'EST s'aliniï amb les regions UTR en molts dels casos.
- Com ja hem dit al punt anterior, les anotacions dels gens potser que no siguin correctes, per això, en algun cas com en el de l'imatge resultant del cromosoma chr6_928, no sen's alinia exactament amb els exons del gen.
També podria passar que aquest gen no estigués anotat ja que s'expressa a un altre teixit.
Ja per acabar, tal i com es mostrava a la taula 5 script , partíem de 108.101 anotacions dividides entre les 4 bases de dades (RefSeq, Ensembl, geneid i genscan) i hem acabat obtenint 536 anotacions, de les quals n'hi havia 247 per genscan i 32 per geneid.
Només tenint en compte les anotacions de geneid hem arribat a una possible anotació d'un gen real, el gen chr6_928.
Si mirem enrere, concretament, a l'apartat d'objectius veiem que un dels objectius d'aquest treball era establir un catàleg de gens del 1% del genoma humà. La pregunta és: on és aquest catàleg???? Doncs bé, per problemes que hem tingut al llarg del treball (explicats a l'annex) i el fet que no haguem analitzat les anotacions no solapades de genscan (per la gran quantitat de material i poc temps) vam creure que no tindria gaire sentit construir aquest catàleg, ja que aquest en part seria erroni i incomplert. És per això que ens hem centrat més a donar resultats de gens novells.
El tema de la informàtica aplicada a la biologia, és un tema molt important als nostres dies, s'ha fet molt camí però encara en queda molt per fer. El nostre projecte és només una petita mostra del que es pot arribar a fer. Us animem a tots a intentar ajudar a saber a la nostra societat una mica més sobre els nostres gens...
|