Materials i mètodes

Automatització del procés

Exonerate i Genewise:

El programa permet fer, de forma automàtica i a partir d´una taula obtinguda amb el programa parseblast, la predicció exònica de forma satisfactòria tant amb Genewise com amb Exonerate. Exonerate només ha donat resultats quan les seqüències eren molt llargues i en alineaments de molta homologia, però aquestes situacions ens donen en molt poques ocasions. En canvi, amb Genewise sí s´han obtinguts resultats. És per aquesta raó que hem utilitzat els resultats de Genewise (per fer els Tcoffees i per fel el multifasta per mexicana) i no els d´Exonerate. Tot i això, ha fet falta allargar les seqüències que eren massa curtes i en les que no apareixia la X.


Predicció de selenoproteïnes:

El programa pretén predir si les selenoproteïnes d´altres espècies es troben també en el genoma de L. major o de L.mexicana. La forma de fer-ho és força grollera i el següent pas hagués estat refinar aquesta predicció. De moment el que fa el programa és només detectar si a l´alineament hi ha o no un codó stop TGA, però no comprova que aquest stop coincideixi amb la X, és a dir, amb la selenocisteïna. Manualment i amb l´ajuda del Tcoffee s´ha fet la comprovació que el codó stop coincideixi amb la selenocisteïna. Donat que el Genewise atura l´alineament quan hi ha un codó stop, l´eliminació d´aquest codó permet allargar l´alineament i augmentar, així, el pes de l´arxiu que el conté. Hem utilitzat aquesta hipòtesi per predir selenoproteïnes amb el nostre programa. El programa fa un primer Genewise amb el genoma original i, a continuació, substitueix els TGA del genoma per UCA (codó per la serina). La substitució podria haver estat per qualsevol codó que no fos stop, ja que l´objectiu és que l´alineament no s´aturi i sigui més llarg. Un cop substituït el codó stop, el programa torna a fer un Genewise, però aquest cop amb el genoma modificat. Per últim, compara la mida dels arxius del dos Genewise.


Creació del multifasta per L. mexicana (només en el programa per L.major):

S´ha fet un anàlisi del genoma de L.major per obtenir la seqüència de possibles selenoproteïnes. Un cop obtingudes aquestes seqüències, el mateix programa les inclou en un fitxer multifasta i es compara el resultat de L.major amb L.mexicana. Això és perquè el genoma de L.mexicana no està ensamblat, sinó que està en contigs, i molts alineaments amb proteïnes d´espècies llunyanes no es fan de forma completa. A més, quan el resultat del Genewise és molt petit perquè s´acaba el contig, podem utilitzar el genoma de L.major per allargar-lo. El fitxer multifasta també conté les seqüències de les selenoproteïnes d´altres espècies. Això es fa per determinar si L .mexicana té alguna selenoproteïna o homòleg en cisteïna diferent a L.major.


Creació d´arxius:

El programa genera els arxius que després s´utilitzen per allargar les seqüències, fer el Tcoffee i per a la predicció d´elements SECIS de forma satisfactòria.

Utilització del tutorial Perl tutorial