Phitophthora infestans

ESTUDI DE SELENOPROTEINES EN Phytophthora infestans

Núria Martínez (nuria.martinez09@campus.upf.edu)
Mònica Mercadé (monica.mercade01@campus.upf.edu)
Gisela Miró (gisela.miro01@campus.upf.edu)
Clara Ruiz (clara.ruiz02@campus.upf.edu)
Mireia Sans (mireia.sans01@campus.upf.edu)
Meritxell Vinyoles (meritxell.vinyoles01@campus.upf.edu)

Facultat de Ciències de la Salut i de la Vida
Universitat Pompeu Fabra

Introducció

Selenoproteines

P.infestans

Materials i mètodes

Resultats i Discussió

Conclusions

Bibliografia

ABSTRACT

En el codi genètic el codó UGA pot significar un senyal d'stop o una selenocisteïna. Aquest aminoàcid s'incorpora en algunes proteïnes, les selenoproteïnes. Actualment en la majoria d'organismes no s'han pogut identificar degut a la manca d'informació. L'objectiu del nostre estudi és la identificació de selenoproteïnes en el genoma de Phythophthora infestans, un organisme en el que encara no s'han buscat selenoproteïnes. Utilitzant el Blast, hem estudiat les homologies entre selenoproteïnes d'Homo sapiens i el genoma de P.infestans. Altres programes computacionals com Expasy, Genewise i SECISearch ens han permès comprovar que aquest organisme presenta disset homòlegs significatius amb les selenoproteïnes humanes, tot i que només dos d'aquests han demostrat ser selenoproteïnes reals.

The UGA codon can indicate a stop signal or a selenocysteine in the genetic code. This aminoacid is incorporated in proteins, particulary in selenoproteins. At the present time these proteins have not been identified in the vast majority of organisms due to a lack of information. The aim of our research is the study of the Phythophthora infestans genome, an organism in which selenoproteins have never been searched for. By using Blast, we studied the homologies between Homo sapiens selenoproteins and P.infestans genome. Other computational programs such as Expasy, Genewise and SECISearch allowed us to prove that this organism has seventeen significant homologues to the human selenoproteins, although just two of these were proved to be real homologous selenoproteins.

INTRODUCCIÓ

Les Selenoproteïnes són proteïnes que incorporen en la seva estructura la selenocisteïna, un aminoàcid codificat pel codó UGA en presència d'uns elements característics, els SECIS. Aquest codó característicament codifica pel codó STOP de finalització; aquesta doble funció en la codificació del codó UGA suposa un repte en l'anotació de selenoproteïnes en nous genomes, ja que amb els programes estàndard aquests codons són anotats automàticament com a codons STOP.

Recentment s'han identificat elements que caracteritzen les seqüències codificants de les selenoproteïnes i que permeten la seva identificació i caracterització en un nou genoma. Actualment el gran repte és poder identificar selenoproteïnes en nous genomes recentment seqüenciats, però també tornar estudiar genomes ja analitzats per cercar possibles selenocisteïnes obviades, i anotades com a finalització de la proteïna.

El nostre projecte consisteix en la recerca i anotació de gens de selenoproteïnes en el genoma d'un organisme recentment seqüenciat, Phytophthora infestans. La nostra cerca l'hem realitzat tant a partir de selenoproteïnes ja anotades en el genoma d'altres organismes, com el descobriment de noves selenoproteïnes característiques del nostre organisme. La nostra investigació, però, no es centrarà només en l'estudi de selenoproteïnes en si, sinó també en la maquinària relacionada, és a dir proteïnes que participen en la síntesi de selenoproteïnes.

Torna a l'inici

SELENOPROTEINES

Les Selenoproteïnes són proteïnes que incorporen selenocisteïnes (aa 21), una cisteïna anàloga a la qual un àtom de seleni substitueix un de sofre. La incorporació de l'aminoàcid selenocisteïna és especificat pel codó UGA, normalment un codó stop. En un mRNA el codó UGA pot tenir dues lectures, la de codó stop ,molt més freqüent, o la de selenocisteïna.

L'element SECIS: és el que determina que el codó UGA sigui llegit com a selenocisteïna. L'estructura secundària/terciària del mRNA forma aquest element SECIS, que es troba a la regió 3'-untranslated.

Tot i que s'ha vist que buscar elements SECIS potencials és útil per identificar noves proteïnes, pot donar molts falsos positius. El mètode que s'aplica per reduir el nombre de falsos positius es basa en correlacionar els elements SECIS predits amb aquells gens que s'hi trobi un fort biaix de codons característic de les regions codificants per proteïnes, extès darrere del codó UGA.

Per a la biosíntesi de selenoproteïnes hi intervenen diferents elements:

Síntesi de selenocisteïna (SeC): SPS1, SPS2, SLA/LP, Sec43p
Incorporació de SeC a les selenoproteïnes: SBP2, eEFsec, tRNAsec
SECIS

Diversos components de la maquinària de síntesi de les selenoproteïnes estan conservats entre diferents espècies suggerint un rol important de les selenoproteïnes en la funció cel·lular.

La Selenocisteïna: El seleni és un nutrient essencial pels animals, microorganismes i alguns eucariotes, per això la deficiència en seleni pot causar malalties. Aquest Seleni es troba sobretot en les selenoproteïnes, i per això aquestes són tant importants.

La majoria de selenoproteïnes són enzims redox, i se'ls hi atribueix una hipotètica capacitat antioxidant gràcies a la seva participació en la regulació de l'estat redox de la cèl·lula.

Aquestes selenoproteïnes han passat desapercebudes durant molt de temps, ja que la majoria de programes no tenen en compte que el codó UGA pot codificar, a part pel codó stop, per a una SeC. En trobar un UGA el programa consideraria que s'atura la pauta de lectura, cometent per tant l'error d'obviar la presència d'una selenocisteïna.

Recentment s'han identificat elements que caracteritzen les seqüències codificants de les selenoproteïnes i que permeten la seva identificació i caracterització en un nou genoma.

Alguns d'aquests elements són:

La presència del codó UGA in frame.
La presència d'elements SECIS en la regió 3'UTR en eucariotes i archea, i adjacents al codó UGA en procariotes.
Conservació d'exons up i down-stream del codó UGA.

Actualment en la cerca de selenoproteïnes a més a més de tenir en compte la codificació del codó UGA per una SeC, per tenir la certesa que ens trobem davant d'una, el fet de seguir trobant homologia després d'un potencial codó stop (UGA), o el fet de trobar un element SECIS a prop, ens pot fer pensar que en tenim una davant.

Torna a l'inici

Phytophthora infestans

Phytophthora infestans és un protist fungoide de la classe Oomicets. Es tracta d'una paràsit de plantes que infecta sobretot patates tomàquets i altres Solanàcies, causant una malaltia que rep el nom de "tizón tardío" o "mildiu de la patata". Pot arribar a provocar grans plagues i de fet va ser la principal causa de la "The Great Famine", una passa de fam que va haver-hi a Irlanda i a Escòcia a mitjans del segle XIX.

Les espores de P.infestans hivernen als tubercles infectats i es propaguen ràpidament en condicions càlides i humides. Les espores es desenvolupen a les fulles, i es poden dispersar mitjançant la pluja, que pot arrossegar les espores al terra on infectarien tubercles joves; o el vent, que les pot dispersar.

Els tubercles infectats desenvolupen taques grises o negres que són de color marró o vermellós per sota la pell. Una infecció bacteriana, secundària a la produïda per P.infestans, farà que els tubercles es podreixin ràpidament i que desprenguin una olor desagradable. Alhora, les fulles presentaran grans taques i les tijes s'ennegriran.

Per una banda, intentar limitar la font d'infecció sembla ser la millor forma d'evitar una plaga: les llavors que es planten han de ser de bona qualitat i s'han de descartar totes aquelles patates de la temporada anterior que han patit la malaltia, ja que poden actuar com a fonts d'infecció. Per altra banda, hi ha certes característiques metereològiques que propicien l'extensió de la plaga.

MECANISME D'INFECCIÓ DE P.infestans:

Tot i que aquests mecanismes de reconeixement i infecció de Phytophthora no es coneixen en detall, hem fet una breu explicació de com Phytophthora és capaç d'introduir les seves proteïnes efectores en la planta hoste.

Es coneix que els bacteris patogènics secreten proteïnes efectores, incloent Avr (avirulence proteins) en el citoplasma de la cèl·lula hoste a través de la via secretora tipus-III. El que ara s'està estudiant és com els patògens eucariotes, com els fongs i oomicets, són detectats per les plantes hostes. S'ha vist que secreten també Avr específics de cada espècie que són reconeguts per proteïnes de la cèl·lula hoste. En el cas de cèl·lula i d'alguns altres oomicets, aquests factors no se secreten directament al citosplasma, sinó que ho fan a través d'una estructura anomenada Haustorium. Aquesta estructura penetra dins de la cèl·lula travessant la paret, però es manté separada del citoplasma per dues membranes.

Aquesta figura mostra la interfase entre el patogen i la planta hoste. L'oomicet penetra en la paret de la planta, però no la membrana de la planta. Les proteïnes efectores (cercles vermells i taronges) són secretats pel patogen i es postula que entren al citoplasma de l'hoste per alterar el metabolisme i les vies de defensa. Quan les proteïnes de resistència de l'hoste (R) reconeixen les proteïnes efectores del patogen aquestes són reconegudes com a Avr.

INFORMACIÓ SOBRE EL GENOMA

S'estima que la mida del genoma de Phytophthora infestans és de 237 Mb, i un anàlisi microscopi indica que el genoma consta d'entre 8 i 10 cromosomes.

El DNA de P. infestans es trenca en petits fragments (4kb-40kb).
Cada fragment s'inserta a un vector i és clonat.
Els dos extrems del fragment són seqüenciats, creant els anomenats paired reads.
S'utilitzen els paired reads per identificar trossos contigus de la seqüència (contigs).
Els contigs s'ordenen, formant els supercontigs.

Aquest genoma, per tant, es troba ensemblat fins a les unitats de supercontigs, i cal dir que no és complet, ja que hi resten zones per acabar de seqüenciar.

Torna a l'inici

MATERIALS I MÈTODES

Cliqueu aquí per
veure el protocol d'ABP

Esquema Materials i Mètodes

Cerca de Selenoproteïnes homòlogues d' Homo sapiens:

1. Cerca de la seqüència de la selenoproteïna a buscar

2. Realització el BLAST (tBLASTn)

3. Elecció dels millors hits

4. Anàlisi de les potencials proteïnes homòlogues

Cerca de la seqüència genòmica
Cerca de l'estructura gènica
Cerca de la seqüència proteica

5. Cerca de SECIS en les seqüències de les selenoproteïnes predites mitjançant homologia

Cerca de noves Selenoproteïnes en Phytophthora infestans:

1. Cerca de SECIS en tot el genoma

2. Cerca de selenoproteïnes potencials en tot el genoma

Cerca de Selenoproteïnes homòlogues d'Homo sapiens

En la cerca de selenoproteïnes en el genoma de Phytophthora infestans el primer que cal fer és trobar la seqüència genòmica d'aquest organisme. Hem trobat la seqüència en la pàgina web del Broad Institute un centre involucrat amb projectes de recerca de les comunitats científiques de MIT i Hardvard. A partir d'aquí la nostra cerca ha estat basada en les possibilitats que ofereix aquesta pàgina web, tant a nivell de realitzar el BLAST, com altres opcions que hem utilitzat al llarg de la investigació.

A continuació s'explicaran de manera detallada els passos que hem anat seguint al llarg del procés de cerca de selenoproteïnes, ja conegudes en Homo sapiens, en Phytophthora infestans:

Buscar la seqüència protèica de les seleneproteïnes: Hem buscat en la pàgina web del SelenoDB les proteïnes que ens interessen per fer la cerca; en aquest cas hem seleccionat i analitzat tant sols les selenoproteïnes, i maquinària relacionada, de l'espècie Homo sapiens, ja que es tracta l'espècie en la que s'han trobat més selenoproteïnes. El que s'utilitza en la cerca és la seqüència d'aminoàcids.

Realització del BLAST (Basic Local Alignment Search Tool): El següent pas ha estat realitzar el BLAST de les selenoproteïnes contra el genoma a analitzar. Aquest pas l'hem realitzat des de la pàgina web del Broad Institute; on hem cercat la base de dades del nostre organisme i hem seleccionat l'opció: BLAST Search i posteriorment tblastn (Protein query/Nucleotide database). A partir d'aquí hem seleccionat com a base de dades la Phytophthora infestans genomic sequence, i hem introduït la seqüència de la selenoproteïna humana que s'ha de cercar com a query sequence. Per tal de que els resultats obtinguts siguin significatius hem d'introduir alguns paràmetres de cerca (Search Parameters): E-value inferior a 1e-9 i no filter.

Els alineaments proposats en el BLAST del Broad Institute s'han comprovat realitzant un BLAST a través del terminal. Els resultats obtinguts en ambdós han estat comparats i finalment determinats els dos com a bons. Els passos posteriors han estat basats principalment en els resultats del Broad Institute, tot i que s'han anat comprovant amb els resultats del BLAST del terminal, veure taula de resultats.

Elecció dels millors hits: Com a resultat del BLAST, tant del Broad Institute com del terminal, tenim un seguit de hits per a cada una de les selenoproteïnes humanes blastejades. En el nostre cas hem obtingut molts alineaments significatius (considerant significatius valors d'E-value < 1e-10), és per això que hem decidit fer certes restriccions a l'hora de seguir amb l'anàlisi. Quan una selenoproteïna X ha donat alineaments a diferents supercontigs del genoma hem aplicat les següents restriccions: tenint en compte els resultats obtinguts pel BLAST del terminal, escollirem sempre, pel posterior anàlisi, l'alineament amb el valor d'score més alt; i els hits següents els analitzarem només si el seu score és igual o més gran que la meitat de l'score més alt. Les consideracions anteriors només es tindran en compte sempre i quan els hits tingui un E-value < 1e-10.

Aquestes restriccions les hem tingut en compte en tots els hits excepte aquells que corresponguin a alineaments de selenoproteïnes pertanyents a famílies, per exemple la família de les GPx. A partir d'aquest moment ens hem centrat només en l'anàlisi dels hits que hem escollit per a cada selenoproteïna cercada.

Anàlisi de les potencials proteïnes homòlogues: el procés explicat a continuació s'ha realitzat amb tots els hits escollits de cada una de les selenoproteines analitzades:

Exemple del Procediment

Cerca de la seqüència genòmica corresponent als aminoàcids alineats amb el BLAST. Aquest pas l'hem realitzat amb una opció de la pàgina web del Broad Institute, el Browse Regions, on s'introdueixen els valors aconseguits en l'output del BLAST que indiquen la regió nucleotídica corresponent a l'alineament, tot indicant el supercontig on es troba la seqüència on s'ha alineat la selenoproteïna.

Per saber si en la resta de l'anàlisi s'ha d'utilitzar l'strand positiu o el negatiu el que hem fet ha estat utilitzar la pàgina web ExPASy Proteomics Server per traduir la nostra seqüència a aminoàcids. Si la direcció obtinguda és 5'-3' utilitzarem l'strand positiu. En canvi si els aminoàcids resultants que equivalen als de Phytophthora infestans en l'alineament són els que corresponen a la direcció 3'-5' hem escollit l'strand negatiu en el Browse Region i hem utilitzat aquesta seqüència en la resta del procediment.
Cerca de l'estructura gènica. Un cop determinada la regió a estudiar, regió potencialment corresponent al gen que codifica per una proteïna homòloga a la selenoproteïna humana, s'han de buscar els introns. Això es pot dur a terme utilitzant el programa genewise. Aquest programa l'hem utilitzat tant a nivell de pàgina web www.ebi.ac.uk/Wise2/index.html com pel Terminal. Aquesta última opció s'ha executat per obtenir els outputs en format GFF de la següent forma:

$ genewise -gff fitxerproteina.fa fitxergenomic.fa > output.gff

Per poder fer la cerca d'introns i exons, el primer que cal és allargar la seqüència genòmica que hem trobat utilitzant el mateix Browse Region, afegint 1000 nucleòtids a l'inici de la seqüència i 1000 al final. Els resultats obtinguts un cop executat el programa ens indiquen l'inici i el final dels introns, en el cas que n'hagi trobat, de la proteïna en la seqüència genòmica. A partir d'aquí hem eliminat aquestes seqüències intròniques del genoma de Phytophthora infestans i unit els exons per obtenir el cDNA de la proteïna i poder determinar la seqüència aminoacídica final de la proteïna homòloga. A partir d'aquí també hem vist si realment els codons que codifiquen selenocisteïna o cisteïna es troben dins un exó, la qual cosa ens indicaria que estem davant d'una possible selenoproteïna o un homòleg de la humana.

A l'hora d'utilitzar aquest programa s'ha de tenir en compte que té certes limitacions. El genewise utilitza, per trobar l'estructura gènica, la freqüència de codons en Homo sapiens, per tant pot ser que es produeixin errors en les prediccions degut al biaix de codons.
Cerca de la seqüència proteica: un cop hem obtingut part del cDNA de la proteïna, es pot, mitjançant un altre cop l'ExPASy, trobar la metionina d'inici de la proteïna. Després hem comprovat que aquesta metionina correspon a un codó ATG en la seqüència genòmica de l'organisme. Pel mateix procediment hem trobat el codó STOP de finalització.

Després de realitzar aquest procediment tenim com a resultat les seqüències de les diferents proteïnes homòlogues a les selenoproteïnes o proteïnes de la maquinària humanes estudiades.

Per comprovar la seqüència caracteritzada de la proteïna homòloga hem utilitzat una opció de cerca que en sofereix el Broad Institute. Aquesta pàgina ens ofereix la possibilitat de realitzar un tBLASTn amb trasncrits predits d'aquest organisme. Aquests transcrits s'han identificat en diferents institucions mitjançant EST i BLASTs amb altres organismes. Els resultats obtinguts d'aquest procediment ens serveixen tant per confirmar els nostres resultats obtinguts, com per identificar errors. En l'apartat de resultats s'explicarà específicament quina informació adicional ens ha aportat aquest tBLASTn amb els transcrits en cada cas.

Cerca de SECIS en les seqüències de les selenoproteïnes predites mitjançant homologia: El SECISearch és un programa que et mostra possibles SECIS en una seqüència, utilitzant una conjunció de Patscan i RNAfolder. Els SECIS es caracteritzen per tractar-se d'unes estructures tridimensionals a la cadena de nucleòtids i que es troben properes al gen que codifica per a una selenoproteïna. El problema bàsic que tenen els SECIS és que no presenten gaire conservació a nivell de seqüència, però sí a nivell estructural. D'aquesta manera, SECISearch, i basant-se en Patscan, busca certs patrons característics de SECIS a la seqüència que nosaltres introduïm. A continuació determina l'estabilitat que presenten els SECIS predits, limitant el nombre de hits que nosaltres observem.

Un cop hem trobat la seqüència gènica que codifica per a un homòleg de selenoproteïna humana en Phytophthora infestans, realitzem el següent procediment per obtenir els SECIS teòrics:

Allarguem 1000 nucleòtids per banda a partir de la seqüència del gen (que inclou tant el codó de selenocisteïna com el de stop real), i n'estudiem la presencia de SECIS utilitzant totes les opcions de patrons disponibles: default (ATGA), default (GTGA), strict, loose (canonical), i loose (canonical and non-canonical). La resta de camps els deixem igual. Per no ometre possibles candidats, busquem també tots els patrons a la cadena complementària. Aquesta opció es selecciona clicant la opció que hi ha a la dreta dels patrons.

En el cas que s'obtinguin pocs o cap hit, i que aquests siguin poc fiables, anirem allargant cada cop més la seqüència en les dues direccions: 1000 bases més tant upstream com downstream respecte a la seqüència anterior. Per a evitar possibles confusions, crearem un fitxer diferent cada vegada, en el qual determinem l'increment gradual en el nombre de nucleòtids. Quan haguem allargat la seqüència original 5000 nucleòtids per cada banda, donarem per vàlids tots els resultats que obtinguem, ja que un possible SECIS a més distància del gen probablement es tracti d'un fals positiu.

Seguidament, i després d'aconseguir les seqüències dels possibles SECIS, el que farem és buscar-los en la seqüència genòmica i localitzar on es troben respecte a la regió codificant del gen de la selenoproteïna predita. Aquest pas el realitzem per discernir alguns SECIS que donin positiu per estructura, però que la seva posició en el genoma els descarta com a possibles candidats.

Cerca de noves Selenoproteïnes en Phytophthora infestans

1. Cerca d'elements SECIS en tot el genoma: Per a realitzar una cerca general de possibles SECIS en tot el nostre genoma hem de fer una sèrie de passos previs, ja que la seqüència genòmica es massa gran com per analitzar-la tota d'un sol cop.

I. Així doncs, comencem descarregant-nos el fitxer amb tot el genoma des del Broad Institute, o bé el copiem de /disc8/genomes/P.infestans/genome.fa que els professors de l'assignatura ens van facilitar. Tot seguit, hem de fragmentar el genoma en diferents parts. A través del terminal fem anar les comandes 'head' i 'tail' de la següent manera:

$ head -1432091 genoma.fa > part1.fa
$ tail -1432091 genoma.fa > part2.fa

Aquestes comandes ens permeten dividir el genoma en dos fitxers diferents, anomenats part1.fa i part2.fa, tots dos de la mateixa grandària. El que hem fet és dividir el nombre total de línies del fitxer original per la meitat i escriure aquest número després de les comandes 'head' i 'tail'. Aquest pas l'anem realitzant consecutivament, cada cop dividint per dos la grandària del fitxer anterior.

II. Una vegada tenim preparats els fitxers del genoma fragmentat, carreguem cada arxiu al SECISearch. Per limitar el nombre de resultats i que els que obtenim siguin més fiables, apliquem únicament un patró estricte (Strict), enlloc de mirar cada un dels patrons disponibles. El que sí fem és fer dos cerques per a cada fragment: una a la cadena principal i una altra a la cadena complementària. Tot i que només busquem el patró estricte, no volem ometre cap possible resultat en no considerar la cadena complementària de la que introduïm al programa.

De tots els hits que obtinguem en descartarem tots els que presentin un COVE score inferior a 15, quedant-nos únicament amb els més significatius.

Durant la cerca de SECIS ens han sorgit una sèrie de problemes que val la pena mencionar. Després d'haver dividit el nostre genoma en 16 parts iguals i haver començat a analitzar-les a través de SECISearch la pàgina web on es troba el programa va deixar de funcionar. I tot seguit, un cop restablerta, el programa només acceptava seqüències de menys de 100000 nucleòtids. Creiem que consisteix en un límit establert pels propis programadors degut a l'alta afluència d'aquests últims dies. Davant d'aquest handicap, enlloc d'anar dividint els fragments en subseqüències cada cop més petites hem trobat molt més pràctic utilitzar la comanda 'fastasubseq' des del terminal.

$ fastasubseq path.fa start length > output.fa

On path.fa és el fitxer que volem particionar, start és el número del nucleòtid on volem que comenci, i lenght és la llargada de la seqüència. El resultant el redireccionem a un nou fitxer.

III. Com que utilitzant el SECISearch hem obtingut molts hits, hem procedit a utilitzar SECISearch a través del terminal. Aquesta versió diferent del SECISearch ha estat creada per en Charles Chapple a partir del programa original, de manera que es pot fer anar a través de comandes al terminal de Linux. Com que SECISearch utilitza Patscan i RNAFolder, aquests programes s'han d'instal·lar prèviament a l'ordinador on estem treballant. Els clars avantatges que suposa aquest mètode és que els diferents paràmetres són modificables. Així doncs, en els resultats, enlloc de fixar-nos en el COVE score, el qual ens dóna molts falsos positius i falsos negatius, el paràmetre més determinant és l'energia lliure de l'element SECIS predits.

IV. A partir d'aquí, hem agafat una a una les seqüències dels elements SECIS predits i les hem introduït al SECISearch disponible per internet. L'objectiu d'això és obtenir els COVE scores de tots aquests hits, en part per corroborar que es poden prendre com a resultats vàlids i per altra banda poder disposar d'un altre paràmetre restrictiu a l'hora de discernir falsos positius.

V. A partir dels elements SECIS potencials en que hem obtingut un SCORE significatiu (un valor superior a 15), introduïrem la seqüència que ens ha donat el SECISearch dins del genoma. Tot i que en un principi teníem la intenció d'analitzar tots els SECIS potencials obtinguts a partir del programa de SECISearch, al final només ens hem quedat amb els 2 valors d'SCORE més elevats, degut a la manca de temps.

2. Cerca de selenoproteïnes potencials en tot el genoma:

I. Un cop hem obtingut la seqüència dels elements SECIS, hem amplificat fins a 6000 nucleòtids davant de la regió 5'. Això ho hem fet amb la intenció de buscar possibles selenoproteïnes relacionades amb els nostres elements SECIS potencials.

II. Tot seguit hem introduït tots aquests nucleòtids al programa GeneID per tal de que ens fes una predicció dels possibles gens continguts en aquesta regió. Per realitzar el GeneID, hem posat com a organisme similar Plasmodium, ja que igual que el nostre organisme, és un protista.

III. A partir dels resultats obtinguts del GeneID, hem mirat si el gen predit era possible dins de la nostra seqüència genòmica, i en el cas que aquest es trobés en el mateix strand en el que es troba l'element SECIS hi hem buscat un UGA (per poder predir si es podia tractar d'una selenoproteïna). En el cas de trobar-hi un UGA, l'hem valorat segons en quina regió es trobava.

IV. A continuació hem anat al Broad Institute, per veure les proteïnes que aquesta base de dades ha predit de la nostra regió d'interès. Si anem a l'apartat de Find Features i introduïm la nostra regió d'interès, aquest programa ens mostra proteïnes que ha predit mitjançant diferents ESTs, Blastx i geneID, entre d'altres. A partir d'aquestes proteïnes predites, hem escollit aquelles traduïdes a partir de DNA del mateix Strand que el nostre element SECIS i hem buscat si alguna d'elles contenia algun UGA que ens portés a deduir la possible presència d'alguna selenocisteïna.

V. Finalment, a partir de les regions EST que tenim del nostre organisme (també presents en la base de dades del Broad Institute), hem analitzat aquelles regions codificants localitzades en la nostra zona dinterès per trobar-hi, també, UGA.

És important, comentar, que per tal de trobar possibles selenoproteïnes, hauria estat interessant utilitzar altres programes per poder-les deduir. Per exemple l'InterPRO, per tal de buscar dominis en les selenoproteïnes del nostre genoma, i poder-les comparar a partir d'aquesta aplicació.

Torna a l'inici

Resultats i discussió

Resultats de la cerca de proteïnes homòlogues a Selenoproteïnes d'Homo sapiens

A continuació mostrem la nostra taula de resultats. Hem englobat en famílies les selenoproteïnes o homòlogues de selenoproteïnes trobades en humà. Si cliquem en el quadre del costat, es mostra la seq;uuml;ència caracteritzada de les homòlogues a aquestes (tant si es tracta de selenoproteïnes o d'homòlogues) que hem trobat en el nostre organisme Phytosphora Infestans, així com una explicació de perquè hem deduït aquest resultat. Hem diferenciat les nostres proteïnes en:

Selenoproteïnes (indicades a la taula en vermell)
Homòlogues contenint cisteïna (indicades a la taula en taronja)
Homòlogues contenint altres aminoàcids (indicades a la taula en gris)
Homòlogues a la maquinària (indicades en marró)

A la taula també podem veure que les proteïnes humanes que no tenen cap proteïna homòloga en el nostre organisme, les hem deixat de color en blanc. Finalment, per accedir al tBLASTn que hem obtingut de cada família de proteïnes, només és necessari clicar link contingut en el nom de la família.

Taula de Resultats:

Familia Proteica	Proteïnes humanes	Homòlogues
eEFSec	eEFSec	maquinària

	GPx1	no homòloga
	GPx2	cisteïna
	GPx3	no homòloga
	GPx4	cisteïna
GPx		cisteïna
		cisteïna
	GPx5	no homòloga
	GPx6	no homòloga
	GPx7	no homòloga
	GPx8	cisteïna
		cisteïna


	DI1	no homòloga
DI	DI2	no homòloga
	DI3	no homòloga

MsrA	MsrA	cisteïna

SBP2	SBP2	no homòloga

SPS	SPS1	no homòloga
	SPS2	cisteïna

Sel15	Sel15	no homòloga

SelH	SelH	no homòloga

SelI	SelI	cisteïna
		cisteïna

SelK	SelK1	no homòloga

SelM	SelM1	no homòloga

SelN	SelN1	no homòloga

SelO	SelO	cisteïna
		cisteïna

SelP	SelP1	no homòloga

	SelR1	no homòloga
SelR	SelR2	no homòloga
	SelR3	cisteïna

SelS	SelS1	no homòloga

SelT	SelT1	no homòloga


	SelU1	no homòloga
SelU	SelU2	no homòloga
	SelU3	no homòloga

SelV	SelV	no homòloga


	SelW1	no homòloga
SelW	SelW2	no homòloga
	SelW3	no homòloga

	TR1	altres

TR	TR2	selenocisteïna

	TR3	selenocisteïna

Resultats de la cerca de noves Selenoproteïnes

A continuació es mostren dos resultats diferents després d'haver fet una cerca per trobar selenoproteïnes noves:

SECIS Supercontig 1

SECIS Supercontig 29

Aquest PDF conté els resultats dels potencials elements SECIS obtinguts a partir del SECISearch.

Resultat SECIS Search

Torna a l'inici

CONCLUSIONS

Hem enfocat el nostre treball en la cerca de les homòlogues de les selenoproteïnes humanes i de la maquinària implicada en Phytophthora infestans. En aquest apartat farem un anàlisi de les diferents famílies homòlogues de selenoproteïnes humanes i quina informació ens aporten tots aquests resultats obtinguts sobre aquest organisme.

Per realitzar una cerca de selenoproteïnes en el genoma, és important primer de tot, saber si l'organisme presenta algun tipus de maquinària que li pugui permetre la síntesi de selenoproteïnes. És per això que hem buscat homòlegs en el nostre organisme de les dues proteïnes humanes, eEFSec i SBP2, implicades en aquest procés. En comparar-les amb el nostre genoma, només hem obtingut resultats positius en el cas d'eEFSec. Tot i així, això ja indica la possibilitat de que aquest organisme pugui presentar alguna selenoproteïna, tal i com ja esperàvem, ja que gairebé tots els organismes estudiats fins ara presenten alguna selenoproteïna. De totes maneres no descartem la presència d'altres proteïnes pertanyents a la maquinària pròpies de l'organisme o del regne dels protistes.

El resultat més significatiu de la nostra cerca, però, és la caracterització de dues selenoproteïnes homòlogues a la TR1 (Thioredoxin reductase 1) i TR2 humanes en Phytophthora infestans. Tot i que hem classificat les nostres proteïnes segons si s'assembla més a una TR o a l'altre, aquesta diferenciació no és del tot clara. El més probable és que les TR d'humà provinguin d'una sola TR, del mateix ancestre que les de Phytophthora infestans, després en els dos organismes s'han duplicat i han evolucionat de manera diferent. Un cop realitzat l'anàlisi per trobar les seqüències de la proteïna, hem fet la cerca d'elements SECIS per comprovar que realment aquestes eren selenoproteïnes. Tot i que els resultats no han tingut l'score suficient com per determinar-los com a significatius, la resta de resultats obtinguts en l'anàlisi (alineament perfecte de la U amb la C, patró comú amb les TR humanes...) ens porten a pensar que realment es tracta de selenoproteïnes. A més l'estructura dels SECIS, tot i tenir un score baix, són força determinants.

A més de selenoproteïnes també hem trobat una homòloga de TR3. En aquest cas no trobem que sigui una selenoproteïna ni una homòloga amb cisteïna però hem considerat aquests resultats perquè l'alineament del BLAST era molt significatiu. Això pot ser degut a una duplicació d'una de les selenoproteïnes i a la posterior adquisició d'una nova funció.

A part de les dues selenoproteïnes identificades, hem trobat moltes altres proteïnes homòlogues que no presenten selenocisteïna en la seva seqüència d'aminoàcids, sinó que tenen una cisteïna en aquesta posició, en la majoria de casos, o algun altre aminoàcid.

Uns dels resultats que hem trobat més interessants, i que han centrat, en part, la nostra atenció, ha estat la família de les GPx (Glutathione peroxidases). Aquesta família conté 8 proteïnes diferents, en Homo sapiens, que inclouen tant selenoproteïnes com proteïnes sense selenocisteïna. Realitzar l'anàlisi d'aquesta família de proteïnes no ha estat fàcil a causa de la gran quantitat de hits obtinguts en la realització del primer BLAST, ja que cada GPx presentava alineaments significatius en diferents supercontigs, i en una mateixa regió d'un mateix supercontig trobàvem homologies per diferents GPx. L'allau de resultats ha fet que ens prenguéssim l'estudi d'aquesta família amb molt deteniment, per això hem fet una cerca exhaustiva de cada proteïna en cada supercontig, i a partir d'aquí hem extret les conclusions, referides a escollir en cada regió de cada supercontig quina GPx humana n'és més homòloga. Els resultats obtinguts indiquen que Phytophtora infestans presenta proteïnes homòlogues a les GPx4, GPx8 i GPx2 humanes. Hem identificat inicialment tres proteïnes de P. infestans homòlogues a GPx4, després d'obtenir les seqüències d'aminoàcids hem vist que les obtingudes a partir dels supercontigs 56 i 67 són idèntiques. Aquest resultat ens pot portar a dos plantejaments diferents. El primer presentaria la possibilitat que aquestes dues proteïnes fossin resultat d'una duplicació del gen; mentre que la segona explicaria aquest fet per una mala seqüenciació del genoma o per un ensamblatge erroni. Creiem que la segona possibilitat és la més probable ja que ens hem trobat amb altres resultats que evidencien aquest fet, com per exemple els resultats obtinguts en el supercontig 8 .

Tal i com esperàvem, tenint en compte la simplicitat del genoma de P. infestans respecte del de Homo sapiens, hem trobat diferents selenoproteïnes en humans que en aquest organisme són homòlogues amb cisteïna. D'aquesta manera es confirma la hipòtesi que, en general, els organismes més complexes contenen més selenoproteïnes.

A partir de la cerca de potencials elements SECIS dins del nostre genoma, no hem trobat cap selenoproteïna. Això ha sigut degut, per una banda, a la manca de temps, que ha impedit que féssim la cerca amb més de dos elements SECIS potencials. Per altra banda, tot i que els elements que hem analitzat tenien un alt score, no hem aconseguit trobar cap proteïna que tingués un UGA que ens portés a pensar la presència de selenoproteïnes. És per això, que creiem que és important que es segueixen buscant possibles selenoproteïnes en el nostre genoma.

Una altra observació és que hem trobat resultats idèntics, tant pel que fa l'estructura com el valor d'energia lliure, en diferents supercontigs. Això ens torna a portar a la hipòtesi que el genoma està mal ensemblat.

A partir de tota la infromació que hem anat exposant podem concloure que el nostre genoma no està correctament ensemblat i que per tant, no és tan gran com pensàvem en un principi. Segurament la seqüències d'alguns supercontigs se solapen i per això hem trobat alguns resultats repetits durant la recerca. Aquest fet ens porta a suggerir que es necessària la correcta seqüenciació del genoma de Phytophthora infestans per poder fer una bona cerca de selenoproteïnes, o altres investigacions.

Degut a aquest mal ensemblatge la recerca ha estat més difícil de l'esperat, però per altra banda la pàgina web del Broad Institute, on està disponible el genoma de Phytophthora infestans i altra informació sobre l'organisme, ens ha facilitat la feina, sobretot a l'hora de buscar regions concretes del genoma per poder ser estudiades.

Torna a l'inici

Bibliografia

Recursos WEB:

1-SelenoDB
2-Broad Institute
3-GeneWise
4-Exonerate
5-ExPASy
6-SECISearch
7-ClustalW
8-GeneId

Referències:

Castellano S, Morozova N, Morey M, Berry M, Serras F, Corominas M, Guigó R. In silico identification of novel selenoproteins in the Drosophila melanogaster genome. EMBO reports 2, 697-702 (2001).
Liang J, Qiong L, Ping C, ZhongHong G, Xu HuiBi New selenoproteins identified in silico from the genome of Anopheles gambiae. Sci China C Life Sci, 50(2):251-7 (2007).
Mix H,Lobanov A, Gladyshev V. SECIS elements in the coding regions of selenoprotein transcripts are functional in higher eukaryotes Nucleic Acids Res, 414-423 (2007).
Ellis J, Catanzariti A, Dodds P The problem of how fungal and oomycete avirulence proteins enter plant cells. CSIRO-Plant Industry (2006).

Torna a l'inici

Agraïments

Per la seva inestimable col·laboració i totes les hores dedicades, a en Charles.

A la Núria per ajudar-nos en aquells moments en els que no sabíem per on tirar.

A en Roderic per donar-nos l'oportunitat de descobrir les selenoproteïnes.

A tots els nostres companys per fer més amenes totes les hores compartides davant la pantalla.

I a tu, visitant, per dedicar un temps a llegir la nostra pàgina.

Gràcies!

Torna a l'inici

ESTUDI DE SELENOPROTEINES EN Phytophthora infestans

Facultat de Ciències de la Salut i de la Vida Universitat Pompeu Fabra

INFORMACIÓ SOBRE EL GENOMA

Taula de Resultats:

Facultat de Ciències de la Salut i de la Vida
Universitat Pompeu Fabra