En la cerca de la selenoproteïna MsrA en
G. niphandrodes, el tBLASTn
(veure) amb la query d'
Homo sapiens (homòleg amb Cys de MsrA) ens ha reportat 7 hits dels quals només un és estadísticament significatiu (e-value 5e-22). En realitat es tracta de dos hits situats en el mateix contig però no superposats. El hit 1 alinea la cisteïna de la query amb una cisteïna, mentre que el hit 2 no alinea la cisteïna.
El resultat de l'Exonerate ens dóna dues proteïnes amb la regió final gairebé idèntica, tot i que la corresponent al hit 1
(veure exonerate hit 1) és més llarga (alinea des del aa 73 mentre que el hit 2,
(veure exonerate hit 2) des de l'aa 111). Seguint l'anàlisi amb el GeneWise
(veure genewise), en canvi, només obtenim una única proteïna resultant d'uns 27 aminoàcids encara més llarga que la del hit 1 predita amb l'Exonerate.
Per resoldre aquests resultats tant estranys, hem mirat a la seqüència nucleotídica
(veure fastasubseq) i ens hem adonat que la seqüència corresponent a la segona part de la proteïna predita al hit 1 estava duplicada (regió marró). És per això, que tant amb el tBLASTn com amb l'Exonerate obtenim alineament i seqüència proteica, respectivament, de la proteïna complerta, incloent la cisteïna, (hit 1) i de la regió final duplicada, sense la cisteïna, que es troba anterior al hit 1 (hit 2).
Degut a que els resultats de l'exonerate ens predien una proteïna “sencera” (hit1) i una proteïna igual que la segona part del hit1, en un inici vam pensar que es tractava d'una duplicació de només aquesta seqüència nucleotídica. Per intentar confirmar la hipòtesi vam fer un alineament de la seqüència nucleotídica de tot el hit 1 amb la mateixa regió del hit 2 que no estava inclosa en l'Exonerate (color verd en el fastasubseq). El que vam veure és que la seqüència de la part inicial del hit1 també està altament conservada en la regió del hit2. Aquest alineament l'hem fet a través del ClustalW que es troba online a la pàgina de l'
European Bioinformatics Institute, i dóna el següent
resultat.
A més, hem agafat tota la regió del hit 2 que correspondria a la proteïna predita amb el hit 1 (en verd al subseq) i l'hem traduït amb el fastatranslate. El resultat és una hipotètica proteïna del hit 2 que tindria la seqüencia següent:
>Hit 2 traduït
LLWLTGDLQELEGCGRVCVVGCCGGVAGVVSTYETVDDTDHAEMVHIVYDDDLISLDQ
LFDAFFLVHDPTQLDRQGEDQGRQYRSAIFVHNAKDLQTAQDAIGRAKKLWEVEG
Per veure en què varia aquesta proteïna amb la predita del hit1 fem un T-COFFEE entre les dues
(veure T-COFFE). El que veiem és que a partir del lloc on es veu la inserció de dos nucleòtids en el clustal (que correspondria amb l'alineament V-E del T-COFFEE), la seqüència d'aminoàcids canvia molt més que en la resta de la regió, tot i que els canvis no es manifesten en la seqüència nucleotídica. Aquest resultat por explicar-se degut a que en el hit 2 trobem dos nucleòtids més que fan variar la pauta de lectura de la seqüencia, traduïnt aminoàcids diferents als obtinguts anteriorment.
Després de pensar diverses teories que sempre acabaven essent refutades, creiem que la hipòtesi més factible seria que la regió duplicada no sigui exactament la que ens dóna l'exonerate del hit 2, sinó que el fragment duplicat és més llarg i arriba fins pràcticament el codó que codifica per la cisteïna homòloga a la selenocisteïna. Com que no s'ha duplicat exactament tota la regió corresponent al hit 1, els programes de predicció que utilitzem no han tingut en compte la similitud d'aminoàcids anterior al hit mostrat.
A més, creiem que aquesta proteïna no deu ser funcional, ja que la regió duplicada no conté la cisteïna necessària per realitzar la funció de reducció (en groc al subseq). Tot i així, hauríem de seguir analitzant altres resultats i utilitzant altres programes per poder determinar exactament quan s'ha produït la duplicació (sembla que és recent ja que les seqüències nucleotídiques són gairebé exactes) o si s'ha produït algun error en el procés que ha fet aparèixer aquesta seqüència al fastasubseq.
En resum, els nostres resultats mostren la possibilitat que existeixi un homòleg de MsrA amb cisteïna en el genoma de G. niphandrodes.
Tornar a dalt »