Com hem vist en la discussió de
I. multifiliis per SelW
(link), l'anàlisi dels resultats d'aquest organisme és especialment complicat. Degut a que aquest organisme utilitza un codi genètic lleugerament diferent, els resultats inicials tan del blast
(veure) com de l'Exonerate
(veure) i el GeneWise
(veure) es veuen alterats. Per aquesta raó hem canviat les seqüències nucleotídiques d'aquest organisme d'acord amb la seva traducció real.
Un cop corregits els codons, podem analitzar el resultat normalment. El resultat del blast ens donava dos hits, un que alineava de l'aa 68 de la query al 136 i un que alineava del 139 al 218
(veure blast). Com era d'esperar, el GeneWise i l'exonerate ens reporten un sol hit, però amb diferències entre tots dos programes. L'Exonerate
(veure) ens fa aparèixer un intró enmig de la seqüència mentre que el GeneWise considera aquesta seqüència "intrònica" com a codificant
(veure). A més, l'alineament del GeneWise és més llarg, obtenint una proteïna d'uns 180 aa (contra uns 102 de l'Exonerate).
El T-COFFEE d'aquestes dues proteïnes predites presenta un bon score tant per Exonerate
(veure) com per GeneWise
(veure), tot i que alineen una petita part de la query (sobretot l'Exonerate).
Aquesta proteïna de l'NCBI té uns 80 aminoàcids més que la que hem predit nosaltres amb l'Exonerate, i no és exactament idèntica, té un 98% d'identitat. Podem confirmar que la regió que l'Exonerate ens marcava com a intró és realment un intró, ja que la proteïna real de l'NCBI no té els aminoàcids que ens detecta el GeneWise. Vam veure, però, que el GeneWise ens donava un alineament bastant correcte de l'última regió de la query, un alineament que no presentava l'Exonerate. Per intentar cercar la proteïna més similar possible a la real, hem fet una unificació de les proteïnes predites per tots dos programes, agafant la proteïna de l'Exonerate fins que finalitza l'alineament i afegint la regió final extreta del GeneWise. El resultat és una proteïna que té la seqüència seguent:
>Proteïna unificada Ichthyophthirius multifiliis:
TFGGGCFWCLHAIFKRVKGVINVKSGYSSGQVKNPTYKEICTGTTGHAEVVQIEFDIQKILYENILDIFF
HIHDPTQSNRQGNDIGTQYRSTILYRNQQQKEISEKILNQQPNKDKTTTEIKQFEEFYEAEEYHQDYYDQNTEQGYC
Quan fem córrer el BLASTp amb aquesta proteïna, obtenim el mateix hit anterior però amb un score molt més alt i un alineament gairebé perfecte (97% de identitat)
(veure). La proteïna real té alguns canvis aminoacídics respecte la nostra, i a més, té uns 10 aa més a l'inici i uns 19 aa més al final. No sabem del cert si els aminoàcids canviats entre la proteïna predita i la real així com aquests aminoàcids que manquen són diferències reals entre
I.multifiliis i
I.multifiliis strain G5, deficiències dels programes o errors nostres a l'hora de canviar les seqüències del fastasubseq. El més probable és que els canvis simples d'aminoàcids s'hagin donat per evolució divergent, mentre que la pèrdua d'aminoàcids a l'inici i al final de la proteïna predita sigui conseqüència de l'ús dels programes (com hem vist en altres resultats).
En resum, després de realitzar els canvis corresponents i obtenir uns resultats més ajustats a la realitat, creiem que és possible que existeixi un homòleg de MsrA en I.multifiliis strain G5 amb una cisteïna enlloc de la selenocisteïna.
Tornar a dalt »