Equus Przewalskii


CONCLUSIONS


Aquest estudi té com a objectiu l'anotació de les selenoproteïnes presents en el genoma d'Equus przewalskii a partir de recursos bioinformàtics. La base d'aquesta aproximació recau en l'alt grau d'homologia entre les diferents famílies de selenoproteïnes d'eucariotes. Així doncs, a partir de les selenoproteïnes anotades en espècies properes es poden identificar selenoproteïnes en organimes per als quals encara no han estat anotades.

En aquest anàlisi s'han utilitzat com a referència les selenoproteïnes anotades en Equus caballus, molt proper evolutivament a Equus przewalskii, i Homo sapiens, ja que en general les proteïnes d'humà presenten una millor anotació.

S'han pogut caracteritzar 19 selenoproteïnes, 12 homòlegs amb cisteïna i 8 proteïnes que formen part de la maquinària de síntesi de selenoproteïnes. Les selenoproteïnes identificades són: DI1, DI2, GPx1, GPx2, GPx3, GPx6, GPx none1, Sel15, SelH, SelI, SelK, SelM, SelN, SelO1, Sel P, SelR1, SelT, TR2, TR3. Pel que fa als homòlegs amb cisteïna, hem pogut identificar: GPx5, GPx7, GPx8, GPx none2, MsrA, SelO2, SelO3, SelR2, SelR3, SelU1, SelU2, SelW2. La maquinària es troba força conservada, com es pot esperar degut a la importància biològica d'aquesta. En el genoma d'Equus przewalskiiz es pot trobar eEFSec, SBP1, SBP2, SECp43 1, SECp43 2, Sec S, pstk i SPS 1.


Pel que fa a la presència d'elements SECIS en alguns casos s'ha trobat homòlegs amb cisteïna que mantenien l'element SECIS, com GPx8 i SelU1. En altres casos, per algunes selenoproteïnes no s'ha pogut predir element SECIS (DI2, SelH, SelI, SelR1).

En algunes ocasions les proteïnes no s'han pogut identificar degut a la seqüenciació incompleta del genoma, com és el cas de DI3. Per tant, en aquest cas no es descarta la possibilitat que aquesta proteïna estigui present en realitat en el genoma d'Equus przewalskii. D'altres no s'han pogut predir amb certesa ja que es tractava de seqüències incompletes (SelS) o amb un poder estadístic dels resultats del BLAST molt baix (Sel W1).

A més, s'ha vist que per TR1, malgrat obtenir una predicció pràcticament completa de la proteïna no s'ha pogut determinar si es tracta d'una selenocisteïna o d'un homòleg amb cisteïna ja que mitjançant queries de diferents espècies i diferents metodologies s'ha obtingut sempre una proteïna truncada abans dels últims aminoàcids entre els que es troba la selenocisteïna en les altres espècies. Un cas similar és el de Sel P, en que el fet d'obtenir un alineament ambigu en un motiu UCU no permet saber amb certesa si es tracta d'un homòleg amb selenocisteïna o d'una selenoproteïna.


Cal mencionar també el cas de SelW, en que en Equus przewalskii s'ha pogut identificar l'homòleg amb cisteïna SelW2 d'humans que no es troba present en Equus caballuts, fet que resulta sorprenent.


El fet que, en el cas de les famílies de proteïnes, les filogènies coincideixin amb la predicció feta corrobora que l'assignació de cada hit segons els criteris establerts s'ha realitzat correctament.


El procediment utilitzat presenta algunes limitacions. En primer lloc, al tractar-se d'anàlisis que es basen únicament en l'homologia amb selenoproteïnes en altres espècies, no es podran identificar noves selenoproteïnes. és per això que el selenoproteoma descrit no és complet, ja que, a banda d'aquelles proteïnes que degut a diversos obstacles en el procés no s'han pogut predir correctament, podem tenir selenoproteïnes que encara no han estat descrites. A més, degut a les restriccions aplicades a l'hora d'escollir els hits, per a que el poder estadístic d'aquests fos significatiu, es perden aquelles selenoproteïnes que han divergit per damunt d'un cert llindar.

Una altra limitació és que requereix d'informació genòmica ben anotada de l'espècie analitzada, fet que com hem pogut comprovar, en alguns casos no és possible. També requereix de bases de dades de proteïnes sòlides i ben anotades que incloguin diverses espècies. En aquest sentit, en el nostre estudi això no ha suposat un gran problema ja que s'ha pogut comparar amb una espècie molt propera que és Equus caballus, encara que en alguns casos les proteïnes no estaven ben anotades ja que, per exemple, no començaven per metionina. En aquests casos s'ha pogut utilitzar proteïnes d'humans per tenir major certesa de l'anotació de la proteïna. Malgrat tot, creiem que és necessari un esforç major en l'anotació experimental de selenoproteïnes.


Per acabar, cal remarcar la importància que les eines de la bioinformàtica en l'anàlisi de seqüències, ja que ens permeten analitzar una gran quantitat d'informació mitjançant mètodes relativament senzills. En aquest cas, el treball realitzat ens ha proporcionat una visió global de com la informàtica s'aplica a l'estudi de problemes biològics i ens ha permès aproximar-nos al procediment d'obtenció de dades, programació i interpretació de la informació extreta.