Material i mètodes
DESCRIPCIÓ:
El nostre programa, com hem comentat a la Introducció, permet trobar les seqüències que contenen SNPs humans a partir de l'identificador "rs" anant-lo a buscar al NCBI dbSNP.
Quan vam començar a dissenyar el programa, el primer punt que vam haver d'aclarir va ser el de com accedir a la base de dades de NCBI des del nostre programa.
Inicialment vam pensar en utilitzar mòduls d' ENSEMBL o BioPerl però finalment vam optar per adaptar el mòdul LWP per poder accedir a NCBI dbSNP. Sota les restriccions del mòdul, l'hem dissenyat per tal que es puguin introduir un màxim de 90 identificadors (per sota dels 100 que aconsellen per màxim).
ESTRUCTURA DEL PROGRAMA:
- - Control de dades:
- La primera part del nostre programa consisteix en controlar les dades que introduïm, que són els identificadors "rs" separats per comes i el nombre de nucleòtids que volem flanquejant l'SNP.
En el cas que els identificadors no estiguin en el format demanat, o siguin més de 90 ens retorna un missatge d'error.
Pel que fa al nombre de nucleòtids flanquejant, hem utilitzat una expressió regular. Si no introduïm un nombre sencer, ens retorna un missatge d'error en el que ens informa que necessitem un nombre sencer.
- - Recuperació de la informació desitjada a dbSNP i presentació a la web:
- Gràcies a les adaptacions que hem fet del mòdul LWP podem fer dues crides a dbSNP.
La primera és una crida més reduïda (funció minicrida) i serveix per saber si l'SNP està a la base de dades. En cas que no hi sigui, ens mostra un missatge avisant-nos, i en cas que hi estigui continuem amb el programa usant les quatre funcions restants que hem creat.
La segona crida (funció crida) a NCBI ens retorna, entre altres coses, diferents seqüències on s'inclou l'SNP i que corresponen a les diferents actualitzacions que s'han fet del genoma humà variant en la longitut.
Recorrent, per a cada "rs", totes les línies recupera la informació que ens interessa: l'identificador, l'espècie i la seqüència forward i reverse més llarga (funció max) que flanqueja l'SNP desant-la en un "hash" que hem anomenat "minihash". Aquests "minihash" els hem anidat en un altre hash (que hem anomenat "maxihash") que inclourà la informació seleccionada de cada "rs".
La última funció (funció pagweb) s'encarrega de seleccionar la longitut demanada (funció mostratallat) per a mostrar-la i recuperar tota la informació guardada en el "minihash".
En el cas que l'usuari hagi demanat una longitut que supera la disponible, ens mostrarà la longitut màxima i ens presenta un missatge que ens diu que l'anotació de NCBI no disposa de tants nucleòtids.
Tornar a dalt