Introducción | Programa | Discusión | Bibliografía | Acerca de nosotras |
PROGRAMA EM
Si no sabes exactamente en que consiste el algoritmo EM y cuáles son sus posibilidades te recomendamos que primero leas la sección "para saber más"
Instrucciones:
|
Expectation Maximization (EM) algorithm es usado para estimar motivos consenso en un set de secuencias dado, basándose en un modelo probabilístico en el que diferenciamos dos componentes:
Consta básicamente de tres pasos:
Una vez realizados estos tres pasos se repiten los pasos E y M.
El algoritmo se detiene cuando se produce convergencia de los resultados, es decir, cuando tras múltiples iteraciones de los pasos E y M, la calidad no mejora. Esto se realizará mediante un sencillo cálculo que compare la matriz de scores de cada iteración con la de la iteración anterior.
Otro sistema de parar el algoritmo es poner un límite máximo de iteraciones, de modo que cuando llegue a tal límite se detenga. Normalmente se combinan ambos sistemas de forma que se detenga cuando se produzca uno de los dos.
Este es el esquema básico del EM Algorithm, si aún tienes más interés y quieres saber como nuestro programa resuelve cada punto solo tienes que acceder al mismo, donde encontrarás notas explicativas de los pasos que sa van ejecutando.
Aquí dispones de uno de los archivos que tu mismo puedes utilizar como prueba para ejecutar el programa y del cual hemos extraído los ejemplos que mostramos a continuación. Para encontrar todas las secuencias que necesites acude a la sección de bibliografía donde encontrarás links interesantes.
Este es un ejemplo de la tabla de resultados con los candidatos de mayor puntuación de cada secuencia para motivos de 4 y 7 nucleótidos respectivamente obtenidos con un valor de convergencia de 0'01. La columna posición corresponde a la posición del primer nucleótido del motivo teniendo en cuenta que empezamos a contar desde el nucleótido 0 de la secuencia correspondiente. También encontramos las matrices de scores correspondientes donde nos muestra el score asociado a cada nucleótido según la posición que ocupa en el motivo, de esta tabla hay que destacar que a veces aparecen nucleótidos con puntuaciónes positivas que no están respresentados en los motivos, esto se debe a que en la tabla sólo aparecen aquellos que tienen la puntuación máxima en cada secuencia, es decir que es posible que aparezcan en motivos cuya puntación es menor. Por último se muestra un ejemplo de la representaci&avute;n gráfica obtenida. En el recuadro de color aparecen los motivos obtenidos en cada secuencia flanqueados por las 15 posiciones anteriores y posteriores, el número que aparece sobre cada secuencia corresponde a la posici&oacut;n -15 respecto del inicio del motivo. |
Resultados obtenidos para un motivo de 4 nucleótidos. |
Resultados obtenidos para un motivo de 7 nucleótidos. |
Los pasos a seguir para ejecutar el programa en tu propio ordenador son los siguientes;
Cuando ejecutes el programa una vez te lo hayas bajado, verás aparecer una serie de mensajes a través de tu pantalla desde el terminal: