busquEM!

Resultados



Los resultados que obtiene el programa se representan por tres vías: el canal de error, el archivo de texto y el archivo html.
En ésta página se explican dichas vías con ejemplos resultantes de análisis de diferentes secuencias.

Una vez que se introducen los parametros para que se ejecute el programa, el canal de error informa de las operaciones que se están realizando.
  1.  Inicializando. Comienzo del programa.
  2.  Vuelta X. Número de iteración.
    1.  Iniciando E. Comienzo del paso Expectation.
    2.  Iniciando M. Comienzo del paso Maximization.
  3.  EL PROGRAMA HA FINALIZADO POR.... La causa de la finalización.
  4.  Número de ocurrencias del patrón en las secuencias: . Número de candidatos con score mayor al umbral de calidad.
El programa crea paralelamente a su ejecución un archivo de texto (outfile.txt) en la misma carpeta con información adicional.
  1.  El nombre del archivo analizado, la longitud del motivo, el umbral seleccionado y el número de secuencias en el archivo.
  2.  El número de subsecuencias en cada secuencia y las subsecuencias elegidas al azar para la primera matriz de pesos.
  3.  Las matrices de pesos iniciales absolutas y relativas para el motivo (M) y el background (B).
  4.  Por cada iteración; el número de vuelta, la suma de scores de las subsecuencias y la matriz M normalizada.
  5.  Al final del archivo, informa del número de iteraciones realizadas en total, la suma de scores en la última iteración y la lista de subsecuencias con score mayor al umbral. En cada una de éstas:
    1.  La secuencia en la que se encuentra el candidato.
    2.  Las posiciones de inicio y final del candidato en la secuencia.
    3.  La secuencia del candidato.
    4.  Score del candidato relativizado con el score máximo posible.



    Archivo HTML (outfile.html)
El programa también crea un archivo de html (outfile.html) en la misma carpeta con información gráfica.
  1.  El número de secuencias en el archivo, el nombre de cada secuencia, la longitud del motivo, la calidad de la búsqueda, la causa de la finalización, el número de vueltas y la suma de scores de la última vuelta.

  2. Secuencias utilizadas:

          
        Secuencia 1:>1
        Secuencia 2:>2

        La longitud del motivo seleccionado es: 2

        La calidad seleccionada es: 90%

        EL PROGRAMA HA FINALIZADO POR CONVERGENCIA DE LOS RESULTADOS

        El numero de vueltas realizadas es: 21

        Suma de los scores en ultima vuelta: 58.631


      •  La matriz M final y la matriz B.

      • MATRIZ M
        Pos.123456
        A0.258 0.252 0.198 0.399 0.292 0.336
        C0.247 0.290 0.202 0.195 0.245 0.288
        G0.254 0.223 0.173 0.135 0.179 0.127
        T0.241 0.235 0.427 0.271 0.283 0.249


        MATRIZ B
        A0.271
        C0.167
        G0.229
        T0.333

      •  Representación gráfica de las subsecuencias candidato y su ubicación en las secuencias.

      • Secuencia 6
                                                                                                              
        1-  G  G  A  T  T  A  C  C  A  G  T  A  A  G 
                  8  
                              9