Un cop ja es coneixen quines són les millors prediccions, el següent pas és saber amb quines proteïnes s'està treballant, identificar-les. Per fer-ho utilitzarem el programa BLASTP que compara la seqüència d'aminoàcids de la proteïna deduïda amb bases de dades que contenen proteïnes conegudes(concretament la base de dades nr o non-redundant).
D'aquesta manera, si hi ha una proteïna a la base de dades que presenta una alta homologia amb la que s'està estudiant es deduirà que es tracta d'aquella o d'una molt semblant a aquella (pot pertànyer a la mateixa família). Cal també fer un cop d'ull a l'e-value ( probabilitat d'obtenir aquells resultats per atzar ) i l'score ( puntuació de l'alineament ) perquè amb ells es podrà estimar la qualitat de la identificació.
Finalment, és interessant mirar atentament els resultats obtinguts del BLASTP perquè podem detectar la presència de dominis conservats i que a més a més podem confirmar amb els gràfics obtinguts de la cerca a bases de dades de dominis.
Els resultats obtinguts per a cada una de les subseqüències els trobareu a l'apartat de resultats.