Universidade Estadual de Campinas
Instituto de Computação
MO640 – Biologia Computacional Prof. Dr. João Meidanis
Discente: Pedro Henrique Del Bianco Hokama RA:063658
Ata de aula – 26/08/2008 - Sobre a aula de 21/08/2008


1. Crie uma planilha eletrônica que construa a matriz necessária para calcular a similaridade local entre duas seqüências S e T.

Veja a planilha em anexo:
Planilha Eletrônica (.ods)
Planilha Eletrônica (.xls)


2. Calcule a similaridade local entre as seqüências: AGTCGTGAC e CGTAGTCCGTGAT. Use pontuação match=1, mismatch=0, gap=-2. Faça primeiro na mão e depois confira com a sua planilha.

A similaridade local obtida pelo calculo manual dos alunos foi 6, o mesmo obtido pela planilha eletrônica, veja a figura abaixo



3. Crie uma planilha eletrônica que construa a matriz necessária para calcular a similaridade semi-global entre duas seqüências S e T.

Veja a planilha em anexo:
Planilha Eletrônica (.ods)
Planilha Eletrônica (.xls)


4. Calcule a similaridade semi-global, sem cobrar por espaços nas extremidades, entre as seqüências: AGTCGTGAC e CGTAGTCCGTGAT. Use pontuação match=1, mismatch=0, gap=-2. Faça primeiro na mão e depois confira com a sua planilha.

A similaridade semi-global obtida pelo cálculo manual foi 6, o mesmo obtido pela planilha eletrônica, veja a figura abaixo



5. Notamos que as similaridades entre as seqüências AGTCGTGAC e CGTAGTCCGTGAT obedecem: global ≤ pontas livres ≤ local. Isto vai se verificar para todo par de seqüências? Por que?

A afirmação de que a similaridade global ≤ pontas livres ≤ local é verdadeira, mas apenas com a condição de que gap ≤ 0.
Prova:
Sejam sim-gbl(S,T), sim-sgbl(S,T) e sim-lcl(S,T), o valor da similaridade global, semi-global e local, respectivamente, entre duas seqüências S e T.

Estas similaridades correspondem a pontuações de alinhamerntos ótimos. Para determinar as similaridades global e semi-global, usamos alinhamentos que cobrem as seqüências em sua totalidade, tanto S como T. O que difere é a maneira de pontuar. Existe a pontuação global, pont-gbl, e existem várias versões semi-globais, que não cobram por espaços em algumas das extremidades. Aqui consideraremos a pontuação que não cobra por espaços em nenhuma extremidade, que chamaremos de pont-sgbl, mas o mesmo raciocínio se aplica a todas as outras versões.

Alinhamentos locais são diferentes. Eles não necessariamente envolvem as seqüências inteiras, ao contrário dos alinhamentos globais e semi-globais, mas restringem-se a trechos contínuos das seqüências comparadas. A maneira de pontuar alinhamentos é a mesma usada para os alinhamentos globais, ou seja, pont-gbl.
Sejam A, A' e A'' respectivamente alinhamentos ótimos global, semi-global e local. Temos que:

sim-gbl(S,T) = pont-gbl(A),
sim-sgbl(S,T) = pont-sgbl(A'),
sim-loc(S,T) = pont-gbl(A'').
Os alinhamentos A e A' são do mesmo tipo, ou seja, envolvendo as seqüências inteiras, portanto podemos pontuá-los com pont-gbl ou com pont-sgbl, e sabemos que:
pont-sgbl(A) ≤ pont-sgbl(A'), e
pont-gbl(A') ≤ pont-gbl(A),
pois A e A' são ótimos para as respectivas pontuações. Porém, também podemos dizer que, em virtude de gaps serem sempre pontuados com valores negativos ou nulos, para qualquer alinhamento B vale:
pont-gbl(B) ≤ pont-sgbl(B).
uma vez que pont-sgbl não penaliza por espaços nas pontas.

Juntando algumas das observações acima, temos:
sim-gbl(S,T) = pont-gbl(A) ≤ pont-sgbl(A) ≤ pont-sgbl(A') = sim-sgbl(S,T).
Fica assim provada a parte "global ≤ pontas livres" da afirmação. Vamos provar agora a parte "pontas livres ≤ local".
Observe que se retiramos as extremidades não pontuadas de A', ficamos com um alinhamento local A''' que satisfaz:
pont-sgbl(A') = pont-gbl(A''').
Sendo assim, temos:
sim-sgbl(S,T) = pont-sgbl(A') = pont-gbl(A''') ≤ pont-gbl(A'') = sim-lcl(S,T).
Note que nesta parte não precisamos supor nada sobre a pontuação de gaps. Com isso concluimos a prova.