ATA MO640 - Biologia Computacional Prof: João Meidanis Autor: Rajiv Andrade :::Exercício resolvido em sala de aula no dia 30/09/2008::: 1) Sequências no formato [id (Tamanho) (s:normal / r:complemento reverso) Sequência de bases ]: Nota: a sequência com id = 2*i + 1 é o complemento reverso da sequência cujo id = 2*i, para i de 0 a 7. 000 (19) (s): ATCCGTTGAAGCCGCGGGC 001 (19) (r): GCCCGCGGCTTCAACGGAT 002 (11) (s): TTAACTCGAGG 003 (11) (r): CCTCGAGTTAA 004 (14) (s): TTAAGTACTGCCCG 005 (14) (r): CGGGCAGTACTTAA 006 (12) (s): ATCTGTGTCGGG 007 (12) (r): CCCGACACAGAT 008 (14) (s): CGACTCCCGACACA 009 (14) (r): TGTGTCGGGAGTCG 010 (20) (s): CACAGATCCGTTGAAGCCGC 011 (20) (r): GCGGCTTCAACGGATCTGTG 012 (13) (s): CTCGAGTTAAGTA 013 (13) (r): TACTTAACTCGAG 014 (14) (s): CGCGGGCAGTACTT 015 (14) (r): AAGTACTGCCCGCG Como resultado do algoritmo do Aluno Victor, obteve-se 330 overlaps, entretanto vários estavam contidos dentro de overlaps maiores. Após remoção dos contidos com 'regular expressions', e considerando que se duas seqüências exibem overlap seus complementos reversos também exibirão, de forma que basta manter um dos alinhamentos nestes casos, obtivemos os seguintes overlaps: Sequência 000: ATCCGTTGAAGCCGCGGGC Sequência 005: CGGGCAGTACTTAA Sequência 000: ATCCGTTGAAGCCGCGGGC Sequência 010: CACAGATCCGTTGAAGCCGC Sequência 000: ATCCGTTGAAGCCGCGGGC Sequência 014: CGCGGGCAGTACTT Sequência 002: TTAACTCGAGG Sequência 012: CTCGAGTTAAGTA Sequência 002: TTAACTCGAGG Sequência 013: TACTTAACTCGAG Sequência 004: TTAAGTACTGCCCG Sequência 012: CTCGAGTTAAGTA Sequência 004: TTAAGTACTGCCCG Sequência 015: AAGTACTGCCCGCG Sequência 006: ATCTGTGTCGGG Sequência 009: TGTGTCGGGAGTCG Sequência 006: ATCTGTGTCGGG Sequência 011: GCGGCTTCAACGGATCTGTG Sequência 012: CTCGAGTTAAGTA Sequência 015: AAGTACTGCCCGCG 2) Montagem do contig utilizando os overlaps: 008 - CGACTCCCGACACA 007 - CCCGACACAGAT 010 - CACAGATCCGTTGAAGCCGC 000 - ATCCGTTGAAGCCGCGGGC 014 - CGCGGGCAGTACTT 005 - CGGGCAGTACTTAA 013 - TACTTAACTCGAG 003 - TTAACTCGAGG CON - CGACTCCCGACACAGATCCGTTGAAGCCGCGGGCAGTACTTAACTCGAGG Tamanho do contig: 49