Blastx
Vamos usar uma sequência DNA codificadora para fazer a busca em um banco de dados usando o programa blastx. O programa blastx faz a tradução da sequência query usando as seis fazes de leituras possiveis (3 foward e 3 reverse) e depois essas 6 proteínas produzidas são usadas na busca por proteínas similares. Por tráz desse processo quem faz a busca é o programa blastp.
Esse programa é muito utilizado para ajudar na busca da funçao da proteína codificada pelo gene. Como as protínas são mais conservadas do que os genes, fazer a busca usando sequências de proteínas torna a busca mais sensível, facilitando encontrar proteínas similares que estão codificas no DNA ao invés de fazer a busca usando somente a seqûencia de DNA contra um banco de DNA, sem nenhum tipo de tradução da informação codificada. Se a busca for somente por função da proteína codificada por um DNA é recomendavel fazer sempre esse tipo de busca para aumantar a sensibilidade.
Lista de códigos genéticos disponíveis no BLAST – Genetic codes
Standard (1)
Vertebrate Mitochondrial (2)
Yeast Mitochondrial (3)
Mold Mitochondrial; … (4)
Invertebrate Mitochondrial (5)
Ciliate Nuclear; … (6)
Echinoderm Mitochondrial (9)
Euplotid Nuclear (10)
Bacteria and Archaea (11)
Alternative Yeast Nuclear (12)
Ascidian Mitochondrial (13)
Flatworm Mitochondrial (14)
Blepharisma Macronuclear (15)
Onde está o frameshift na sequência abaixo?
>coding_DNA
AGAAGAAGACATAGTAATTAGATCTGAAAATTTTACGAACAATGCTAAAACCATAATAGTACAGCTGAAGGAATCTATAAAAATTAATTGTACAAGACCCAACAACAATACAAGAAAAAGTATACCTATAGCAACGGGGGGAGCAATTTATGCAACAGGAGACATAATAGGAGATATAAGACAAGCACATTGTAACCTTAGTAGAGACCAATGGGATAACACTTTAAGCCAGCTAGTTACAAAACTAAGAGAACAATTTGGGAATAAACAATAGCCTTTAATCAATCCTCAGGAGGGGACCCAGAAATTGTAATGCACAGTTTTAATTGTGGAGGAGAATTTTTCTACTGTAATACAACACAGCTGTTTAATAGTACTTGGCCAACTAATAAAAAGTCTACTAACAAAACAGGAACTATCACACTCCCGTGCAGAATAAAACAAATTATAAACAGGTGGCAAGAAGTAGGAAAAGCAATGTATGCCCCTCCCATCAAGGGACAAATTAGATGTTCATCAAATATTACAGGGATATTCTTAACAAGAGATGGTGGTAACGCAAGCGATGAGACCGAGACCTTCAGACCTGGAGGAGGAAATA
Figura 1.
Figura2.
Figura 3.
Figura 4.
Figura 5.
Vamos verificar esse frameshift.
Primeiro vamos acessar a proteína mais similar do resultado da nossa busca usando o blastx. Agora vamos buscar a informaçao do DBSOURCE: AY077231.1. Esse código é a sequência de DNA que codifica a proteína mais similar a proteína traduzida da nossa query. Vamos alinhar a nossa query como DNA com o DNA codificador da proteína mais similar a nossa.
Vamos usar uma outra ferramenta, o bl2seq.
Colem a sequencia query no primeiro espaço
Colem o ID AY077231.1 no segundo espaço
Vejam o resultado do bl2seq
Encontrem onde está o frameshift na sequencia abaixo.
>coding_DNA2
ATGAGAGTGAAGGAGAAATATCAGCACTTGTGGAGATGGGGCACCATGCTCCTTGGGTTGTTGATGATCCGTAGTGCTGCAGACCAATTGTGGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAAGCAACCACCACTCCATTTTGTGCATCAGATGCTAAAGCATATGATACAGAGGTACATAATGTTTGGGCCACACACGCCTGTGTACCCACAGACCCCAACCCACAAGAAGTAGTATTGGCAAATGTGGCAGAAAATTTTAACATGTGGGATAATAACATGGTAGAACAGATGCATGAGGATATAATCAGTTTATGGGATCAAAGCCTAAAGCCATGTGTTAAATTAACCCCACTCTGTGTTACTTTAAACTGCACTGATAAGATTAATAATACCAAAACTACTCCTAATAATACCAGTACTACTCCCCCTACCACTGTTACTCCTACTAGTAATAGCAGCATGACAGGAGAAGGAGAAATAAAAAACTGCTCTTTCAATATCACCACAGCCATAAGAGATAAGGTGCAGAGAGGATATGCATTGTTTAGTAAACTTTGATATAGTACCAATAGATAATGATAGAAATGATAGTACCAGCTATAGGTTGCTAAGTTGTAACACCTCAGTCATTACACAAGCCTGTCCAAAGGTATCCTTTGAACCAATTCCCATACATTATTGTGCCCCAGCTGGTTTTGCGATTCTAAAGTGTAACAATAAGACGTTCAGTGGAACAGGACCCTGTACAAATGTCAGCACAGTACAATGTACACATGGAATTAGGCCAATAGTATCAACTCAACTGCTGTTAAATGGCAGTCTAGCAGAAGAAGGGATAGTAATTAGATATGAAAATATCACAGACAATGCTAAAAGCATAATAATACAGCTGAATGAAACTGTACAAATTAATTGTACAAGACCCAACAATAATACAAGGAAAAGTATACCTATAGGACCAGGAAGAGCATTTTATGCAACAGGAGATATAATAGGAGATATAAGAAAAGCATATTGTAACATTAGTGGAGCAAAATGGAATAACACTTTAAAAAGGATAGCTTACAAATTAAAAGAACAATTTCCTAATAAAACAATAGTCTTTAAGCCCTCCTCAGGAGGGGACCCAGAAATTGTAATGCACAGTTTTAATTGTAGAGGGGAATTTTTCTACTGTAATACAACAAAACTGTTTGATAGTAGTTGGGATAATACTAATTTGAATAAAACTTGGAATAATACCTGGAATAAAAATAACTCTATCATACTTCCATGCAGAATAAAACAAATCATAAACATGTGGCAGGAAGTAGGAAAAGCAATGTATGCCCCTCCCATCGAAGGACCACTTTACTGTTTATCAAATATTACAGGGCTAATTTTAACAAGAGATGGTGGGAACGAAACTGATGGGAACAACACTGATGGGAATGAGACCTTCAGACCTGGAGGAGGGAATATGAGGGACAATTGGA