Programas usados nesse tutorial
FASTQC: Avaliação da qualidade do sequenciamento
Link: http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
VELVET:Montagem de contigs
https://www.ebi.ac.uk/~zerbino/velvet/
MAUVE: Ordenamento de contigs com genoma referência
MAUVE: Comparação de genomas
Link: http://gel.ahabs.wisc.edu/mauve/
BRIG: Comparação de genomas bacterianos através de gráficos em anéis.
Link: http://brig.sourceforge.net/
BLAST: para fazer as comparações com o BRIG é necessário ter o BLAST instalado na sua máquina
Link: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST
Montagem dos contigs (VELVET)
Vamos montar os contigs do genoma de
Link: http://www.ebi.ac.uk/ena/data/view/ERX006120
esse genoma foi sequenciado em uma plataforma Illumina gerando arquivos Fastaq. São dois arquivos que contem o sequenciamento do genoma na direção forward e reverse separados.
Devemos baixar esses arquivos para fazer montagem dos contigs. (Os arquivos já estão no computador)
Vamos conectar no computador que vamos trabalhar. Para isso vamos usar o programa PuTTY que ‘e uma programa para acesso remoto em outras máquinas.
Download PuTTY (SSH client)
Os arquivos devem ser copiados para o diretório de trabalho.
criar o seu diretorio
$cd
$cd bioinfo
$mkdir seunome
$cd seunome
$mkdir genome1
$cd genome1
$cp ../../fastq_files/genome1/* .
$ls -la
$head SRR292770_1.fastq
Comando para gerar a k-mer
$../../velvet_1.2.10/velveth diretorio_saida 31 -fastq.gz -shortPaired -separate forward.fastq.gz reverse.fastq.gz
Gerando os contigs
$../../velvet_1.2.10/velvetg diretorio_saida -clean yes -exp_cov 21 -cov_cutoff 2.81 -min_contig_lgth 200
Ordenamento de Contigs – Comparação com genoma referência (MAUVE)
Vamos comparar a montagem do genoma de Mycoplasma leachii 99/014/6 com o genoma referência Mycoplasma leachii PG50 (número de acesso NC_014751.1)
| Organism | Size (Mb) | GC% | Gene | Protein | Accession |
|---|---|---|---|---|---|
| Mycoplasma leachii 99/014/6 | 1.02 | 23.7 | 940 | 905 | NC_017521.1 |
| Mycoplasma leachii PG50 | 1.01 | 23.8 | 925 | 882 | NC_014751.1 |
| Mycoplasma capricolum subsp. capricolum ATCC 27343 | 1.01 | 23.8 | 867 | 812 | NC_007633.1 |
Onde podemos encontrar outros genomas para usar como referência e comparação?
Link: ftp://ftp.ncbi.nlm.nih.gov/genomes/
Link: ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/
Comparação de genomas (MAUVE)
Vamos fazer um comparativo do genoma montado (de Mycoplasma leachii 99/014/6) com o genoma referência (Mycoplasma leachii PG50 (número de acesso NC_014751.1)) e com um genoma alternativo de um organismo relacionado (Mycoplasma capricolum subsp. capricolum ATCC 27343, número de acesso NC_007633.1).
Comparação de genomas bacterianos usando gráficos em anéis (BRIG)
Vamos usar a ferramenta para produzir uma figura em anel representando o cromossomo do genoma que estamos montando.
Vamos usar um conjunto de genomas para comparação e mostrar na figura a semelhança de cada um desses genomas com o genoma que nos montamos.
Genomas escolhidos para fazer a comparação ()salvamos os arquivos Fasta e Genbank de cada genoma)
1. Mycoplasma pneumoniae Causes respiratory tract infections Kingdom: Bacteria Chromosome: 1 Genome ID: 1028 2. Mycoplasma genitalium Causative agent of a wide range of urogenital and respiratory tract infections. Kingdom: Bacteria Chromosome: 1 Genome ID: 474 3. Mycoplasma fermentans Implicated in respiratory disease and arthritis in humans Kingdom: Bacteria Chromosome: 1 Genome ID: 1234 4. Mycoplasma bovis Causes disease in cattle Kingdom: Bacteria Chromosome: 1 Genome ID: 1150 5. Mycoplasma penetrans Causes urogenital and respiratory disease Kingdom: Bacteria Chromosome: 1 Genome ID: 1037