Home » Montagem de Genoma

Montagem de Genoma

Programas usados nesse tutorial

FASTQC: Avaliação da qualidade do sequenciamento

Link: http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

 

VELVET:Montagem de contigs

https://www.ebi.ac.uk/~zerbino/velvet/

 

MAUVE: Ordenamento de contigs com genoma referência

MAUVE: Comparação de genomas

Link: http://gel.ahabs.wisc.edu/mauve/

 

BRIG: Comparação de genomas bacterianos através de gráficos em anéis.

Link: http://brig.sourceforge.net/

 

BLAST: para fazer as comparações com o BRIG é necessário ter o BLAST instalado na sua máquina

Link: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST

 

Montagem dos contigs (VELVET)

Vamos montar os contigs do genoma de

Link: http://www.ebi.ac.uk/ena/data/view/ERX006120

esse genoma foi sequenciado em uma plataforma Illumina gerando arquivos Fastaq. São dois arquivos que contem o sequenciamento do genoma na direção forward e reverse separados.

Devemos baixar esses arquivos para fazer montagem dos contigs. (Os arquivos já estão no computador)

Vamos conectar no computador que vamos trabalhar. Para isso vamos usar o programa PuTTY que ‘e uma programa para acesso remoto em outras máquinas.
Download PuTTY (SSH client)

Os arquivos devem ser copiados para o diretório de trabalho.

criar o seu diretorio

$cd
$cd bioinfo
$mkdir seunome
$cd seunome
$mkdir genome1
$cd genome1
$cp ../../fastq_files/genome1/* .
$ls -la
$head SRR292770_1.fastq

Comando para gerar a k-mer

$../../velvet_1.2.10/velveth diretorio_saida 31 -fastq.gz -shortPaired -separate forward.fastq.gz reverse.fastq.gz

Gerando os contigs

$../../velvet_1.2.10/velvetg diretorio_saida -clean yes -exp_cov 21 -cov_cutoff 2.81 -min_contig_lgth 200

Ordenamento de Contigs – Comparação com genoma referência (MAUVE)

Vamos comparar a montagem do genoma de Mycoplasma leachii 99/014/6 com o genoma referência Mycoplasma leachii PG50  (número de acesso NC_014751.1)

Organism Size (Mb) GC% Gene Protein Accession
Mycoplasma leachii 99/014/6 1.02 23.7 940 905 NC_017521.1
Mycoplasma leachii PG50 1.01 23.8 925 882 NC_014751.1
Mycoplasma capricolum subsp. capricolum ATCC 27343 1.01 23.8 867 812 NC_007633.1

 

Onde podemos encontrar outros genomas para usar como referência e comparação?

Link: ftp://ftp.ncbi.nlm.nih.gov/genomes/

Link: ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/

 

Comparação de genomas (MAUVE)

Vamos fazer um comparativo do genoma montado (de Mycoplasma leachii 99/014/6) com o genoma referência (Mycoplasma leachii PG50  (número de acesso NC_014751.1)) e com um genoma alternativo de um organismo relacionado (Mycoplasma capricolum subsp. capricolum ATCC 27343, número de acesso NC_007633.1).

 

Comparação de genomas bacterianos usando gráficos em anéis (BRIG)

Vamos usar a ferramenta para produzir uma figura em anel representando o cromossomo do genoma que estamos montando.

Vamos usar um conjunto de genomas para comparação e mostrar na figura a semelhança de cada um desses genomas com o genoma que nos montamos.

Genomas escolhidos para fazer a comparação ()salvamos os arquivos Fasta e Genbank de cada genoma)

 

1. Mycoplasma pneumoniae
Causes respiratory tract infections
Kingdom: Bacteria
Chromosome: 1
Genome ID: 1028

2. Mycoplasma genitalium
Causative agent of a wide range of urogenital and respiratory tract infections.
Kingdom: Bacteria
Chromosome: 1
Genome ID: 474

3. Mycoplasma fermentans
Implicated in respiratory disease and arthritis in humans
Kingdom: Bacteria
Chromosome: 1
Genome ID: 1234

4. Mycoplasma bovis
Causes disease in cattle
Kingdom: Bacteria
Chromosome: 1
Genome ID: 1150

5. Mycoplasma penetrans
Causes urogenital and respiratory disease
Kingdom: Bacteria
Chromosome: 1
Genome ID: 1037

Post a Comment