Skip to content

Commit

Permalink
all: Remove unnecessary $
Browse files Browse the repository at this point in the history
  • Loading branch information
jvfe committed Feb 13, 2025
1 parent 84854c4 commit 208954c
Show file tree
Hide file tree
Showing 9 changed files with 61 additions and 61 deletions.
30 changes: 15 additions & 15 deletions content/02_qc.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -19,7 +19,7 @@ No comando `prefetch`, o argumento `-X` especifica o tamanho máximo do arquivo
Obtenha as leituras paired-end:

```bash
$ fasterq-dump SRR579292 -e 8
fasterq-dump SRR579292 -e 8
```

::: callout-note
Expand Down Expand Up @@ -71,7 +71,7 @@ Gere o relatório consolidado contendo todas as amostras a partir do output do F

``` bash
# Consolidando relatórios com MultiQC
$ multiqc Pipeline/data
multiqc Pipeline/data
```

::: callout-tip
Expand All @@ -96,7 +96,7 @@ hospedeiro, garantido que tenhamos apenas sequências advindas da microbiota.
Remova sequências de baixa qualidade e adaptadores:

```bash
$ fastp -i SRR579292_1.fastq -I SRR579292_2.fastq -o trimmed/SRR579292_1_trim.fastq -O trimmed/SRR579292_2_trim.fastq -q 20 -w 8 --detect_adapter_for_pe -h trimmed/report.html -j trimmed/fastp.json
fastp -i SRR579292_1.fastq -I SRR579292_2.fastq -o trimmed/SRR579292_1_trim.fastq -O trimmed/SRR579292_2_trim.fastq -q 20 -w 8 --detect_adapter_for_pe -h trimmed/report.html -j trimmed/fastp.json
```

::: callout-note
Expand All @@ -112,8 +112,8 @@ Um genoma de referência de *Homo sapiens* é necessário para remover as sequê
Baixe o genoma de referência de *Homo sapiens* do Ensembl:

```bash
$ wget ftp://ftp.ensembl.org/pub/release-102/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
$ pigz -d Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz -p 8
wget ftp://ftp.ensembl.org/pub/release-102/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
pigz -d Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz -p 8
```

::: callout-note
Expand All @@ -125,24 +125,24 @@ O software `pigz` é uma implementação paralela do `gzip`. O argumento `-p` es
Construa um índice Bowtie2:

```bash
$ bowtie2-build Homo_sapiens.GRCh38.dna.primary_assembly.fa ../index/host --threads 8
bowtie2-build Homo_sapiens.GRCh38.dna.primary_assembly.fa ../index/host --threads 8
```

Volte para `"Pipeline/data"` e alinhe as sequências contra a referência:

```bash
$ bowtie2 -x removal/index/host -1 trimmed/SRR579292_1_trim.fastq -2 trimmed/SRR579292_2_trim.fastq -S removal/all.sam -p 8
bowtie2 -x removal/index/host -1 trimmed/SRR579292_1_trim.fastq -2 trimmed/SRR579292_2_trim.fastq -S removal/all.sam -p 8
```

Extraia as leituras não alinhadas:

```bash
$ samtools view -bS removal/all.sam > removal/all.bam
$ samtools view -b -f 12 -F 256 removal/all.bam > removal/unaligned.bam
$ samtools sort -n removal/unaligned.bam -o removal/unaligned_sorted.bam
$ samtools bam2fq removal/unaligned_sorted.bam > removal/unaligned.fastq
$ cat removal/unaligned.fastq | grep '^@.*/1$' -A 3 --no-group-separator > removal/unaligned_1.fastq
$ cat removal/unaligned.fastq | grep '^@.*/2$' -A 3 --no-group-separator > removal/unaligned_2.fastq
samtools view -bS removal/all.sam > removal/all.bam
samtools view -b -f 12 -F 256 removal/all.bam > removal/unaligned.bam
samtools sort -n removal/unaligned.bam -o removal/unaligned_sorted.bam
samtools bam2fq removal/unaligned_sorted.bam > removal/unaligned.fastq
cat removal/unaligned.fastq | grep '^@.*/1$' -A 3 --no-group-separator > removal/unaligned_1.fastq
cat removal/unaligned.fastq | grep '^@.*/2$' -A 3 --no-group-separator > removal/unaligned_2.fastq
```

::: callout-note
Expand All @@ -155,11 +155,11 @@ No comando `SAMtools`, os argumentos `-f` e `-F` utilizam flags para especificar
Una as leituras paired-end:

```bash
$ fastp -i removal/unaligned_1.fastq -I removal/unaligned_2.fastq -o trimmed/unmerged_1.fastq -O trimmed/unmerged_2.fastq -q 20 -w 8 --detect_adapter_for_pe -h trimmed/report2.html -j trimmed/fastp2.json -m --merged_out merged/SRR579292_merged.fastq
fastp -i removal/unaligned_1.fastq -I removal/unaligned_2.fastq -o trimmed/unmerged_1.fastq -O trimmed/unmerged_2.fastq -q 20 -w 8 --detect_adapter_for_pe -h trimmed/report2.html -j trimmed/fastp2.json -m --merged_out merged/SRR579292_merged.fastq
```

Remova sequências duplicadas:

```bash
$ fastx_collapser -i merged/SRR579292_merged.fastq -o collapsed/SRR579292.fasta
fastx_collapser -i merged/SRR579292_merged.fastq -o collapsed/SRR579292.fasta
```
6 changes: 3 additions & 3 deletions content/04_taxonomia.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -19,14 +19,14 @@ Use um cluster de alta performance ou ambientes similares!
:::

```bash
$ wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
$ pigz -d nr.gz -p 8
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
pigz -d nr.gz -p 8
```

Construa um índice DIAMOND:

```bash
$ diamond makedb --in nr -d ../index/nr
diamond makedb --in nr -d ../index/nr
```

Mude o diretório atual para "Pipeline/taxonomic/db" e baixe os seguintes arquivos:
Expand Down
14 changes: 7 additions & 7 deletions content/05_anotacao.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -13,8 +13,8 @@ Mas, para fazer isso, primeiro precisamos alinhar nosso dado a uma referência!
Mude o diretório atual para `"Pipeline/alignment"` e alinhe as leituras contra o banco de dados de proteínas de referência:

```bash
$ touch unaligned.fasta
$ diamond blastx -d index/nr -q ../data/collapsed/SRR579292.fasta -o matches.m8 --top 3 --un unaligned.fasta
touch unaligned.fasta
diamond blastx -d index/nr -q ../data/collapsed/SRR579292.fasta -o matches.m8 --top 3 --un unaligned.fasta
```

::: callout-note
Expand All @@ -28,8 +28,8 @@ O DIAMOND pode usar muita memória e espaço temporário em disco. Portanto, o p
Realize um alinhamento mais sensível usando as sequências não alinhadas:

```bash
$ touch unaligned2.fasta
$ diamond blastx -d index/nr -q unaligned.fasta -o matches2.m8 --more-sensitive --top 3 --un unaligned2.fasta
touch unaligned2.fasta
diamond blastx -d index/nr -q unaligned.fasta -o matches2.m8 --more-sensitive --top 3 --un unaligned2.fasta
```
::: callout-note
## Nota
Expand All @@ -40,17 +40,17 @@ O modo padrão sensível é projetado para leituras curtas (~100 pb), encontrand
Verifique o número de consultas que apresentam hits com pelo menos 80% de identidade em `matches2.m8`:

```bash
$ awk '{ if ($3>=80) { print } }' matches2.m8 > check.m8
awk '{ if ($3>=80) { print } }' matches2.m8 > check.m8
```

```bash
$ awk '{a[$1]++}END{for (i in a) sum+=1; print sum}' check.m8
awk '{a[$1]++}END{for (i in a) sum+=1; print sum}' check.m8
```

#### Concatenar os resultados do alinhamento:

```bash
$ cat matches.m8 matches2.m8 > all_matches.m8
cat matches.m8 matches2.m8 > all_matches.m8
```

### Executando o annotate
Expand Down
Loading

0 comments on commit 208954c

Please sign in to comment.