Команды в консоли сервера:
# создаем ссылки на файлы с сырыми данными
ln -s /usr/share/data-minor-bioinf/assembly/oil_R1.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oil_R2.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oilMP_S4_L001_R1_001.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oilMP_S4_L001_R2_001.fastq
# случайная выборка чтений
seqtk sample -s515 oil_R1.fastq 5000000 > pairedend1.fastq
seqtk sample -s515 oil_R2.fastq 5000000 > pairedend2.fastq
seqtk sample -s515 oilMP_S4_L001_R1_001.fastq 1500000 > matepairs1.fastq
seqtk sample -s515 oilMP_S4_L001_R2_001.fastq 1500000 > matepairs2.fastq
# создаем папки для результатов работы fastQC и multiQC
mkdir fastqc
mkdir multiqc
# анализируем с помощью fastQC и multiQC
fastqc -o fastqc pairedend* matepairs*
multiqc -o multiqc fastqc
# подрезаем чтения
platanus_trim pairedend*
platanus_internal_trim matepairs*
# удаляем ненужные файлы
rm matepairs*.fastq pairedend*.fastq
# аналогично оценваем качество подрезанных ридов с помощью fastQC и multiQC
mkdir fastqc_trimmed
mkdir multiqc_trimmed
fastqc -o fastqc_trimmed pairedend* matepairs*
multiqc -o multiqc_trimmed fastqc_trimmed
# собираем контиги из подрезанных чтений
platanus assemble -o contigs -f pairedend*.fastq.trimmed
# формируем скаффолды
platanus scaffold -o contigs -c contigs_contig.fa -IP1 pairedend*.fastq.trimmed -OP2 matepairs*.fastq.int_trimmed
# заполняем гэпы
platanus gap_close -o contigs -c contigs_scaffold.fa -IP1 pairedend*.fastq.trimmed -OP2 matepairs*.fastq.int_trimmed
# удаляем ненужные файлы
rm matepairs* pairedend*
Ссылка на ноутбук в Colab и тот же ноутбук в репозитории, где проводились остальные вычисления.