Skin Microbiome Project Example Tutorial

Trial QIIME2 Pipeline in collected data

Publication

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5710430/#note-DOI170016-1-s

Biopsy specimens were analyzed at the Department of Microbiology and Infection Control, Statens Serum Institut, Copenhagen, Denmark. DNA was extracted using a kit (QIAamp DNA Mini Kit; Qiagen) according to the manufacturer’s instructions for tissues. For each batch of DNA extraction, a “negative” control was included containing buffers but no sample material for downstream analysis. DNA was amplified using a 2-step polymerase chain reaction using custom 341F/806R primers targeting the V3-V4 16S regions, as well as 3 primer sets targeting the hypervariable regions V3-V4 of the 18SrDNA gene, and amplicons were sequenced on a desktop sequencer (MiSeq; Illumina, Inc) using the v2 reagent kit. For details concerning primer design and library preparation, see the eAppendix in the Supplement. Sequence data are available at the European Nucleotide Archive (accession number PRJEB15266).

Collect data using SRAtoolkit

Trace ncbi: https://www.ncbi.nlm.nih.gov/Traces/study/?acc=ERP016977&o=acc_s%3Aa
Download data
Install SRAtoolkit

  conda config --add channels bioconda
  conda config --add channels conda-forge
  conda config --show channels

Install SRAtoolkit:

  conda create -n sratool sra-tools
  conda env list

Download data:

Get this file in Trace link

  SraAccList.txt

After that run this command:

  prefetch --option-file SraAccList.txt
  find . -name '*.sra' -print0 | xargs -0 mv -t . 
  find . -type d -empty -delete
  ls *.sra | parallel -j0 fastq-dump --split-files --origfmt {}
  mkdir fastq
  mv *.fastq fastq
  cd fastq
  gzip *fastq
  mkdir sra
  mv *.sra sra

Import Fastq to QIIME2

We perform importing data to QIIME2 following manifest protocol:

Generate manifest file

  echo -e 'sample-id\tforward-absolute-filepath\treverse-absolute-filepath' > manifest.tsv
  for FOR in reads/*_1*gz;
  do ID=$(basename $FOR | cut -f1 -d_);
  REV=${FOR/_1/_2};
  echo -e "${ID}\t${PWD}/${FOR}\t${PWD}/${REV}";
  done >>manifest.tsv

Import to QIIME2

  qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path manifest.tsv \
  --output-path reads.qza \
  --input-format PairedEndFastqManifestPhred33V2

Visualization quality control

  qiime demux summarize \
  --i-data reads.qza \
  --o-visualization reads.qzv

Denoising using DADA2

  qiime dada2 denoise-paired \
  --i-demultiplexed-seqs reads.qza \
  --p-trim-left-f 1 \
  --p-trim-left-r 1 \
  --p-trunc-len-f 250 \
  --p-trunc-len-r 250 \
  --o-table table.qza \
  --o-representative-sequences rep-seqs.qza \
  --o-denoising-stats denoising-stats.qza

Generate Silva database

Generate 16S V3-V4 amplicon reference

qiime rescript get-silva-data --p-version '138' --p-target 'SSURef_NR99' --p-include-species-labels --o-silva-sequences silva-138-ssu-nr99-seqs.qza --o-silva-taxonomy silva-138-ssu-nr99-tax.qza
qiime rescript cull-seqs --i-sequences silva-138-ssu-nr99-seqs.qza --o-clean-sequences silva-138-ssu-nr99-seqs-cleaned.qza
qiime taxa filter-seqs --i-sequences silva-138-ssu-nr99-seqs-cleaned.qza --i-taxonomy silva-138-ssu-nr99-tax.qza --p-exclude 'd__Eukaryota' --p-mode 'contains' --o-filtered-sequences silva138_noEuk_seqs.qza
qiime rescript filter-seqs-length-by-taxon --i-sequences silva138_noEuk_seqs.qza --i-taxonomy silva-138-ssu-nr99-tax.qza --p-labels Archaea Bacteria --p-min-lens 900 1200 --o-filtered-seqs silva138_noEuk_AB_seqs.qza --o-discarded-seqs silva138_Euk_seqs_discard.qza
qiime rescript dereplicate --i-sequences silva138_noEuk_AB_seqs.qza --i-taxa silva-138-ssu-nr99-tax.qza --p-threads 12 --o-dereplicated-sequences silva138_noEuk_AB_seqs_uniq.qza --o-dereplicated-taxa silva138_noEuk_AB_tax_uniq.qza
qiime feature-classifier extract-reads --i-sequences silva138_noEuk_AB_seqs_uniq.qza --p-f-primer ACTCCTAYGGGRBGCASCAG --p-r-primer AGCGTGGACTACNNGGGTATCTAAT --p-n-jobs 12 --o-reads silva138_AB_V3-V4seqs.qza
qiime rescript dereplicate --i-sequences silva138_AB_V3-V4seqs.qza --i-taxa silva138_noEuk_AB_tax_uniq.qza --o-dereplicated-sequences silva138_AB_V3-V4seqs_uniq.qza --o-dereplicated-taxa silva138_AB_V3-V4taxa_uniq.qza
qiime rescript evaluate-fit-classifier --i-sequences silva138_AB_V3-V4seqs_uniq.qza --i-taxonomy silva138_AB_V3-V4taxa_uniq.qza --o-classifier silva138_AB_V3-V4_classifier.qza --o-observed-taxonomy silva138_AB_V3-V4_predicted_taxonomy.qza --o-evaluation silva138_AB_V3-V4_classifier_eval.qzv --p-n-jobs 0

Filtering 18S sequences using "qiime quality-control exclude-seqs"

qiime quality-control exclude-seqs \
  --i-query-sequences rep-seqs.qza \
  --i-reference-sequences silva138_AB_V3-V4seqs_uniq.qza \
  --p-method vseach \
  --p-perc-identity 0.97 \
  --p-perc-query-aligned 0.97 \
  --o-sequence-hits hits.qza \
  --o-sequence-misses misses.qza

qiime feature-table filter-features \
  --i-table table.qza \
  --m-metadata-file misses.qza \
  --o-filtered-table filtered-table.qza \
  --p-exclude-ids

Filtering Feature-table by Group

qiime feature-table filter-samples \
  --i-table table.qza \
  --m-metadata-file sample-metadata.tsv \
  --p-where '[Class] IN ("Healthy", "HS Legional Skin","HS Non-Legional Skin")' \
  --o-filtered-table filtered-table.qza

qiime feature-table filter-seqs \
  --i-data rep-seqs.qza \
  --i-table filtered-table.qza \
  --o-filtered-data filtered-rep-seqs.qza

Generate phylogenetic tree

qiime phylogeny align-to-tree-mafft-fasttree \
--i-sequences filtered-rep-seqs.qza \
--o-alignment aligned-rep-seqs.qza \
--o-masked-alignment masked-aligned-rep-seqs.qza \
--o-tree unrooted-tree.qza \
--o-rooted-tree rooted-tree.qza \
--p-n-threads 20

Taxonomy classifier

 qiime feature-classifier classify-sklearn \
     --i-classifier silva138_AB_V3-V4_classifier.qza \
     --i-reads filtered-rep-seqs.qza \
     --o-classification taxonomy.qza
     --p-n-jobs 20
 qiime metadata tabulate \
   --m-input-file taxonomy.qza \
   --o-visualization taxonomy.qzv
 qiime taxa barplot \
   --i-table filtered-table.qza \
   --i-taxonomy taxonomy.qza \
   --m-metadata-file sample-metadata.tsv \
   --o-visualization taxa-bar-plots.qzv

Alpha/Beta diversity measurement

*Automatic

qiime diversity core-metrics-phylogenetic \
--i-phylogeny rooted-tree.qza \
--i-table table.qza \
--p-sampling-depth 1483 \
--m-metadata-file sample-metadata.tsv \
--output-dir core-metrics-results

*Manual

qiime diversity alpha-phylogenetic
--i-table filtered-table.qza
--i-phylogeny rooted-tree.qza
--p-metric faith_pd
--o-alpha-diversity faith_pd_vector.qza

qiime diversity alpha \
--i-table filtered-table.qza \
--p-metric shannon \
--o-alpha-diversity shannon.qza

qiime diversity alpha \
--i-table filtered-table.qza \
--p-metric chao1 \
--o-alpha-diversity chao1.qza

qiime diversity alpha \
--i-table filtered-table.qza \
--p-metric pielou_e \
--o-alpha-diversity pielou.qza

qiime tools export \
--input-path faith_pd_vector.qza \
--output-path faithpd

qiime tools export \
--input-path shannon.qza \
--output-path shannon

qiime tools export \
--input-path pielou.qza \
--output-path pielou

qiime tools export \
--input-path chao1.qza \
--output-path chao1

Visualization process using R

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
QIIME2OutPut		QIIME2OutPut
README.md		README.md
SkinMicrobiome.R		SkinMicrobiome.R
SraAccList.txt		SraAccList.txt
sample-metadata.tsv		sample-metadata.tsv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Skin Microbiome Project Example Tutorial

Publication

Collect data using SRAtoolkit

Import Fastq to QIIME2

Denoising using DADA2

Generate Silva database

Generate 16S V3-V4 amplicon reference

Filtering 18S sequences using "qiime quality-control exclude-seqs"

Filtering Feature-table by Group

Generate phylogenetic tree

Taxonomy classifier

Alpha/Beta diversity measurement

About

Uh oh!

Releases

Packages

Languages

Anegin24/SkinMicrobiomeProjectExample

Folders and files

Latest commit

History

Repository files navigation

Skin Microbiome Project Example Tutorial

Publication

Collect data using SRAtoolkit

Import Fastq to QIIME2

Denoising using DADA2

Generate Silva database

Generate 16S V3-V4 amplicon reference

Filtering 18S sequences using "qiime quality-control exclude-seqs"

Filtering Feature-table by Group

Generate phylogenetic tree

Taxonomy classifier

Alpha/Beta diversity measurement

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages