전체 글
-
De novo transcriptome analysisBioinformatics 2020. 1. 15. 10:03
리눅스 (Ubuntu 16.0.4) 운영체제에서 분석한 내용을 토대로 작성한 글입니다. (Illumina short read RNA-seq, Paired-end reads) 0. De novo transcriptome analysis De novo transcriptome anlalysis 는 Trinity sortware [1] 를 활용해 봅시다. 필요한 sortware - Trinity (version 2.2.0 기준으로 작성했습니다.) - Bowtie2 - Samtools - TransDecoder (version 3.0.0) - BLAST - CD-hit - RSEM - R - R packages (edgeR, ctc, Biobase, ape, gplots 등) PATH 설정을 해놓아야 합니다. ..
-
Reference based transcriptome analysisBioinformatics 2020. 1. 15. 10:03
리눅스 (Ubuntu 16.0.4) 운영체제에서 분석한 내용을 토대로 작성한 글입니다. (Illumina short read RNA-seq, Paired-end reads) 0. De novo vs. Reference based transcriptome analysis Raw data preprocessing 이 끝난 후에는 자신의 샘플의 species 가 genome 이 있는지 없는지에 따라 위 제목처럼 de novo 와 reference based 2가지 분석방법으로 나뉩니다. 1) 우선, Geonme 즉 reference 가 있는 경우로 RNA-seq reads 를 reference 에 mapping 하고 이를 기반으로 transcript assembly & gene expression quanti..
-
Raw data preprocessingBioinformatics 2020. 1. 15. 10:02
리눅스 (Ubuntu 16.0.4) 운영체제에서 분석한 내용을 토대로 작성한 글입니다. (Illumina short read RNA-seq, Paired-end reads) 0. Raw data 시퀀싱이 완료된 RNA-Seq raw data는 FASTQ 의 format 으로 되어있습니다. 주로 업체의 NGS report 에서 FASTQ file 을 받게 되고 주로 압축이 되어 있을 겁니다. ex) rawdata.fastq_1.tar.gz 또는 rawdata.fastq_1.gz Paired-end sequencing data 는 샘플 하나당 forward 와 reverse 파일 한 쌍으로 제공됩니다. 대부분 1과 2를 통해 구분하지만 업체마다 조금씩 다른 구분 방법이 있으니 미리 확인해 두는것이 좋습니다...