BWA-MEM
BWA는 대용량 시퀀싱 데이터를 참조 유전체와 정렬하는 데 사용되는 고속, 고정밀 분석 도구입니다. BWA는 짧은 리드(30bp~1Mbp)와 긴 리드(>100bp)에 모두 적합하며, 주로 Illumina 시퀀싱 데이터를 정렬하는 데 사용됩니다. BWA의 주요 기능은 효율적인 시퀀스 정렬도, Burrows-Wheeler 변환과 FM 인덱스를 사용하여 시퀀싱 리드를 참조 유전체에 빠르고 정확하게 정렬합니다. BWA-bactrack, BWA-sw 및 BWA-mem의 세 가지 알고리즘으로 구성됩니다. BWA-mem은 긴 리드(>70bp)에 최적화되어 있습니다. 시드-확장 접근 방식을 사용하여 정확하고 효율적인 정렬을 수행하며, 특히 긴 리드에서 높은 성능을 보입니다. 또한 BWA-mem은 RNS-seq 데이터에서 인트론과 엑손 간의 정확한 정렬을 지원하며, 높은 민감도와 정확도를 가지고 있어 변이 탐지에 유리합니다. Bio-Express의 Whole Genome Sequencing Pipeline 분석과정에서 BWA-mem의 입력(input) 데이터로는 fastq 타입의 파일이 가능하며, 출력 데이터로는 align이 완료된 sam 파일이 생성됩니다.
- 카테고리Mapping > Short-Read Alignment
- 수정일2025-09-17
Bowtie2
Bowtie2는 Johns Hopkins University의 Ben Langmead와 Steven Salzberg가 개발한 플랫폼으로, 전 세계 주요 게놈 센터와 바이오인포매틱스 분야에서 서열 정렬 분야의 표준 참조로 인정받고 있는 핵심 도구입니다. 이 도구는 기존 정렬 도구들의 한계를 극복하기 위해 FM-index(Full-text Minute-space index) 기술과 BWT(Burrows-Wheeler Transform) 알고리즘을 결합한 획기적인 색인 구조를 구현하여, 인간 전체 게놈과 같은 거대한 참조 서열에서도 메모리 효율성과 검색 속도를 동시에 최적화한 혁신적 솔루션을 제공합니다. Bowtie2의 가장 큰 기술적 혁신은 갭을 허용하는 정렬(gapped alignment)과 지역 정렬(local alignment) 기능을 완벽하게 지원한다는 점입니다. 이는 ChIP-seq 분석에서 핵심적으로 중요한데, 크로마틴 면역침전 과정에서 발생할 수 있는 DNA 단편화나 시퀀싱 오류를 지능적으로 처리하면서도 multi-mapping 리드의 정확한 분류를 통해 반복 서열 영역에서의 false positive 신호를 효과적으로 차단합니다. 특히 MAPQ(Mapping Quality) 점수 계산 시스템을 통해 각 정렬의 신뢰도를 정량적으로 평가하여, 후속 MACS2 피크 호출에서 고유하게 매핑된 고신뢰도 리드만을 선별적으로 활용할 수 있게 합니다.
- 카테고리Mapping > Short-Read Alignment
- 수정일2025-09-16