장내 미생물 분석: 16S rRNA에서 메타게노믹스까지
장내 미생물 분석의 두 가지 접근법, 16S rRNA와 샷건 메타게노믹스를 비교하고 주요 분석 도구를 정리했다.
장내 미생물(gut microbiome) 연구가 폭발적으로 성장하면서, 미생물 군집 분석 방법도 빠르게 발전하고 있다. 이 글에서는 장내 미생물 분석의 두 가지 주요 접근법인 16S rRNA 앰플리콘 시퀀싱과 샷건 메타게노믹스를 비교하고, 각각의 분석 파이프라인을 소개한다.
16S rRNA 앰플리콘 시퀀싱
16S rRNA 유전자는 모든 세균에 존재하면서도 종마다 서열이 다른 가변 영역(V1-V9)을 갖고 있어서, 미생물 분류에 이상적인 마커다. 보통 V3-V4 또는 V4 영역을 PCR로 증폭한 뒤 시퀀싱한다.
분석 파이프라인은 크게 두 갈래다:
-
OTU 기반: 서열 유사도 97%를 기준으로 클러스터링하는 전통적 방법. QIIME의 초기 버전이 이 방식이었다.
-
ASV 기반: 시퀀싱 오류를 보정하여 정확한 서열 변이체(Amplicon Sequence Variant)를 추출하는 방법. DADA2가 대표 도구이며, 현재의 표준이다. OTU보다 해상도가 높고 재현성이 좋다.
현재 가장 추천하는 파이프라인은 QIIME 2 + DADA2 조합이다. QIIME 2는 플러그인 구조로 전처리부터 다양성 분석, 통계 검정까지 커버한다.
샷건 메타게노믹스
16S가 "누가 있는가"에 초점을 맞춘다면, 샷건 메타게노믹스는 "무엇을 할 수 있는가"까지 답할 수 있다. 전체 미생물 DNA를 무작위로 시퀀싱하기 때문에 종 수준(species level)의 분류가 가능하고, 기능 유전자 프로파일링도 할 수 있다.
주요 분석 도구:
-
MetaPhlAn: 마커 유전자 기반 종 분류. 빠르고 정확하다.
-
Kraken2/Bracken: k-mer 기반 분류. 속도가 매우 빠르지만 데이터베이스에 있는 종만 분류 가능.
-
HUMAnN: 기능 경로(pathway) 프로파일링. MetaPhlAn과 함께 쓰는 경우가 많다.
-
MEGAHIT/metaSPAdes: 메타게놈 어셈블리. MAG(Metagenome-Assembled Genome)를 구축하는 데 사용.
다양성 분석
미생물 군집 분석에서 핵심은 다양성(diversity) 비교다:
-
알파 다양성: 개별 시료 내 미생물 다양성. Shannon index, Observed species, Faith's PD 등으로 측정.
-
베타 다양성: 시료 간 미생물 군집 구조의 차이. Bray-Curtis, UniFrac 거리를 계산하고, PCoA로 시각화한 뒤, PERMANOVA로 통계 검정.
차등 풍부도 분석
어떤 미생물이 그룹 간에 유의하게 다른지 찾는 것도 중요한 분석이다. 과거에는 LEfSe가 많이 쓰였지만, 최근에는 compositional data의 특성을 고려한 ANCOM-BC, MaAsLin2, ALDEx2 등이 더 권장된다. 미생물 데이터는 상대 풍부도(compositional)이기 때문에, 이를 무시한 통계 방법은 false positive를 낳을 수 있다.
장내 미생물 연구는 아직 갈 길이 멀다. 인과관계 규명, 개인화된 미생물 치료, 균주 수준의 기능 해석 등 풀어야 할 문제가 산적해 있지만, 분석 도구가 빠르게 성숙하고 있어서 앞으로가 기대된다.
관련 읽을거리
- 💊 장내 미생물과 면역력: 프로바이오틱스를 제대로 알고 먹자 — Genobalance
- 🧠 뇌-장 축(Brain-Gut Axis): 장 건강이 우울증에 미치는 놀라운 영향 — K-Brain Map
- 💻 AI 기술 동향: 핫 스타트업부터 윤리적 논쟁까지 — BRIC