CRISPR 스크리닝과 시스템 생물학: 유전자 기능을 대규모로 해부하다
CRISPR 스크리닝의 원리, 분석 방법, 그리고 시스템 생물학에서의 활용. Perturb-seq까지 이어지는 대규모 유전자 기능 연구의 흐름을 정리했다.
CRISPR-Cas9은 유전자 편집 도구로 유명하지만, 시스템 생물학 관점에서 더 흥미로운 응용은 CRISPR 스크리닝이다. 수만 개의 유전자를 한 번에 체계적으로 교란(perturbation)시키고, 그 결과를 관찰함으로써 유전자 기능을 대규모로 해부할 수 있다.
CRISPR 스크리닝의 원리
기본 아이디어는 간단하다. 유전체 전체를 커버하는 sgRNA 라이브러리를 세포에 도입하면, 각 세포는 하나의 유전자만 녹아웃(knockout)된다. 이 세포 풀을 특정 조건(약물 처리, 성장 선택 등)에 노출시킨 후, 살아남은 세포들에서 sgRNA의 분포를 시퀀싱으로 읽어낸다.
특정 조건에서 풍부해진(enriched) sgRNA가 타겟하는 유전자는 그 조건에서 불필요하거나 해로운 유전자이고, 줄어든(depleted) sgRNA의 타겟은 그 조건에서 필수적인 유전자다. 이렇게 한 번의 실험으로 수천 개 유전자의 기능적 중요도를 평가할 수 있다.
Knockout vs CRISPRi vs CRISPRa
스크리닝 방식도 다양해졌다:
-
CRISPR Knockout: Cas9으로 유전자를 완전히 불활성화. 가장 강한 표현형을 보지만, 필수 유전자의 경우 세포가 죽어버릴 수 있다.
-
CRISPRi(interference): dCas9-KRAB으로 전사를 억제. 녹아웃보다 부드러운 교란이라 필수 유전자도 연구 가능하다.
-
CRISPRa(activation): dCas9에 전사 활성화 도메인을 붙여서 유전자 발현을 올린다. 기능 획득(gain-of-function) 스크리닝에 적합하다.
데이터 분석: MAGeCK과 그 너머
CRISPR 스크리닝 데이터 분석의 표준 도구는 MAGeCK이다. sgRNA 수준의 카운트 데이터에서 통계적으로 유의한 유전자를 찾아주는데, Robust Rank Aggregation(RRA) 알고리즘 기반이라 false positive가 적다.
최근에는 MAGeCK-VISPR로 시각화까지 통합된 파이프라인을 쓸 수 있고, BAGEL2는 베이지안 접근법으로 필수 유전자를 분류하는 데 특화되어 있다. 스크리닝 결과를 경로(pathway) 수준에서 해석하려면 MAGeCK의 결과를 GSEA에 넣거나, MAGeCK-Flute를 활용하면 된다.
시스템 생물학과의 접점
CRISPR 스크리닝이 시스템 생물학에 주는 가장 큰 선물은 **유전자 상호작용(genetic interaction)**을 대규모로 매핑할 수 있다는 것이다. 두 유전자를 동시에 교란시키는 combinatorial 스크리닝을 통해 synthetic lethal 관계를 찾을 수 있고, 이는 항암 약물 타겟 발굴에 직결된다.
또한 Perturb-seq처럼 CRISPR 교란과 단일세포 RNA-seq을 결합하면, 각 유전자 교란이 전사체 전체에 미치는 영향을 개별 세포 수준에서 측정할 수 있다. 이런 고해상도 교란 데이터는 유전자 조절 네트워크를 재구성하는 데 엄청난 자원이 된다.
시스템 생물학의 궁극적인 목표가 생물학적 시스템의 "배선도"를 완성하는 것이라면, CRISPR 스크리닝은 그 배선도를 그리는 가장 강력한 연필이라 할 수 있다.
관련 읽을거리
- 💊 비타민D 부족이 만성피로의 원인? 혈액검사로 확인하세요 — Genobalance
- 🧠 뇌의 가소성: 우리 뇌는 왜 평생 변화하는가 — K-Brain Map
- 💻 AI 기술 동향: 핫 스타트업부터 윤리적 논쟁까지 — BRIC