AlphaFold 이후의 구조 생물학: 무엇이 달라졌나
AlphaFold가 구조 생물학에 가져온 변화와 남아있는 한계. AlphaFold3, ESMFold까지 최신 동향을 정리했다.
2020년 CASP14에서 AlphaFold2가 보여준 성능은 구조 생물학의 판도를 바꿔놓았다. X선 결정학이나 cryo-EM으로 수년에 걸쳐 풀어야 했던 단백질 구조를 컴퓨터가 몇 분 만에 예측해버린 것이다. 그로부터 수년이 지난 지금, 구조 생물학 필드는 어떻게 변했을까.
AlphaFold가 바꾼 것들
가장 직접적인 변화는 구조 데이터의 폭발적 증가다. AlphaFold Protein Structure Database에는 이제 2억 개 이상의 예측 구조가 올라와 있다. 예전에는 구조가 풀리지 않아서 연구가 막혔던 단백질도, 이제는 합리적인 수준의 구조 모델을 갖고 시작할 수 있다.
약물 설계에서도 영향이 크다. 타겟 단백질의 구조를 기반으로 한 **구조 기반 약물 설계(SBDD)**가 훨씬 접근하기 쉬워졌다. AlphaFold 구조를 가지고 도킹이나 가상 스크리닝을 시작하는 프로젝트가 급증했다.
AlphaFold의 한계
물론 AlphaFold가 모든 문제를 해결한 건 아니다. 몇 가지 중요한 한계가 있다:
-
동적 구조(dynamics): AlphaFold는 하나의 정적 구조를 예측한다. 하지만 단백질은 여러 형태(conformations) 사이를 오가며 기능하고, 이 동적 측면은 아직 잘 포착하지 못한다.
-
리간드 결합 구조: AlphaFold2는 apo 형태(리간드 없는 상태)를 예측하는 경향이 있어서, 약물 결합 포켓의 세부 구조가 실험 구조와 다를 수 있다.
-
무질서 영역(disordered regions): 본질적으로 무질서한(intrinsically disordered) 영역은 예측 신뢰도가 낮다. 다만 이건 예측의 실패가 아니라 해당 영역이 실제로 고정된 구조를 갖지 않기 때문이다.
-
돌연변이 효과: 단일 아미노산 치환이 구조에 미치는 미세한 영향을 정확히 포착하는 데는 아직 한계가 있다.
AlphaFold3와 그 너머
AlphaFold3는 단백질뿐 아니라 DNA, RNA, 소분자, 이온과의 복합체 구조를 예측할 수 있도록 확장되었다. 이는 약물-타겟 상호작용을 예측하는 데 직접적으로 활용될 수 있어서, 구조 기반 약물 설계의 새로운 가능성을 열었다.
한편 ESMFold는 언어 모델 기반으로 MSA(다중 서열 정렬) 없이도 구조를 예측할 수 있어서, 속도 면에서 AlphaFold보다 훨씬 빠르다. 정확도는 약간 떨어지지만, 대규모 메타유전체 데이터에서 신규 단백질 구조를 탐색하는 데는 ESMFold가 더 실용적이다.
실험 구조 생물학의 미래
AlphaFold 때문에 실험 구조 생물학이 사라질 거라는 말은 과장이다. 오히려 cryo-EM은 계속 성장하고 있다. 분해능이 향상되면서 약물 분자 수준의 디테일을 볼 수 있게 되었고, 대형 복합체나 막단백질의 구조를 푸는 데는 여전히 실험 방법이 필수적이다.
앞으로 구조 생물학은 AI 예측과 실험적 검증이 시너지를 내는 방향으로 발전할 것이다. AlphaFold로 빠르게 가설을 세우고, 실험으로 확인하고, 그 결과로 다시 모델을 개선하는 순환이 이미 시작되었다.
관련 읽을거리
- 💊 비타민D 부족이 만성피로의 원인? 혈액검사로 확인하세요 — Genobalance
- 🧠 뇌의 가소성: 우리 뇌는 왜 평생 변화하는가 — K-Brain Map
- 💻 AI 기술 동향: 핫 스타트업부터 윤리적 논쟁까지 — BRIC