구조생물학

AlphaFold 이후의 구조 생물학: 무엇이 달라졌나

AlphaFold가 구조 생물학에 가져온 변화와 남아있는 한계. AlphaFold3, ESMFold까지 최신 동향을 정리했다.

·6 min read
#AlphaFold#protein structure prediction#structural biology#deep learning

2020년 CASP14에서 AlphaFold2가 보여준 성능은 구조 생물학의 판도를 바꿔놓았다. X선 결정학이나 cryo-EM으로 수년에 걸쳐 풀어야 했던 단백질 구조를 컴퓨터가 몇 분 만에 예측해버린 것이다. 그로부터 수년이 지난 지금, 구조 생물학 필드는 어떻게 변했을까.

AlphaFold가 바꾼 것들

Protein structure prediction using AlphaFold AI model

Computational structural biology and protein folding

가장 직접적인 변화는 구조 데이터의 폭발적 증가다. AlphaFold Protein Structure Database에는 이제 2억 개 이상의 예측 구조가 올라와 있다. 예전에는 구조가 풀리지 않아서 연구가 막혔던 단백질도, 이제는 합리적인 수준의 구조 모델을 갖고 시작할 수 있다.

약물 설계에서도 영향이 크다. 타겟 단백질의 구조를 기반으로 한 **구조 기반 약물 설계(SBDD)**가 훨씬 접근하기 쉬워졌다. AlphaFold 구조를 가지고 도킹이나 가상 스크리닝을 시작하는 프로젝트가 급증했다.

AlphaFold의 한계

물론 AlphaFold가 모든 문제를 해결한 건 아니다. 몇 가지 중요한 한계가 있다:

  • 동적 구조(dynamics): AlphaFold는 하나의 정적 구조를 예측한다. 하지만 단백질은 여러 형태(conformations) 사이를 오가며 기능하고, 이 동적 측면은 아직 잘 포착하지 못한다.

  • 리간드 결합 구조: AlphaFold2는 apo 형태(리간드 없는 상태)를 예측하는 경향이 있어서, 약물 결합 포켓의 세부 구조가 실험 구조와 다를 수 있다.

  • 무질서 영역(disordered regions): 본질적으로 무질서한(intrinsically disordered) 영역은 예측 신뢰도가 낮다. 다만 이건 예측의 실패가 아니라 해당 영역이 실제로 고정된 구조를 갖지 않기 때문이다.

  • 돌연변이 효과: 단일 아미노산 치환이 구조에 미치는 미세한 영향을 정확히 포착하는 데는 아직 한계가 있다.

AlphaFold3와 그 너머

AlphaFold3는 단백질뿐 아니라 DNA, RNA, 소분자, 이온과의 복합체 구조를 예측할 수 있도록 확장되었다. 이는 약물-타겟 상호작용을 예측하는 데 직접적으로 활용될 수 있어서, 구조 기반 약물 설계의 새로운 가능성을 열었다.

한편 ESMFold는 언어 모델 기반으로 MSA(다중 서열 정렬) 없이도 구조를 예측할 수 있어서, 속도 면에서 AlphaFold보다 훨씬 빠르다. 정확도는 약간 떨어지지만, 대규모 메타유전체 데이터에서 신규 단백질 구조를 탐색하는 데는 ESMFold가 더 실용적이다.

실험 구조 생물학의 미래

AlphaFold 때문에 실험 구조 생물학이 사라질 거라는 말은 과장이다. 오히려 cryo-EM은 계속 성장하고 있다. 분해능이 향상되면서 약물 분자 수준의 디테일을 볼 수 있게 되었고, 대형 복합체나 막단백질의 구조를 푸는 데는 여전히 실험 방법이 필수적이다.

앞으로 구조 생물학은 AI 예측과 실험적 검증이 시너지를 내는 방향으로 발전할 것이다. AlphaFold로 빠르게 가설을 세우고, 실험으로 확인하고, 그 결과로 다시 모델을 개선하는 순환이 이미 시작되었다.

📚 참고 데이터베이스: PubMed | UniProt | Nature


관련 읽을거리

관련 글