단백질 3차원 구조의 비밀 (5) "단백질 구조를 해독하는 AI의 중요성"

문광주 기자 / 기사승인 : 2022-02-26 22:54:24
  • -
  • +
  • 인쇄
3'00" 읽기
- 단백질 3차원 구조는 근육 단백질인 미오글로빈의 구조를 존 켄드류(John Kendrew)가 1958년에 처음으로 해명
- 접힘의 해독은 X선 결정학, 핵자기 공명 분광법(NMR 분광법)과 같은 복잡하고 비용이 많이 드는 방법을 통해서만 가능
_ AlphaFold 와 DeepMind의 AI 역할이 중대한 돌파구 마련

단백질 접힘을 해독하는 AI, 단백질의 3차원 구조 예측

단백질 구조의 해독은 생체 분자의 기능과 우리 몸의 분자 메커니즘을 더 이해하기 위해 매우 중요하다. 이것은 약물 개발에 특히 중요하다. 왜냐하면 영어 이름 "structure-based drug design 구조 기반 약물 디자인"이 이미 암시하듯이 대부분의 약물은 효과가 시작되는 단백질의 구조를 기반으로 하기 때문이다.  

▲ 단백질 결정을 통해 X선 조사 후 단백질 구조에 대한 통찰력을 얻을 수 있다. 그러나 그것들을 만드는 것은 복잡한 작업이다. © gemeinfrei

병원체의 단백질에 대한 항생제.

한 가지 예는 바이러스의 핵심 효소를 차단하는 일반적인 항 HIV 약물이다. 이러한 약물을 개발하기 위해서는 먼저 표적 단백질(이 경우 HIV 프로테아제)의 구조를 규명해야 한다.

구조 설명은 까다로운 작업이다.

단백질의 3차원 구조는 근육 단백질인 미오글로빈의 구조를 해명한 존 켄드류(John Kendrew)에 의해 1958년에 처음으로 해명됐다. 이러한 접힘의 해독은 X선 결정학 또는 핵자기 공명 분광법(NMR 분광법)과 같은 복잡하고 비용이 많이 드는 방법을 통해서만 가능하다.

단백질 데이터베이스 PDB에 있는 대부분의 단백질 구조는 단백질 결정에 대한 X선 회절을 사용하여 해독됐다. 이러한 현상은 단백질 용액이 제어된 방식으로 증발되도록 하여 단백질 농도를 서서히 증가시켜 구조적으로 동일한 단백질 분자가 결정을 형성할 때 발생한다.

단백질 결정은 과학자들이 구조적 모델로 해석할 수 있는 특징적인 방식으로 X선을 회절시킨다. 그러나 단백질 결정화를 위한 최적의 조건을 찾는 것은 시행착오 방식을 따르며 때로는 매우 오랜 시간이 걸릴 수 있다.

따라서 아미노산의 순서를 기반으로 완성된 단백질이 취할 형태를 예측할 수 있다면 더 좋을 것이다. 그러나 이 구조적 예측은 생화학에서 가장 큰 도전 중 하나다. 수백 개의 아미노산을 가진 단백질의 경우 천문학적으로 많은 공간 배열 조합이 있지만 그중 하나 만이 단백질의 고유한 접힘을 반영한다.

인공 지능을 이용한 구조 분석

인공 지능 AlphaFold(알파폴드)의 개발과 함께 Google 자회사 DeepMind(딥마인드)의 소프트웨어 개발자는 아미노산 서열만 기반으로 구조를 예측하는 특별한 도전에 착수했다. AI 시스템은 신경망이 규칙성을 인식하고 보편적 법칙으로 이해하도록 알려진 데이터로 훈련되는 특별한 형태의 머신 러닝인 딥 러닝을 기반으로 한다.
▲ 신경망은 단백질 접힘의 규칙성을 인식하고 단백질 구조를 예측할 수 있다. © imaginima / iStock

예를 들어 AlphaFold는 AI가 단백질 접힘의 규칙성을 인식할 수 있도록 17만 개의 단백질 서열과 해명된 구조로 훈련되었다. 신경망이 훈련 후 알려지지 않은 아미노산 서열을 받으면 이전에 학습한 규칙과 가장 근접하게 일치하는 단백질 구조를 할당할 수 있다.

DeepMind 팀은 2020년 글로벌 CASP(Critical Assessment of Protein Structure Prediction) 대회에서 뛰어난 결과를 보여주었다. 이 대회에서 연구 그룹은 구조가 이미 밝혀졌지만 아직 공개되지 않은 단백질의 아미노산 서열을 받는다. AlphaFold의 예측과 실험적 구조 데이터를 비교하면 인공 지능이 100개 아미노산 서열 중 70개에 대한 구조를 정확하게 예측할 수 있음이 밝혀졌다. 실험실에서 실험적 방법을 사용하는 구조 분석가는 이를 수행하는 데 몇 년이 걸렸을 것이다.

메릴랜드 대학의 연구원들이 만든 AI 시스템 RoseTTAFold도 단백질 접힘의 숨겨진 법칙을 인식하고 CASP 대회에서 좋은 성과를 거두었다. 둘 다 AI 시스템의 도움으로 단백질 구조를 해독한 전문 잡지 "Science"에 의해 2021년의 돌파구로 선정됐다. (끝)

[더사이언스플러스=문광주 기자]

[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

Basic Science

+

AI & Tech

+

Photos

+