AI (인공지능) 시스템이 단백질 코드를 해독 (동영상)

편집국 기자 / 기사승인 : 2020-12-02 16:46:54
  • -
  • +
  • 인쇄
(3분 읽기+7분 54초 동영상)
전통적인 방법으로 수 년이 걸릴 작업. 아미노산 서열만으로 단백질 구조 예측.
구글 딥마인드‘AlphaFold’AI 시스템의 쾌거라고 자타가 인정.

AI 시스템이 단백질 코드를 해독
AlphaFold는 전례 없는 정밀도로 단백질 폴딩을 해독할 수 있다.


흥미로운 돌파구 :
아미노산 서열을 기반으로 한 단백질의 3차원 구조를 예측하는 것은 생화학에서 가장 큰 도전 중 하나다. 최근 인공 지능은 이전에는 결코 달성할 수 없었던 정확도로 이를 수행하는 데 성공했다. 구글의 자회사 딥마인드(DeepMind)의 ‘AlphaFold’ AI 시스템은 90개 이상의 정확도 값으로 100개의 알려지지 않은 단백질 중 70개의 구조를 예측했다. 전통적인 방법을 사용하는 연구자들이 이를 수행하려면 일반적으로 수년이 필요하다. 

▲ 단백질의 복잡한 접힘 만이 그 기능을 결정했다. 그러나이 3 차원 구조를 해독하는 것은 매우 복잡하다.

단백질은 우리 삶의 구성 요소이며 거의 모든 신체 기능이 단백질을 기반으로 한다.
단백질의 3차원 구조는 기능에 결정적이다. 그러나 지금까지 이러한 필수 분자 중 약 1%의 3 차원 구조만 알려져 있다. 그 이유는 "단지" 단백질은 아미노산 사슬로 구성되어 있으며 그 서열은 유전적 구성 지침에서 비롯된다.
이 아미노산 사슬이 어떻게 접히는지는 여러 요인에 따라 달라지며 오랫동안 거의 예측할 수없는 것으로 여겼다.

1969년에 생화학자인 Cyrus Levinthal은 전형적인 단백질에 대해 가능한 구성의 10에서 300의 제곱이 있다고 추정했다. 이는 전체 우주에 있는 별보다 더 많은 것이다.
“이 구조는 물리학 법칙에 의해 분명하게 주어졌지만 양자 역학의 기본 공식에 기반한 계산은 절망적인 것으로 간주되어야 한다. 이를 위해 필요한 컴퓨팅 노력은 엄청날 것이다”고 Max Planck Institute for Biochemistry의 Jürgen Cox는 설명했다.

이것이 바로 아미노산 서열만을 기반으로 한 단백질 구조의 예측이 생물학에서 일종의 "성배"로 간주되는 이유다.

구조 분석가로서의 신경망

이제 인공 지능이 이 성배에 도달하는 데 결정적인 한 걸음 더 가까워졌을 수 있다.
적응형 AI 시스템은 AlphaGo 및 AlphaZero 시스템이 시작된 Google / Alphabet의 AI 연구 센터 DeepMind에서 개발했다.
"AlphaFold"는 17만 개의 알려진 단백질 구조의 도움을 받아 단백질 폴딩의 법칙을 인식하도록 훈련된 신경망이다.

"접힌 단백질은 아미노산 잔기가 모서리를 형성하고 이들 사이의 연결이 모서리를 형성하는 3 차원 그래프로 생각할 수 있다"고 DeepMind의 블로거는 말했다. 'AlphaFold'는 이 그래프의 구조를 해석하면서 점차 그래프를 작성하려고 한다.“
계속해서 비교함으로써 시스템은 암시적으로 학습한 규칙과 가장 근접한 구조를 개발한다.

100점 만점에 92점

AI 시스템은 이제 글로벌 CASP (단백질 구조 예측의 중요 평가) 경쟁에서 AlphaFold가 얼마나 성공적인지 입증했다.
여기에서 연구 그룹은 3차원 구조가 발표되지 않은 단백질의 아미노산 서열을 받는다.
이제 당신의 임무는 컨볼루션을 예측하는 것이다. 그런 다음 결과를 실험 데이터와 비교한다. 소위 글로벌 거리 테스트 (GDT)는 단백질 성분의 예측 위치가 실제 위치에 얼마나 가까운지를 나타낸다.
▲ 올해의 CAPS 대회에서 AlphaFold의 성과 및 전년도 최고의 결과. © AlphaFold / DeepMind

올해 결과 :
AlphaFold는 100개의 단백질 서열 중 70개의 구조를 고정밀로 예측할 수 있었다.
가능한 100개 중 평균 92.4 GDT 포인트를 달성했다. 균열하기 어려운 것으로 분류된 구조물의 경우 평균 85 GDT였다. AlphaFold는 이전에 이 대회에서 달성한 모든 값보다 훨씬 앞서고 수년간의 실험 분석을 통해서만 얻을 수 있는 정밀도에 가깝다.

"진정한 게임 체인저“

Max Planck Institute for Developmental Biology의 Andrei Lupas와 CASP 대회의 평가자 중 한 명은 “이것은 진정한 게임 체인저다. 다른 과학자들도 이와 비슷하게 생각한다"고 말했다. "와! 이것은 돌파구다! 물론 구조 예측 문제가 최종적으로 해결되기 전에 개선해야 할 한계와 측면이 있지만 AlphaFold의 정확성과 성공률은 타의 추종을 불허한다”고 EMBL (European Molecular Biology Laboratory)의 Jan Kosinski는 말했다.

아미노산 서열을 기반으로 단백질 구조를 예측하는 능력은 기초 연구 및 의학 분야에서 새로운 가능성을 열어준다.
3차원 구조는 단백질의 기능에 대한 결론을 도출 할 수 있기 때문에 많은 질병과 마찬가지로 단백질이 해야 할 일을 하고 있는지 또는 잘못 접힐 수 있는지에 대한 결론을 내릴 수 있다. 이것은 또한 새로운 치료법과 약물의 출발점을 제공한다.

단백질 구조는 현재 코로나 유행병에서 중요한 역할을 한다.
AlphaFold 팀은 이미 AI 시스템을 사용하여 돌연변이 단백질 ORF8 및 ORF3a를 포함하여 SARS-CoV-2의 여러 바이러스성 단백질 구조를 해독했다.


진행중인 작업

그러나 이것은 단백질 접힘 문제를 완전히 해결하지 못한다.
Kosinski는 다음과 같이 설명한다. “'단백질 접힘 예측'-단백질이 고유 구조를 채택하기 위해 취하는 실제 접힘 경로 매핑-단백질 구조 예측이라는 두 가지 근본적인 문제가 있다.

시퀀스를 기반으로 한다. 첫 번째 도전은 깨지는 것과는 거리가 멀지만 DeepMind는 두 번째 도전을 해결하는 데 놀라운 돌파구를 마련했다."

DeepMind 연구진은 또한 AI 시스템이 아직 개발 중이라고 강조했다.
“어떤 과학 연구와 마찬가지로 여전히 열린 질문이 있다. 단백질이 복합체를 형성하는 방법, DNA, RNA 또는 작은 분자와 상호 작용하는 방법, 모든 아미노산 측쇄의 정확한 위치를 결정할 수 있는 방법을 포함하여 아직 배워야 할 것이 많다."

출처 : DeepMind, Science Media Center

[더사이언스플러스] "No Science, No Future"

[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

Basic Science

+

AI & Tech

+

Photos

+