이 AI는 수십 년 전 과학자들이 예측했던 단백질 구조를 단 몇 분 만에 예측했습니다.

이 AI는 수십 년 전 과학자들이 하던 단백질 구조를 단 몇 분 만에 예측했습니다.

DeepMind의 AlphaFold 3는 21세기 가장 심오한 과학적 혁신 중 하나입니다. 이 인공지능 시스템은 단백질이 어떻게 3차원 형태로 접히는지 수개월의 실험실 작업과 수백만 달러의 장비가 필요한 실험 방법에 필적하는 정확도로 예측할 수 있습니다. 이 시스템은 이미 2억 개가 넘는 단백질의 구조를 예측하여 현대 생물학에서 접근 가능한 단백질의 전체 세계를 매핑했습니다.

단백질은 생명체의 분자 기계입니다. 음식 소화부터 감염 퇴치까지 모든 생물학적 기능은 특정 기능을 수행하는 단백질에 달려 있습니다. 단백질의 기능은 전적으로 3차원 형태에 의해 결정되며, 이는 단백질 사슬을 구성하는 아미노산의 순서에 의해 결정됩니다. 문제는 일반적인 단백질은 수백 개의 아미노산으로 구성되어 있으며, 사슬은 천문학적인 수의 가능한 형태로 접힐 수 있다는 것입니다. 무작위 시행착오를 통해 올바른 형태를 찾는 데는 우주의 나이보다 더 오랜 시간이 걸릴 것입니다.

수십 년 동안 과학자들은 X선 결정학, 핵자기공명, 그리고 저온전자현미경을 이용하여 단백질 구조를 실험적으로 규명해 왔습니다. 이러한 방법들은 대량의 단백질을 정제하고, 특정 방향으로 결정을 형성하거나 동결시킨 후, X선이나 전자가 시료에서 어떻게 산란되는지 분석해야 합니다. 이 과정은 매우 까다롭습니다. 단일 단백질 구조를 규명하는 데 연구자의 경력 중 수년이 소요될 수 있습니다. 실험적으로 규명된 모든 구조를 보관하는 단백질 데이터 뱅크(Protein Data Bank)에는 50년 동안 축적된 약 20만 개의 항목이 있습니다.

AlphaFold 3는 딥러닝을 통해 이 문제에 접근합니다. 이 시스템은 20만 개의 알려진 단백질 구조를 학습하여 단백질 접힘 방식을 지배하는 물리적, 화학적 원리를 학습했습니다. 아미노산 서열과 구조적 특징 사이의 패턴을 식별하여, 본질적으로 예시를 통해 단백질 접힘 규칙을 역공학적으로 해석합니다. 신경망 구조는 단백질의 여러 부분이 서로 어떻게 상호작용하는지 모델링하는 주의 메커니즘을 포함하고 있으며, 살아있는 세포에서 접힘을 유도하는 물리적 힘을 모방합니다.

예측 과정은 놀라울 정도로 빠릅니다. 단백질의 아미노산 서열을 입력하면 AlphaFold 3는 몇 분 안에 예측된 3차원 구조를 출력하며, 구조의 어떤 부분이 확실하고 어떤 부분이 모호한지를 나타내는 신뢰도 점수도 함께 제공합니다. 대부분의 단백질의 경우, 예측은 원자 분해능 내에서 정확합니다. 즉, 예측된 원자 위치가 실험 구조와 몇 옹스트롬(원자 지름과 거의 같은 크기)만큼 차이가 난다는 것을 의미합니다.

생물학 연구에 미치는 영향은 아무리 강조해도 지나치지 않습니다. 약물 개발자들은 AlphaFold를 사용하여 잠재적인 약물이 질병을 유발하는 단백질에 결합할 수 있는 결합 부위를 식별합니다. 암 연구자들은 종양이 정상적인 세포 조절을 어떻게 회피하는지 이해하기 위해 돌연변이 단백질의 구조를 매핑하고 있습니다. 효소 엔지니어들은 천연 효소가 어떻게 놀라운 효율을 달성하는지 정확히 이해함으로써 산업 공정을 위한 향상된 촉매를 설계하고 있습니다. 진화 생물학자들은 유기체 전반의 단백질 구조를 비교하여 종 간의 관계를 추적하고 있습니다.

이러한 단백질 예측을 실행하는 서버 랙에 작은 영국 국기가 표시된 런던의 DeepMind 개발 연구소는 전 세계 연구자들의 매일 수만 건의 구조 요청을 처리합니다. AlphaFold 데이터베이스 전체는 전 세계 과학자들이 자유롭게 이용할 수 있습니다. 학계 연구자, 제약 회사, 바이오테크 스타트업 모두 이를 동등하게 활용하고 있습니다. 이러한 오픈 액세스 방식은 구조 생물학 분야 전반에 걸쳐 발전을 가속화했습니다.

AlphaFold 3는 개별 단백질을 넘어 단백질이 DNA, RNA, 그리고 작은 화합물을 포함한 다른 분자들과 어떻게 상호작용하는지 예측합니다. 이러한 기능을 통해 연구자들은 여러 단백질이 함께 작용하는 복잡한 생물학적 시스템을 이해할 수 있습니다. 예를 들어, 이 시스템은 세포핵으로 들어오고 나가는 것을 제어하는 ​​수십 개의 단백질로 구성된 거대한 집합체인 핵공 복합체의 구조를 파악하는 데 도움이 되었습니다. 이 구조는 그 크기와 복잡성으로 인해 수십 년 동안 실험적으로 규명되지 못했습니다.

비평가들은 구조를 예측하는 것이 기능을 이해하는 것과는 다르다는 점을 정확히 지적합니다. 단백질은 역동적이며, 작동하면서 모양이 변하는데, AlphaFold는 정적인 스냅샷을 포착합니다. 이 시스템은 때때로 열역학적으로는 가능하지만 생물학적으로는 무관한 구조를 예측하기도 합니다. 이러한 한계에도 불구하고 AlphaFold는 수십 년간의 구조 생물학 연구를 단 몇 년 만에 압축했습니다. 이는 인공지능이 인간의 능력을 근본적으로 뛰어넘는 것처럼 보였던 문제들을 무차별 대입 계산이 아닌 자연계를 지배하는 기본 원리를 학습함으로써 해결할 수 있다는 증거입니다.

📊 데이터 출처: DeepMind / Nature Journal (2024)

#️⃣ 해시태그:

출처: https://www.facebook.com/ItisaScience/posts/pfbid02fK75sqNJSUBxLZ2MQkx6W5KVJWK75Emig6kbpGz8ETQ9K2W27gd9cCR2jeLLEWqQl

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요