top of page

단백질 구조 예측의 진화: 알파폴드 3 (Alphafold 3)



작년 말, 딥마인드(DeepMind)에서는 자사에서 내놓은 혁신적인 단백질 구조 예측 시스템인 알파폴드(Alphafold)의 최신버전을 공개했다. '알파폴드 3'으로 알려진 이 새로운 버전은 단백질뿐만 아니라 다른 중요한 생물학적 분자들의 구조를 높은 정확도로 예측하는 능력을 선보이며 한번 더 관련 분야의 큰 발전을 보여 주었다. Cryo-EM으로 얻어진 TnsB transposase와 strand transfer DNA와의 복합체 구조 (PDB ID 8AA5). 알파폴드 3에 의해 예측된 구조는 이 구조와 정확히 일치하여 알파폴드 3의 구조 예측 모델의 발전을 보여 주고 있다.



짧은 역사지만 굵직한 발전을 이룬 알파폴드


단백질은 거의 모든 생물학적 과정에 관여하여 핵심적인 역할을 수행하는 분자이다. 단백질의 구조와 기능의 연구는 생명

과학의 중심을 차지하고 있고, 이러한 연구 결과는 다양한 과학 분야에 유용한 정보를 제공하고 활용된다. 특히 신약 개발

과정에서의 단백질의 구조 정보는 없어서는 안될 핵심 영역을 차지하고 있다. 그러나 단백질의 3차원 구조를 결정하는 과정에는 상당한 연구 기간과 비용이 들고, 구조 결정에 실패하는 경우도 많다.

2020년에 등장한 알파폴드는 인공지능(AI)에게 난제로 여겨지던 단백질 구조 예측을 안정적으로 수행하며 관련 분야에 혁신을 가져왔다. 알파폴드는 알려진 단백질 구조(현재 Protein Data Bank에는 약 21만개의 구조가 등록되어 있음)를 학습하는 딥러닝 알고리즘을 사용하여 새로운 단백질의 구조 예측을 가능하게 했다. 이를 통해 현재 가장 정확한 단백질 예측 도구로 자기 매김을 하였다. 최초의 알파폴드 버전이 공개된 이후, 이를 활용하여 신약 개발이나 새로운 효소 발굴 등을 위한 다양한 시도가 진행되고 있다. 그러나 혁신적인 구조 예측 기술의 발전에도 불구하고, 실제 중요 연구 분야에서의 활용까지는 여전히 기술적 한계가 존재했다.

이러한 기술적 수요와의 갭을 메우기 위해 꾸준한 개선 노력의 결과로, 얼마 지나지 않아 정확도가 더욱 향상된 버전인

알파폴드 2가 출시되었다. 2022년, 딥마인드와 유럽 생물정보학 연구센터(EMBL-EBI)는 인간, 대장균, 초파리 등 거의 모든 생물체의 단백질에 대한 알파폴드 2의 예측을 담은 개방형 데이터베이스를 출시했다. 이 귀중한 자료는 이미 전 세계 140만 명 이상의 사용자가 이용하고 있다. 또한 이 구조 정보는 새로운 말라리아 백신 및 항암 신약 개발과 환경 오염에 대한 대책으로 플라스틱 분해 효소 개발까지 매우 중요한 연구에 핵심적인 데이터를 제공하고 있다.



또 한번의 괄목할 만한 발전


알파폴드 2의 기능은 개별 단백질의 구조와 여러 단백질 사슬로 구성된 복합체의 구조를 예측하는 데 국한되어 있다. 그

또한 놀라운 성과이지만, 세포는 단백질만으로 내부의 복잡한 과정을 수행하는 것이 아니다. 세포 내에서는 리간드(Ligand)라는 저분자 화합물 등의 물질들이 단백질과 상호작용하며 그 기능을 조절한다. 이러한 상호작용에 기반한 단백질의 기능 조절은 약물 개발의 근간을 이루는 중요한 개념이다. 또한 단백질 생성의 시작점이 되는 DNA와 세포 내 단백질 발현 명령의 중간 생성물인 RNA 등의 핵산들도 단백질과 함께 핵심적인 생분자이다. 여기에 추가하여, 단백질은 생성된 이후에 번역 후 변형(Post-translational modifications)이라는 화학적 변화를 거쳐 그 기능이 더욱 다양해 지는데, 이 과정을 거쳐야 실제 단백질의 기능이 나온다고 해도 과언이 아닐 정도로 중요한 과정이다.

알파폴드 3는 처음으로 이 모든 영역에 걸쳐 정확한 구조 예측을 실시함으로써 기존 기술의 한계를 뛰어넘는 시도를 하였다. 알파폴드 연구진은 기존 시스템의 한계를 정확히 분석하고, 해결 방안을 모색하여 알파폴드 3이 단백질뿐만 아니라 소분자 리간드, 핵산 사슬, 번역 후 변형된 단백질 구조 예측이 가능한 모델임을 입증했다.

알파폴드 3은 기존의 경직된 단백질 구조나 알려진 리간드 결합 부위에 대한 정보를 사용하지 않고 예측을 수행했음에도 불구하고, 신약 개발 연구에 사용되는 특수 시뮬레이션 기법인 분자 도킹(Molecular docking)을 능가하는 성능을 발휘했다. 분자 도킹이 경직된 단백질 환경만을 탐색할 수 있는 반면, 알파폴드 3은 단백질과 리간드 모두를 완전히 유연한 상태에서 모델링할 수 있다. DNA, RNA와 같은 핵산도 원자 단위의 정밀도로 모델링할 수 있음을 보였고, 일반적인 번역 후 변형을 포함하는 단백질의 경우, 정확도가 이전 모델보다 월등히 향상되어 알파폴드의 기존의 단백질 구조 예측 능력과 동등한 수준에 도달했다.



다음의 혁신을 기대하며


알파폴드 3이 단백질, 신약, 분자생물학 전반에 걸친 예측 능력의 새로운 지평을 열면서, 연구자들은 최근에 자연어 처리와 이미지 해석과 같은 분야에서 인공지능 혁신이 일어났듯이 이에 버금가는 생물학적 이해의 혁명이 일어날 것으로 예상하고 있다. 딥마인드의 공동 책임자 중 한 명은 알파폴드 3이 인공지능을 기반으로 한 "디지털 생물학"의 시대를 앞당겼다고 언급했다. 알파폴드 3은 새로운 효소를 설계하고, 복잡한 질병 메커니즘을 밝혀내며, 가까운 미래에 신약을 설계하는 것도 가능하게 할 것으로 기대를 모으고 있다.

알파폴드 3과 같은 단백질 구조 예측 도구는 이미 거의 모든 화학 및 생물학 분야를 상상 이상으로 발전시키고 있다. 아직은 모든 단백질의 복합 구조를 예측하지는 못하지만, 최근 몇 년간의 관련 연구의 발전 양상을 볼 때 머지 않아 또 다른

새로운 예측 모델이 공개될 것으로 기대된다. 이러한 인공지능에 의존한 구조 예측 도구가 과거에서처럼 또 한번의 벽에 가로막힐지, 아니면 기대했던 만큼 과학 분야에 큰 혁신을 가져올지, 전 세계가 주목하고 있다.



Comments


bottom of page