기사본문
[남궁석의 신약연구史]'알파폴드2' 파급효과
입력 2022-01-19 10:44 수정 2022-02-04 17:02
남궁석 SLMS(Secret Lab of Mad Scientist) 대표
지난 연재에서는 '알파폴드2'가 어떤 구조를 가지고 있으며, 이러한 구조가 어떻게 정확한 구조 예측을 가능케 하는지를 알아보았다. 그렇다면 알파폴드2의 공개 이후 구조생물학, 나아가서 생물학 전반에 알파폴드2는 어떤 영향을 끼쳤을까?
사실 알파폴드2가 놀라운 정확도로 단백질 구조를 예측할 수 있다는 것은 CASP14 결과가 공개된 2020년 12월에 알려졌지만, 실제로 알파폴드2가 과학자의 연구활동에 실질적인 영향을 주게 된 것은 2021년이 되어서였다. 2021년 7월, 딥마인드는 알파폴드2의 상세한 원리에 대한 논문을 발표하였고, 알파폴드2를 누구나 실행시켜 볼 수 있도록 이의 소스 코드를 오픈 소스로 공개했다(https://github.com/deepmind/alphafold). 딥마인드의 장담대로 알파폴드2는 매우 높은 수준의 정확도로 단백질 구조를 예측할 수 있었고, 단백질 구조 예측 자체에는 엄청난 컴퓨터 리소스가 필요한 것은 아니었고, 수백만원 정도면 누구나 마련할 수 있는 GPU가 장착된 고사양의 PC나 워크스테이션 수준의 컴퓨터에서는 무리없이 예측이 가능했다.
가장 먼저 알파폴드2의 유용성을 실감한 연구자들은 X선 결정학이나 초저온 전자현미경 등의 기술을 이용하여 실험적으로 단백질의 구조를 규명하던 구조생물학자들이었다. X선 결정학으로 단백질 구조를 풀던 사람들은 종종 단백질 결정이 회절은 잘 했지만 위상(Phase)을 찾지 못하여 구조를 규명하지 못한 프로젝트들을 가지고 있는 경우가 있다. X선 결정학에서 위상을 찾는 방법 중의 하나는 서열이 유사한(따라서 구조가 유사할 것으로 생각되는) 단백질의 구조를 검색 모델로 이용하여 검색하고, 이렇게 찾은 위상을 이용하여 전자 밀도를 계산하게 되는데, 기존의 단백질구조 예측방법으로는 미지의 단백질의 대략적인 구조 예측은 가능하지만, 이를 이용하여 위상을 검색하는 경우 어려움을 겪는 경우가 많았다. 이러한 경우 알파폴드2로 예측된 모델을 이용하여 위상을 찾는 경우 한번에 성공하는 경우가 속속 보고되었다. 수 년동안 성공하지 못했던 구조 규명이 알파폴드2의 등장에 의해서 하루아침에 성공한 셈이다.
요즘 구조생물학의 대세인 초저온 전자현미경으로 거대 단백질 복합체의 구조를 푸는 연구자들도 알파폴드2를 매우 유용하게 사용할 수 있다는 것을 알게 되었다. 초저온 전자현미경으로 구조를 푸는 것 역시 전자현미경으로 관찰된 단백질 입자의 이미지로부터 재구성된 단백질의 '윤곽' 에 모델을 구축하는 것이다. 만약 '단백질의 윤곽'이 정확하게 보이지 않는 경우에는 정확한 모델을 구축하는데 많은 시간이 소요된다. 이러한 상황에서 알파폴드2로 단백질 복합체의 개별 구성요소를 예측하고 이를 단백질의 윤곽에 맞추게 되면 구조 규명을 보다 신속하고 정확하게 할 수 있게 된다.
알파폴드2에 의해서 기존에 가능하지 않던 세포 내의 거대 구조 복합체의 구조 규명이 가능하게 된 대표적인 예로는 세포 내에서 가장 큰 복합체인 핵공 복합체(Nuclear Pore Complex)의 구조다.[1] 핵공 복합체는 세포 내에 존재하는 구조 복합체 중 가장 큰 구조물이며, 약 30종류의 단백질에 의해 구성된 약 1억2000만 킬로달톤의 분자량을 가졌다. 현재까지 구축된 핵공 복합체의 모델은 핵공 복합체를 구성하는 단백질 30종 중 약 16개만으로 구성된 모델이고, 정확한 구조가 규명되지 않은 핵공 복합체의 구성요소들은 전체 모델에 포함될 수 없었다. 독일 막스플랑크 생물물리학 연구소 연구진은 세포 내의 핵공 복합체의 전체적인 윤곽을 저온 전자 토모그래피(cryo-ET)라는 실험기술로 파악한 후, 30종류의 단백질 중 25개의 구조모델을 알파폴드2에 의해서 예측한 후, 이를 저온 전자 토모그래피로 파악한 윤곽에 맞추어 넣어 현재까지 구축된 핵공 복합체 모델 중 가장 완전한 모델을 만들 수 있게 되었다.... <계속>