본문 바로가기

바이오스펙테이터

기사본문

제바協 "연합학습 AI모델 'K-멜로디'→신약개발 가속"

입력 2023-07-05 10:10 수정 2023-07-05 10:11

바이오스펙테이터 서윤석 기자

다기관 데이터 협력, 'K-멜로디', 22개 기업 참여 예정..신약 후보물질 발굴단계서 'R&D비용 절감 및 개발성공 가능성 향상 기대'

연합학습(federate learning, FL) 기반의 실용적인 한국형 인공지능(AI) 신약개발 가속화 플랫폼 사업을 통해 국내 제약바이오 기업이 신약개발에 속도를 낼 수 있을 것으로 한국제약바이오협회와 업계는 기대하고 있다. 공식 줄범전부터 22개 기업이 참여의사를 밝히는 등 적극적인 모습을 보이고 있으며, 참가업체는 더 늘어날 것으로 전망된다.

이 사업의 핵심은 연합학습 AI 기반 신약개발 가속화 지원사업 ‘K-멜로디(MELLODDY, Machine Learning Ledger Orchestration for Drug Discovery)’다. K-멜로디는 유럽에서 진행한 EU-멜로디 사업을 참고 및 개선한 한국형 AI 신약개발 플랫폼 구축을 위한 다기관 참여형 민관협력 사업이다. K-멜로디는 △실용적 플랫폼을 구축해 내재화하고 △제약바이오 기업이 직접 참여해 보유하고 있는 신약개발 데이터를 가지고 실증·실용화하는 것이 목표다.

보건복지부와 과학기술정보통신부가 공동으로 추진하며 올해 예산심의를 마치고, 내년부터 5년간 시행될 예정이다.

연합학습(FL)은 공공기관 및 제약바이오 기업이 보유한 데이터를 직접 공유하는 것이 아닌 데이터를 학습한 AI 모델을 중앙플랫폼에 집적해 공유하는 컨셉이다. 민감한 데이터의 유출없이 독립적인 데이터로 AI모델을 학습시켜 알고리즘을 업그레이드하고 이 과정을 반복해 고성능 AI 모델을 구축하는 방식이다.

이런 부분에서 연합학습 기반의 K-멜로디는 신약 후보물질 발굴단계에서 ADMET(Absorption, Distribution, Metabolism, Excretion, Toxicity; 흡수, 분포, 대사, 배설, 독성) 등 약물대사 및 독성예측 부분에 특장점을 가지고 있다. ADMET은 신약 후보물질 선정에 중요한 요소일 뿐 아니라 임상개발에서 실패하는 주요원인으로 알려져 있으며, 높은 정밀도를 가진 ADMET 예측 AI모델에 대한 수요가 높다.

▲다기관 연합학습 AI 모델 모식도(EU 멜로디 홈페이지)

제약바이오협회 자료에 따르면 국내 신약개발 분야에서 인공지능(AI)을 이용한 후보물질 발굴을 위해 활발하게 연구협력 또는 파트너십이 이뤄지고 있으며, 최근 5년 사이에는 국내에서 AI 신약개발에 나선 기업수가 약 50여곳에 달할 정도로 빠르게 증가하고 있다. 그러나 아직까지 AI를 이용한 신약개발에서 이렇다할 성과를 보이지 못하는 한계가 있었다.

이런 AI 신약개발의 성과부진에는 AI 신약개발의 전문인력 부족, 데이터 부족과 품질문제, AI개발기업과 제약바이오 기업간 눈높이 차이 등이 복합적으로 작용하고 있다는 분석이다. 이는 한국제약바이오협회의 지난해 설문조사에 따른 것으로, ‘인공지능 도입 및 운용과정에서의 어려운 점’에 대한 조사에서 ‘인력문제’ 다음으로 ‘데이터 부족과 품질 문제’가 많이 선택됐다.

기업 간 눈높이 차이는 신약개발 과정에서의 이해도 차이로 인해 발생했다. 신약 후보물질 발굴의 초기단계에서는 물성예측, 투과도예측, 약물분포예측, 대사안정성, 독성분석 등 여러단계가 있는데, 수요자인 제약바이오 기업이 원하는 부분과 불일치가 있었던 것. AI 신약개발 기업이 신약 후보물질 발굴을 위한 AI 모델을 개발했으나 정작 고객이 원하는 상품은 아니었던 셈이다.

제약바이오협회 관계자는 “이런 AI 신약개발의 한계를 개선하기 위해서는 제약바이오 기업과 AI기업 등이 함께 참여해 신약개발의 단계에 적합한 데이터를 기반으로 한 AI모델 개발을 위한 협력과 가이드라인을 제시할 필요가 있다”며 “특히 데이터 공유에 있어 발생할 수 있는 이해관계, 규제, 법적문제 등을 해결하기 위해서 연합학습 기반의 신약개발 플랫폼이 필요하며 이를 통해 실용적인 AI 신약개발의 가속화가 가능할 것으로 기대한다”고 말했다.

(제약바이오협회)

K-멜로디, 신약 후보물질 ADMET 분석 정확도 향상..“초기 R&D 비용 절감”

K-멜로디 프로젝트에 참여한 기업들은 신약 후보물질 발굴단계에서 높은 정확성을 가진 ADMET(흡수, 분포, 대사, 배설, 독성) 분석을 통해 연구개발비 절감 및 개발성공 가능성을 높일 수 있을 것으로 예상하고 있다. 현재 K-멜로디 프로젝트에 참가의사를 밝힌 기업은 22곳으로, 각 기업이 보유한 데이터를 AI 신약개발 모델의 알고리즘의 향상을 위해 기꺼이 투척하겠다는 생각을 가지고 있는 것으로 파악됐다.

ADMET은 신약 후보물질의 발굴단계에서 분석하는 약물동태 및 독성분석으로, 임상개발 과정에서 주요 실패요인으로 알려져 있다. 특히 후보물질 발굴단계의 물질 대부분은 효과가 없거나 부작용으로 인해 임상진입 전에 개발을 중단하기도 한다. 제약바이오 기업은 활성은 좋으나 ADMET가 좋지 않은 물질의 경우 이를 개선하기 위해 오랜시간을 들이기도 하며, 시판된 약물이 시장에서 철회되는 이유도 심장독성, 간독성 등 약물독성이 주된 이유로 알려져 있다.

이런 상황에서 제약바이오 기업은 신약 후보물질 개발단계에서 높은 신뢰성을 가진 데이터 기반 ADMET 예측시스템에 대한 필요성이 가장 큰 것으로 나타났다. 제약바이오협회가 지난해 9~10월 21개 기업, 2개 연구기관, 1개 대학을 대상으로 실시한 AI 활용에 대한 수요조사결과다.

ADMET은 신약개발 전체 비용의 약 22%를 차지하는 것으로 알려져 있으며, 국내 R&D 신약개발 투자비용은 2조1193억원이다(2021년 기준). 이는 고성능의 ADMET 예측 AI 플랫폼을 구축하는 것으로 제약바이오 기업의 초기 연구개발비를 상당부분 절감할 수 있을 것으로 협회측은 내다봤다.

K-멜로디 사업에 참여하는 기업들은 정부의 연구비 지원을 받을 뿐만아니라 우선적으로 연합학습 AI 모델을 확보할 수 있는 이점이 있다. 참여기업이 직접 AI 모델을 파인튜닝하기 어려운 경우에는 예측서비스도 제공할 예정이다.

K-멜로디 사업은 제약바이오 기업과 사업을 지원하는 정부 등 민(산학연)-관 협력체계로 구성된다. 정부는 K-멜로디 사업단을 구성해 과제 총괄 및 사무국을 운영할 계획으로, 참여기관이 각각 보유한 연구 데이터를 제공하는 만큼 기업-기업 또는 기업-학계간 이해관계와 정부와의 의견조율, 데이터 기여도와 권리관계 등 원할한 운영을 위한 운영위원회를 둘 예정이다. 이해관계없이 참여기관 모두가 신뢰할 수 있는 운영기구가 필요할 것으로 여겨지는 부분이다.

협회 관계자는 “K-멜로디 플랫폼을 제대로 구축하고, 지속적으로 운영해 실질적으로 제약바이오 기업의 신약개발 가속화를 돕는 것이 목표다. 현재 22개 기업이 참여할 예정으로, 많은 기업이 참여하는 것보다 고품질의 좋은 데이터를 가진 기업이 참여하는 것이 중요하다”며 “지속적인 K-멜로디 운영으로 제약바이오 기업들의 참여가 늘고 공동개발 결과가 도출되면서 AI 신약개발의 성공사례를 확장해 나가는 것이 목표”라고 말했다.

연합학습 기반 AI 모델 개발 글로벌 동향은

연합학습(FL)을 이용한 AI 모델 개발은 유럽(EU) 미국, 일본 등에서 민감한 정보를 다루는 의료분야에서 진행되고 있다. 미국 인텔(Intel)과 펜실베니아대(UPENN)는 고형암 연구를 위한 FeTs(Federated Tumor Segmentation) 프로젝트 등을 통해 고성능 AI 모델을 개발하고 있으며, 독일 암연구 컨소시엄(DKTK)은 의료영상 공동연구 플랫폼, 프랑스는 희귀질환 치료예측 모델 개발을 위한 헬스체인 프로젝트(HealthChain Project) 등을 진행하고 있다.

신약개발 분야에서는 유럽의 EU-멜로디 프로젝트가 지난 2019~2021년 진행됐다. EU-멜로디 프로젝트는 아스트라제네카(Astrazeneca), 암젠(Amgen), 바이엘(Bayer), GSK, 얀센(Janssen) 등 10개 글로벌 빅파마와 엔비디아(Nvidia), 오우킨(Owkin), 익토스(Iktos) 등 7개 IT 기업이 참여해 공동으로 진행했다. 얀센이 산업계를 대표해 프로젝트 리더를 담당하고 오우킨은 FL기반 AI 플랫폼 개발을 조정하는 코디네이터 역할을 담당했다. EU-멜로디 프로젝트에서 연합학습을 통해 학습된 AI 모델은 각각의 제약사가 보유한 모델보다 신약 후보물질의 독성(toxicological), 약리학(pharmacological) 평가효능이 개선된 결과를 보였다.

일본은 지난 2015년부터 2020년까지 정부사업을 통해 AI 신약개발 플랫폼 SCIQUICK을 구축했다. SCIQUICK 플랫폼은 공공 데이터베이스와 7개 기업이 제공한 데이터를 기반으로 구성된 AI 모델로 ADME, 심독성, 간독성 등을 분석하는 모델로 구성돼 있다. 현재 SCIQUICK 서비스는 유료모델로 운영되고 있으며 연간 사용료 80만엔(한화 723만원), 영구사용료 200만엔(1810만원)의 이용료가 책정돼 있다. 연합학습을 이용한 AI 모델은 아니지만, 정부가 진행한 AI 모델 개발사업의 성공적인 상업화 사례다.