본문 바로가기

바이오스펙테이터

기사본문

‘증거(evidence) 기반' 공유모델로 임상데이터 접근성 높여야

입력 2017-09-26 07:31 수정 2017-09-26 10:00

바이오스펙테이터 이은아 기자

박래웅 아주의대 교수, 임상시험 분석 결과 공유하는 OMOP-공동데이터 모델 제안

신약개발에 의료 빅데이터를 활용하려는 시도가 늘고 있지만 기업과 연구자는 임상 데이터 접근에 제약이 많다고 어려움을 토로한다. 국내 개인정보보호법 및 생명윤리안전법이 강화되면서 임상정보 교환과 공유가 어려워서다. 의료기관의 전자의무기록(EMR) 보급률도 세계 최고수준이라고 평가받고 있지만 기관별 EMR 형식이 상이해 산업적으로 활용하기 어려운 실정이다. 더구나 데이터 공유 자체를 꺼리는 인간의 본질적인 문제도 뒤따른다.

박래웅 아주의대 의료정보학과 교수는 최근 바이오스펙테이터와의 만남에서 “데이터 보유자(의료기관)와 수요자(연구자, 회사) 사이의 정보 접근성에 대한 격리가 존재한다”면서 “여기에는 제도적, 기술적, 본질적인 3가지 형태의 문제가 있다”고 지적했다.

▲박래웅 아주의대 교수

박 교수는 “보건의료 빅데이터를 표준화하고 익명화하면 기술·제도적 문제를 해소할 수 있지만 여전히 본질적인 문제 개선은 어렵다”며 “데이터 공유가 아닌 증거(Evidence)기반의 임상시험 분석 결과만을 공유하는 OMOP-공동데이터 모델(CDM, Common Data Model)로 세 가지 문제점을 동시에 해결할 수 있다”고 말했다.

OMOP-CDM(Observational Medical Outcomes Partnership-공동데이터) 모델은 관찰연구 기반으로 의료기관별 상이한 정보를 표준화된 구조인 CDM으로 변환하고 데이터 분석도구를 적용해 필요한 데이터 분석 결과 값을 공유하는 플랫폼이다.

데이터를 물리적으로 통합하거나 시스템 통일에 따라 표준화해야 한다는 기존의 틀을 깬 형태다. 각 의료기관은 CDM으로 전환한 데이터를 보유하고, 연구자는 필요한 결과 값만 요청하면 된다. 원본 데이터가 아닌 개인정보가 비식별화된 분석 결과만 공유하기 때문에 개인정보보호법 심의 대상에서 제외된다. 의료정보 빅데이터의 접근성과 활용에 대한 기술·제도적 한계를 극복할 수 있는 현실적인 대안인 셈이다.

박 교수는 “OMOP-CDM 모델은 공유하기를 기피하는 본질적인 문제도 해결할 수 있다”고 강조했다. 원천 데이터를 밖으로 내보내지 않고 해당기관에서 분석 여부를 결정한 후 분석결과만 공유하므로 각 기관은 자체 데이터 통제권을 갖게 된다. 데이터를 공유했을 때 악용되거나 해당 기관에 불리하게 작용할 두려움도 해소할 수 있다. 또한 분석결과를 공급한 기관은 다른 기관과 데이터 값을 공유할 뿐만 아니라 수익도 창출할 수 있다. 인간 본연의 정보공유에 대한 거부감을 완화시킬 수 있다는 얘기다.

개방형 공유모델인 OMOP-CDM 모델은 국내에만 국한된 게 아니다. 이미 세계적으로 의료관찰 데이터 연구지원을 위한 국제 컨소시엄인 ‘글로벌 오딧세이(OHDSI, Observational Health Data Sciences and Informatics)’가 구축돼 세계 각국의 의료 임상정보를 CDM으로 전환하고 분석 및 활용되고 있다. 연구자와 회사는 오딧세이 컨소시엄에 참여하는 기관의 데이터 결과 값을 얻을 수 있고 이를 통합해 세계 의료 빅데이터 분석이 가능하다.

최근까지 12개국 200개 이상의 기관이 참여해 6억6000만명의 환자 데이터가 구축됐다. 국내에서는 국민건강보험공단을 포함한 17개 의료기관에서 한국 오딧세이 컨소시엄에 참여한 상태다. 데이터 분석을 위한 플랫폼도 80개 정도 개발됐다. 그 중 8개는 박 교수 연구팀이 개발했다.

한국 오디세이 컨소시엄을 주도하고 있는 그는 “임상시험 설계, 신약개발, 건강관리 서비스, 암 정밀의료 서비스, 건강보험 상품 등 다양한 보건의료 분야에 적용 가능하다”고 설명했다.

그는 구체적인 활용사례를 소개했다. 새로운 복합제를 개발할 때 약물 간 상호작용은 중요한 부분이다. 특히 나이가 들수록 동반되는 질환이 많기 때문에 복합제 조합은 신중히 고려돼야한다. CDM으로 변환된 실제 진료 데이터를 통해 환자에게 동반된 질환과 병용 투여된 약물이 무엇인지, 두 가지 약물 투여시 그 효과와 부작용을 분석할 수 있다. 실제 증거를 기반으로 약물 개발 전부터 타깃을 선정하면서 시간과 비용을 줄일 수 있다.

개발경쟁이 치열한 고혈압 3제 복합제 조합에 따른 예후도 분석할 수 있다. 현재 박 교수 연구팀은 미국, 대만, 국내 기관이 참여하는 국제 다기관 연구를 진행해 한국 뿐 아니라 실제 외국에서는 환자 예후가 어떤지 분석할 예정이다.

지난해에는 박 교수팀과 콜럼비아대학 연구팀은 다기관 데이터를 통해 제2형 당뇨병, 고혈압, 우울증 등 만성질환 환자의 치료방법이 세계적으로 차이가 있다는 것을 밝혀냈다. 이 연구는 표본으로 여겨지는 무작위 임상시험에서 도출된 결과가 실제 의료 환경에서 다양한 인구집단의 치료법을 모두 제시하지는 못한다는 사실을 시사했다. 또한 단기간에 한국, 미국, 영국, 일본 등 11개 기관 2억 5천만 환자의 데이터를 대규모 관찰연구가 가능하다는 것을 확인했다.

원하는 결과 값을 얻기 위한 소프트웨어 개발도 활발하다. 박 교수팀은 네덜란드 연구팀과 공동으로 우울증 환자에게 처방되는 약이 어떤 부작용을 갖는지 알고리즘을 개발했다. 특히 이 분석도구는 정확도가 0.86일 정도로 높아 신뢰성이 높은 데이터 분석 값을 얻을 수 있다.

표준화된 EMR 기반 임상데이터는 임상시험 설계에도 활용된다. 윤덕용 아주의대 교수와 스탠다임은 AI 기반 임상시험 설계지원 솔루션인 ‘AI-클리니컬 트라이얼 서포트 시스템(CTS)’을 개발 중이다. 신약후보물질이 발굴되면 기존 약물 중 가장 유사한 물질을 찾아 후향적 연구를 기반으로 신약의 효능과 부작용을 시뮬레이션 하는 것이다. 게다가 약효가 높을 것으로 예측되는 환자 군을 제시해준다.

박 교수는 “부작용이 적고 효과가 높은 환자 군을 선택해 임상시험을 하면 당연히 신약개발 성공률은 높아진다. 점점 대상 적응증(indication)을 좁히는 추세다”며 “OMOP-CDM 데이터를 활용하면 해당 환자를 찾아주는 플랫폼도 개발할 수 있다”고 무한한 사업 가능성을 제시해줬다. 실제 미국의 한 업체는 CRO회사가 원하는 환자 군이 어느 나라, 어느 병원에 몇 명 있는지 까지 실시간으로 제공하는 플랫폼 서비스를 하고 있다. 물론 수요자는 원본 데이터가 아닌 분석 결과 값만 알 수 있다.

그는 “신뢰성이 높은 CDM 기반 데이터가 확산된다면 새로운 비즈니스도 창출 될 것이다. 데이터를 제공하는 의료기관, 데이터를 원하는 연구자와 회사, 중간에서 필요한 분석 소프트웨어를 개발하는 회사 등 모두가 상생하는 협업 생태계가 구축 될 것이다”고 강조했다.

이어서 그는 "증거(evidence) 기반 데이터로 더 나은 의사결정과 진료가 가능할 것“이라며 ”혁신성, 개방성, 재현성, 공동체 정신, 협력 정신 등은 컨소시엄의 핵심가치이자 목표다. 최종적으로 보건향상에 기여할 수 있도록 의료기관, 기업, 연구자 등이 모두 서로 협력해야한다“고 당부했다.

향후 박 교수는 데이터 질을 높이는 기술개발에 집중할 계획이다. 기관이 보유한 데이터를 CDM으로 변화했다고 해서 모든 데이터를 사용할 수 있는 것은 아니기 때문이다. 실제 데이터는 중복이나 손실 된 원본 데이터가 많다. 따라서 박 교수는 정화도 높은 분석 결과 값을 얻기 위해 데이터 질을 향상시키고, 퀄리티를 유지·관리하는 시스템 개발을 목표로 하고 있다. 또한 정성적·정량적 방법을 통해 원본데이터를 CDM으로 잘 변환됐는지 검토하는 연구도 진행 중이다.

현재 박 교수는 산업통상자원부의 분산형 바이오 빅데이터 추진TF 위원, 보건복지부 내 미래보건의료포럼의 분과장, 대한의료정보학회 이사장을 맡고 있다. 또한 박 교수 연구팀은 한국보건산업진흥원과 함께 임상 빅데이터 네트워크(OHDSI) 기반 '완전 개방형' 임상의료정보의 시각화 및 분석 서비스 플랫폼을 개발하고 있다.