본문 바로가기

바이오스펙테이터

기사본문

[김태형의 게놈이야기]美 'ASHG2018' 4가지 키워드

입력 2018-10-30 09:23 수정 2018-10-31 05:32

김태형 테라젠이텍스 이사

유전체기반 신약개발-대규모 유전체 연구-연구·산업계 협력연구-아프리카인 유전체 연구

미국 캘리포니아주 샌디에이고 컨벤션 센터에서는 지난 10월 16일부터 10월 20일까지 5일간 세계 최대 규모 인간 유전학 컨퍼런스인 'ASHG 2018'이 진행됐다.

일 년 내내 온화하고 강우량이 적은 휴양지로 유명한 샌디에이고에서 학회가 있는 일주일 동안 날씨, 온도(14~27 도), 습도 모두 최고를 유지해 행복하게 즐길 수 있었다. 컨퍼런스가 열리는 컨벤션 센터는 샌디에이고 베이(San Diego Bay)를 배경으로 자리를 잡고 있어 신선한 공기와 함께 생애 처음으로 보는 초호화 요트들이 펼쳐진 멋진 풍경을 감상하기도 했다.

전 세계 유전학자들의 강연과 포스터들을 접하며 매일 열리는 다양한 조찬 세미나 및 리셉션을 참여하고 비영리/영리 기관들이 준비한 발표와 음식을 즐기면서, 또 말로만 듣던 샌디에이고에서 만들어진 과일 또는 꽃향기가 나는 다양한 IPA 맥주를 맘껏 마시면서 연구자들과 즐거운 네트워킹을 할 수 있었다.

그리고 전 세계 흩어져 있는 한국인 유전학 연구자들이 모이는 한국인의 밤 행사를 통해 한국 연구자들과 교류하는 시간도 가졌다. 특히 내가 소속된 팀에서 준비하는 유전체 기반 신약개발 및 임상시험 내용을 소개하고 관련 분야 전문가들과도 네트워킹 할 수 있어 개인적으로도 매우 뜻깊은 시간이었다.

이번 ASHG(The American Society of Human Genetics)는 68번째 개최된 컨퍼런스로 약 9000 명의 연구자들이 참여했다.

▲학회장에서 내려다 보이는 샌디에이고 베이(San Diego Bay)

이 학회에서는 81개 국가에서 참여한 6500명(기초연구자 60%, 임상/카운슬링 30%, 교육기관 10%)의 유전학 연구자가 기조, 초청, 일반 발표로 약 380건의 구두 학술 발표와 함께 약 3200건의 학술 포스터 발표를 진행했다. 또한 250개 회사/연구소 부스가 열렸으며 그와 관련자들이 참여한 세계 최대 규모의 인간 유전학 컨퍼런스가 진행됐다.

이번 컨퍼런스의 주요 내용을 4 가지 키워드로 정리하면 '유전체 기반 신약개발', '대규모 유전체 연구', '연구계와 산업계 협력 연구', '아프리카인 유전체 연구'이다.

본론으로 들어가 주요 학회 내용을 소개해보고자 한다.

유전체 기반 신약개발(리제네론, 글락소스미스클라인, 바이오젠, 개인 유전체 맞춤 치료)

리제네론 유전학 센터(Regeneron Genetics Center, RGC) 팀의 의사 출신 연구소장인 알란 박사(Alan R. Shuldiner)는 희귀 변이와 약물 타겟 발굴을 위해 다양한 통계학적 인구집단을 기반으로 한 연구결과를 발표했는데 매우 인상적이었다.

리제네론은 2003년 가계 연구 기반으로 PCSK9 유전자가 가족성 고콜레스테롤혈증(familial hypercholesterolemia)과 관련돼 있음을 밝혔으며 2006년에는 집단연구를 통해 PCSK9의 LoF(Loss of Function) 변이가 관상동맥질환(CAD)에서 88% 감소하는 것을 확인해 이때부터 다양한 임상적 개념 증명(proof of concept, POC)을 통해 밝혀 나가면서 약물 타겟의 새로운 적응증을 넓혀나갔다. 이를 다시 인간 집단연구와 마우스 실험을 통해 증명한 약물유전체 바이오마커를 개발해 특정 약물의 반응성에 대해 예측하는 모델을 개발함으로써 궁극적으로 특정 약물에 반응하는 환자와 비반응 환자들을 분류하는 약물 개발 시스템을 구축했다.

리제네론은 이를 대규모 코호트 기반으로 연구를 진행하기로 했으며 현재 60여 개 이상의 아카데믹 협력기관(가이징어, UK바이오뱅크, 메이요클리닉, 펜실베이니아 대학, 베일러 의과 대학, 유타 대학 헬스케어 센터 등)과 협력해 30만 건이 넘는 전장 엑솜 해독(WES)/임상정보를 확보했다. 유전형과 표현형의 연관성을 찾는 연구에 가장 많은 투자를 하는 리제네론은 유전체 기반 신약개발에 있어 가장 앞서 있는 제약회사로 보인다.

그 중 가장 대표적인 사례로 가이징어와의 DiscovEHR 프로젝트 협력이 있으며 현재 15만 명 이상의 코호트를 확보하고 여기서 9만 명 이상의 WES 및 EHR 데이터를 확보해 다양한 연구를 진행 중이며 이들 임상 참여자 중에 92%가 1개 이상의 heterozygous LoF, 7% 정도에서 homozygous LoF를 발견되었고, 약 3.5%가 ACMG/GHS76 유전자에 임상적 조치 가능한 결과(actionable result) 들을 받을 수 있었다.

알란 박사는 또한 15세대 전에 스위스에서 200~600명 정도의 규모로 미국에 이민 온 4만 명 규모의 아미쉬(Amish) 인구 집단에 관한 유전학 연구를 진행 중이라고 했다. 이를 통해 관상동맥질환을 감소시키는 APOC3 유전자의 R19X 유전자 변이가 아미쉬 그룹에만 특이적으로 25명 중 1명이 발견됐으며 고콜레스테롤혈증의 원인이 되는 APOB 유전자의 R3527Q 변이는 8명 중에서 1명 정도 발견됐다고 했다.

이번 컨퍼런스에서는 아미쉬 인구 집단 6216명을 WES 분석을 통해 다양한 질환과 관련된 새로운 유전자들과 변이들을 보고했다. 가까운 미래의 치료제 개발은 인간 유전체 연구가 병행돼야 함을 당연시하고 이를 강조했다.

▲리제네론 유전학 센터(Regeneron Genetics Center, RGC)장 알란 박사 발표

글락소미스클라인(GSK)의 유전학 연구소장인 매트 넬손(Matt Nelson)은 기존 GWAS 코호트와 대규모 바이오뱅크 코호트 데이터에서 발견된 유전학적 연관성을 활용해 PheWAS 접근을 통한 각 변이들의 유전학적 효과(genetic impact)를 계산하고 이를 유전자 편집과 HT 에세이 등을 이용해 기능을 검증하는 방식으로 약물 타겟을 선별하는 유전체 데이터 기반의 약물 개발 과정을 소개했다.

그리고 최근에 23andMe와 유전체 기반의 신약개발을 위한 협력체계를 자세히 소개하면서 자신들의 신약개발 경쟁력이 있음을 계속해서 강조했다.

바이오젠(Biogen) 연구자인 헤이코 런즈(Heiko Runz) 박사는 4개의 큰 규모의 코호트(23andMe, UK Biobank, FINRISK, CHOP)와 44개의 GWAS 연구결과를 바탕으로 약 70만 명 데이터를 활용해 145개 일반 질환 적응증에 대한 메타분석을 이용해 PheWAS 스터디를 진행했으며 19개의 치료제 후보 타겟이 25개 SNP와 연관되어 있음을 밝혔다. 알려진 다른 GWAS 연구에서도 이 결과들이 75% 재현성 있음을 확인했다.

이를 통해 약물기전을 밝히거나, 대체 적응증을 찾거나, 약물 부작용을 예측하는 데 사용할 수 있을 것으로 보이며 특히 이런 바이오뱅크 코호트는 여러 표현형에 대한 정보를 전체적으로 볼 수가 있으며 다양한 GWAS trait 결과들이 잘 정리되어 있고, 특히 샘플 사이즈가 매우 크며 환자 중심으로 데이터가 모여 있어 약을 개발하는데 매우 유용하다는 것을 증명했다. 이를 통해 더 빠르고 적은 비용으로 치료제를 개발하는데 크게 도움이 될 것으로 보인다.

다른 발표로 원인을 모르는 질병에 대해서 정확한 진단과 함께 그 환자에 적합한 약물치료를 가능하다는 것을 보여준 훌륭한 사례 발표가 있었다.

하버드 대학 소속 보스턴 아동병원의 티모씨 유(Timothy Yu) 박사는 개인 유전체 맞춤 치료제를 적용해 어린 소녀의 치명적인 희귀 질환 (rare fatal disease)을 치료하기 위해 노력한 1년의 전 과정을 소개하고 공유했다.

이 어린 소녀는 아주 희귀한 열성 돌연변이를 가지고 있었으나 이동성 유전인자(transposable element)가 삽입돼 있어 이 원인 유전자를 정확하게 진단하기도 매우 어려웠다.

이 질병은 빠르게 진행함으로 많은 연구자와 함께 팀을 만들어야 했으며 특히 안티센스 RNA 치료제인 바이오젠의 뉴시너센(nusinersen, 스핀라자) 치료제 관련된 논문을 팔로업하고 실제로 뉴시너센을 처방해 치료한 경험있는 팀을 연구팀에 참여시켜 Milasen이라는 명명한 ASO (Antisense oligonucleotide)를 자체 개발하게 되면서 이 소녀를 만난 지 딱 1년 만에 치료에 들어갔다고 한다.

대규모 유전체 연구 사례(gnomAD v2.1 및 UDN)

브로드 연구소 맥아써 그룹의 K. Karczewski 박사는 ASHG18에서 gnomAD v2.1(데이터베이스 & 브라우저)을 공식적으로 발표했다. 이번 버전에서는 한국인 WES 데이터 약 2000명을 포함한 동양인 약 9000명 정도를 분석한 내용으로 업데이트됐다.

그리고 LoF(Loss of Function) 예측을 위해 12만 5000명 WES (1500만 변이)와 1만 5000명 WGS (2억 3000만 변이)에 대해서 아노테이션이 완료돼 의미 있는 20만개의 Lof를 발견했다.

▲gnomAD v2.1의 전 세계 국적/인종별 조상(ancestry) 분포 그림.

그리고 어떤 유전자가 LoF에 취약한지 아닌지를 구분할 수 있게 됐다. 유전성 질환을 진단하기 위해 환자 또는 가족에서 발견되는 신규 변이 또는 불확실한 변이(VUS)를 해석하는데 매우 유용할 듯하다.

이번에 업데이트된 gnomAD v2.1의 변이 정보를 기반으로 PCA 분석을 통해 글로벌한 ancestry 분포를 그린 것을 보면 한국인 데이터가 다수 포함돼 있으며 서울대학교 병원 박경수 교수 그룹에서 참여해 공동연구로 진행되었다.

브로드 연구소의 B.B. Cummings 박사의 GTEx & gnomAD 데이터 분석 발표의 경우 인기가 많아 발 디딜 틈이 없을 정도로 연구자들 호응이 대단했다.

gnomAD 데이터를 들여다보면 유전자 별로 'loss-of-function (LoF)' 변이들을 대량으로 예측은 할 수 있다. 하지만 문제는 실제로 이 예측된 LoF 변이들이 실제 기능적으로 문제를 일으키는지는 또 다른 실험을 하지 않고는 알 수가 없다.

그런데 이번에 브로드에서 발표한 이 연구 결과는 GTEx & gnomAD 데이터를 통합 분석함으로써 특정 유전자들의 LoF 변이들에 의해서 저 발현 엑손의 패턴으로 관찰돼 유전자 기능이 저하됨을 실험하지 않고 데이터 분석만으로도 볼 수가 있었다고 한다.

유전자 내 각 염기서열에 따른 발현 점수를 할당하기 위해 GTEx로부터 RSEM툴의 정량 값을 활용했다고 하며 이렇게 개발된 'hail'이라는 툴은 특정 RNA-Seq발현 데이터와 특정 VCF이 있으면 재해석할 수 있는 툴로 공개됐다.

미진단 희귀 질환 연구 네트워크(Undiagnosed Diseases Network, UDN)에서 이번 컨퍼런스에서 발표한 결과를 보면 최근 20개월 기간 동안 진단되지 않은 1519명의 환자들에 대해서 진단율을 새롭게 보고했다.

미국 내 7개 의료기관과 2개 시퀀싱 센터와 대사체 분석 센터 그리고 동물모델을 가지고 실험하는 다양한 연구센터와의 협력을 통해 최근에 확장된 UDN 컨소시엄은 신경질환, 근골격계 및 면역계 유전질환의 진단율을 40%까지 극적으로 올렸다고 한다. 이중 11%는 임상적 평가를 통해 진단했으며, 74% 정도는 WES 또는 WGS 분석 방법으로 가능했다. 이렇게 재진단된 환자들의 80%는 임상적 조치가 도움이 되는 환자들로 분류가 되어 이 중 21%는 치료에 들어갔으며 36%는 제네틱 카운슬링이 가능해졌다. 이를 통해 미진단 환자들이 진단되지 않아 계속 지출되는 비용이 평균 3억원 이상이었는데 이들 질병을 진단할 수 있게 됨으로써 헬스케어 비용을 극적으로 낮출 수 있게 돼 기존의 비용보다 6% 정도인 2000만 원 정도까지 평균 비용을 낮췄다.

UDN 소속 워싱턴 대학의 멘델리안 유전학 센터 소속의 제시카 청(Jessica Chong) 박사는 멘델리안 유전질환을 연구해서 유전자를 발견하던 기존의 고전적인 방식에서 전장 엑솜 해독(WES) 및 전장 유전체 해독(WGS) 방식을 2010년부터 채택함으로써 멘델리안 유전질환과 유전자의 관련성을 아주 극적으로 밝혀냈다. 기존의 PCR 또는 생어 시퀀싱 방식으로 연구해 밝혀내던 1996년에는 5개 유전질환 유전자를 밝혀냈으며 2010년까지는 매년 약 100여 개를 밝혀내던 수준에서 그 이후로 이 방법론이 차세대 유전체 해독(NGS) 기술로 대체되기 시작하면서 매년 200~300여 개 유전자를 밝혀내고 있다면서 멘델리안 유전학 발전에 있어 무어의 법칙이 적용되고 있다고 소개했다. 그리고 이러한 발전이 의미하는 것은 최근 전장 엑솜 시퀀싱(WES)으로도 새로운 유전질환 변이들을 진단하지 못했던 것이 이제는 점점 가능해진다는 것을 의미한다고 했다.

연구계와 산업계 협력 연구 (생어&GeneDx, 23andMe, 마이크로소프트)

기조 강연으로 생어 연구소 K.E. Samocha 박사의 최대 규모 발달 장애(developmental disorder) 코호트 발표가 있었다.

발달 장애 아이를 두고 있는 2만2000 가족으로부터 전장 엑솜 시퀀싱(WES)을 수행해 50개의 새로운 de novo 변이를 발견했다는 제목의 발표였다.

그런데 이 생어 연구자가 재밌는 것은 ASHG2018에 초록 낼 때는 결과가 2만2000 가족이었는데 약속을 못 지켰다면서 나쁜 소식을 전하게 되었다고 했다.

그리고 곧이어 좋은 소식은 사실 초록 낸 이후에 훨씬 뛰어넘는 3만 1058 가족이 모였다고 하면서 영화배우 같은 외모를 가진 생어 연구소 연구자는 청중을 들었다 놨다 했다.

이 대규모 발달 장애 코호트는 DDD(9,858 가족), GeneDx(18,783 가족), RUMC(2,417 가족)가 참여했으며 특히 GeneDx라는 글로벌 진단 회사가 1만8783 가족의 데이터를 제공해 줌으로써 가장 크게 기여했다.

그래서 3만1058 가족에게서 302개의 의미 있는 유전자(significant gene)를 발견했고 그중 43개 신규 유전자(novel gene)를 발견했으며 그 유전자 안에서 부모에는 없고 환자한테만 발견된 de novo 변이는 총 4만5057개이며 2만8088개 미스 센스 변이와 7141 PTV(protein truncating variants)를 발견했다. 이렇게 연구계와 산업계가 협력해 새로운 더노브(de novo) 변이들을 많이 발굴하였고 이러한 연구를 통해 발달 장애 진단율을 극적으로 올릴 수 있게 됐다고 발표했다.

▲생어 연구소 K.E Samocha 박사 ASHG2018 기조강연

현재 23andMe 코호트는 전 세계 최대 규모인 500만 명 이상의 고객으로부터 연구 참여 동의를 얻어 80%의 유전체 고객 데이터를 사용해 전 세계 다양한 연구자와 협력해 연구를 진행 중이며 이렇게 매년 많은 발표를 하고 있다. 연구에 참여한 고객 중에 약 75%가 자신의 표현형 정보를 제공하는 설문에 참여하고 있으며 이렇게 쌓인 설문 데이터가 15억 건이 넘어간다.

160만 개의 제노타이핑된 변이들을 기반으로 약 5700만 개의 변이들을 imputation을 마쳤다고 하며 23andMe 데이터베이스에는 608개의 표현형에 대한 정보가 저장돼 있다.

23andMe 연구팀은 이번 컨퍼런스에서 다양한 학계 연구자들과 공동연구를 통해 14개의 구두발표/포스터 발표를 했다.

마이크로소프트는 이번 ASHG2018 컨퍼런스에서 새로운 연구 파트너들과의 공동연구 결과를 여러 건 발표했다. 마이크로소프트의 클라우드 서비스인 마이크로소프트 애저(Microsoft Azure)를 통해 20여 유전체 관련 연구 파트너 및 회사들과 협력하는 부분을 발표했는데, 특히 마운트 시나이(Mount Sinai) 연구팀은 암 유전체 데이터가 시간이 지날수록 방대해져 분석할 수 있는 컴퓨터와 저장공간을 확보하기가 쉽지 않았는데 이 부분을 마이크로소프트 유전체(Microsoft Genomics) 플랫폼을 통해 이를 많이 개선할 수 있었다. 스탠퍼드 대학과의 공동연구를 통해 Intel Altera FPGA(Field-Programmable Gate Array) 인프라에서 실행되는 초고속 유전체 분석 소프트웨어를 개발했으며 여기에 머신러닝 기술을 적용할 예정이라고 한다. 세인트 쥬드 아동병원(St. Jude Children’s Research Hospital)의 경우는 마이크로소프트 게놈 클라우드를 이용해 소아암 유전체 데이터들을 전 세계 28개 국가, 300개 연구기관, 2000명 이상의 임상의사들이 공유하고 있다는 발표도 있었다.

아프리카인 유전체 연구 (펜실베니아, NHGRI)

이번 학회에서는 과거에는 많은 관심을 두지 않았던 아프리카 유전체 연구에 대한 발표가 다수 진행됐다. 펜실베니아 대학교의 인간 유전학자 사라 티스코프(Sarah Tishkoff) 박사는 아직 논문으로 출판되지 않은 데이터 및 연구 결과는 소개했다. 4만 년 전 아프리카 대륙의 유전자 풀을 이해하기 위해 12종족, 180전장 유전체 해독(WGS) 분석을 통해 텅 비어 있는 초기 인류 역사의 기원을 채우기 시작했다는데 매우 의미가 있어 보였다.

NHGRI(the National Human Genome Research Institute) 소속의 나이지리아인 구다사니(Gurdasani) 박사는 우간다인 2000명의 유전체 분석한 결과를 발표했으며 곧 논문이 출판된 이후 익명화된 유전체 데이터들은 모두 공개적으로 전 세계 과학자들에게 공유할 계획에 있다고 발표했다.

유전학 연구자의 약 80%는 유럽인이다 보니 우리의 뿌리인 아프리카에 관한 연구는 그렇게 많지가 않았다. 그래서 우리가 아프리카를 떠나기 전의 우리의 역사를 잘 알지 못하고 있었으나 이번 아프리카인 유전체 분석을 통해 비어 있는 인류의 역사를 밝혀 나갈 수 있지 않을까 하는 기대가 있다.

다음 ASHG는 2019년 10월 15일~19일까지 미국 텍사스주 휴스턴에서 개최될 예정이다. 내년 ASHG 2019에는 어떤 재미있는 연구 결과들이 있을지 기대가 된다.