기사본문
[김태형의 게놈이야기]가장 많이 연구되는 '톱 히트 유전자'
입력 2017-12-05 10:08 수정 2017-12-05 10:08
김태형 테라젠이텍스 이사
지난달 22일 과학전문 학술지 네이처는 꽤 흥미로운 글을 내놓았다. 하버드 의대 생명정보학자(bioinformaticist) 피터 커페디예프(Peter Kerpedjiev) 박사와 네이처가 함께 정리한 글로써, 수년 동안 체계적으로 펍메드(PubMed)의 데이터베이스에 등록된 모든 논문들의 유전자 태깅(tagging)을 통해 지금까지 전세계에서 가장 많이 연구가 되고 있는 유전자인 '톱 히트 유전자' 리스트를 정리한 것이었다.
내용을 살펴보자면, 먼저 유전학을 배운 사람이라면 누구나 가장 먼저 떠올릴 수 있는 유전자인 TP53이 당연 랭킹 1위였는데 유전자와 코딩 단백질 p53에 관련된 논문이 약 8500여개가 출판되었다고 한다. 이러한 수치는 평균적으로 매일 2편의 논문이 이 유전자에 관해 보고되고 있다는 것을 의미한다.
TP53은 대표적인 종양억제유전자로서 암 발병의 원인인 유전체 불안정성을 막는 '유전체 보호자(guardian of the genome)'로 알려져 있으며 암 발생 돌연변이의 절반 정도가 이 유전자에서 발생한다고 알려질 만큼 암 발생과 밀접한 관련이 있다. 존스홉킨스 대학의 암 유전학자인 버트 보겔슈타인(Bert Vogelstein) 교수는 암 연구 분야에서 TP53보다 더 중요한 유전자는 전무후무할 것이라고 말했으며 이러한 중요성을 대변하 듯, 수 많은 연구결과에도 불구하고 여전히 이 유전자에 관한 새로운 생물학적 발견들이 계속해서 이루어지고 있다.
이처럼 계속해서 연구되고 있는 유전자가 있는 반면, 실제 인간 유전체의 약 2만여 개 단백질 코딩 유전자들을 살펴보면 1/4 이상의 유전자들만이 논문에 100번 남짓 카운팅 될 정도이고 나머지 유전자들은 논문에 언급되는 빈도가 매우 낮거나 혹은 전혀 연구되지 않은 채로 남아있다.
또한 글을 살펴보면 2002년 인간게놈 초안이 발표된 후, 논문에 표준화된 GeneRIF(Gene Reference Into Function )유전자 태그가 체계적으로 추가되었기 때문에 펍메드 기록을 들여다보면 특정 시기에 특정 유전자에 집중되는 경향을 보이고 있어 유전자 연구 논문의 시대 별 트렌드를 확인할 수가 있다.
예를 들어 1980년대 중반까지는 많은 유전학 연구가 적혈구에서 산소 운반 역할을 하는 고분자인 헤모글로빈을 중심으로 이루어졌다. 특히, 1985년 이전에는 인간 유전학 연구의 10% 이상이 헤모글로빈 유전자에 관한 연구였다. 1949년 라이너스폴링(Linus Pauling)과 그의 동료들이 비정상적인 헤모글로빈이 겸상적혈구 빈혈증을 일으키는 것을 밝혀내 비정상적인 단백질에 의한 인간 질병의 첫 사례를 사이언스에 발표한 이후로 그 여파가 1980년대까지 이어진 것이다.
그리고 그 이후에는 CD4라는 유전자가 트렌드를 이어갔다. 1984년 CD4가 HIV 바이러스가 세포로 들어가는 수용체 역할을 하는 것으로 밝혀진 이후, 1987년부터 1996년까지의 논문 출판 기록을 살펴보면 CD4라는 유전자는 전체 논문 중에 약 1-2% 정도에서 언급 될 정도로 매우 핫한 유전자임을 알 수 있다.
1990년대부터 드디어 TP53 연구가 가파른 상승곡선을 타기 시작했다. 물론, 1990년대 초에는 TP53보다 GRB2라고 불리는 잘 알려지지 않은 유전자가 주목 받던 시기가 있었다. 1992년 예일대학의 조셉 슐레징어(Joseph Schlessinger) 박사는 GRB2(성장 인자 수용체 결합 단백질)가 세포 성장과 생존에 관련된 기능을 담당하는 것을 처음 밝혀낸 이후로 이 유전자에 관한 연구가 활발히 이루어져 1990년대 말 약 3년 동안은 가장 많이 참조된, 그때 당시 가장 유명한 유전자로 기록되기도 했었다.
하지만 이 유전자는 궁극적으로 질병의 직접적인 원인이거나 약물 표적이 아니었으므로 임상적 가치가 약해 그 인기가 오래가지는 못했다. 일반적으로 연구비를 지원하는 기관들은 치료적 잠재력을 보이는 유전자를 대상으로 진행하는 연구에 초점을 두었으며 임상적가치가 떨어지는 유전자는 곧 연구가치가 떨어져 트렌드에서 벗어날 수 밖에 없었다. 결론적으로 이런 임상적 가치를 기반으로 두고 환자 환우회, 제약회사 그리고 이를 지원하는 정치인들이 연구비를 지원하기 때문에 기술적, 사회적 및 경제적인 요소들이 고려되어 선택된 특정 유전자의 연구가 활발히 이루어지게 되고 그 결과에 대한 관심이 매우 높게 고취되는 것이다. 뿐만 아니라, 인간유전체지도가 작성됨으로써 유전자에 대한 접근성이 넓어진 점도 유전자 연구 흐름을 바꾸는 계기가 되었다.
이러한 조건들이 모두 충족되는 접점이 바로 TP53 유전자였다. 물론 처음에는 다른 유전자들과 마찬가지로 크게 주목받지 못했다. 1979년 단백질이 세포 핵 내부에서 활성화되어 있는 상태로 동정 되었지만 그 이후로 수십년동안은 제대로 연구가 이루어지지 않은 것이다. 하지만, 보겔슈타인 랩의 대학원생이었던 수잔 베이커(Suzanne Baker)가 1989년 실질적인 종양 억제자로써의 역할을 처음 발견하면서 이 유전자의 기능적 연구가 활발히 진행되었으며 2000년을 접어들어 그 어떤 유전자보다 많이 연구되는 유전자가 되었다.
그 다음 주자로는 현재까지 5300편의 논문에 인용되어 2위를 차지한 TNF유전자인데 이 유전자는 암세포를 죽일 수 있는 능력 덕분에 1975년에 처음 명명되었다. 하지만 항암 작용이 TNF의 주요 기능이 아니라는 것이 후에 밝혀지고 실질적으로 암환자 임상시험에서도 TNF 단백질은 독성이 매우 강하다는 것을 알게 되었다. 또한, 염증의 매개체로써 새로운 기능이 밝혀 지면서 종양에서의 효능은 이차 관심사로 밀려났지만 1980년대 중반에 들어서면서 이 기능이 더 명확하게 밝혀지자 이들의 활성을 차단하는 항-TNF 치료법은 류마티스 관절염과 같은 염증성 질환 치료의 핵심이 되었고 전세계적으로도 수 십조 원의 매출을 내는 약으로 판매되고 있다. 이는 유전자 연구를 통해 염증성 질환 환자를 치료할 수 있게 된 성공적인 연구 사례가 된 것이다.
5위에 오른 APOE유전자는 한 때 TP53의 독주를 막은 유전자로 꼽힌다. 1970년대 중반, 혈액에서 콜레스테롤 제거에 관여하는 운반자 유전자로 발견된 이후로 1993년에는 이 유전자의 단백질이 알츠하이머 환자의 딱딱한 뇌에 많이 존재하는 것이 처음 밝혀지면서 APOE4 유전자의 특정 형태가 알츠하이머 질병의 위험도를 크게 증가시킨다는 사실을 알게 되었다. 그때 당시만해도 콜레스테롤 수송 단백질을 생산하는 APOE 유전자를 이용한 알츠하이머 연구에 관심을 가지는 연구자들은 거의 없었으나 APOE4와 알츠하이머 병의 위험성 사이에 유전적 연관성이 거의 반박할 수 없을 수준으로 밝혀지자 2001년에는 APOE의 인기가 TP53을 처음으로 넘어서게 되기도 했다. 물론 그 이후로 1위에서 물러났지만 항상 상위 5위 안에 머무는 유명한 유전자가 되었다.
앞서 언급했듯이, 유전학 연구분야에서 특별히 선택되어 다른 유전자보다 더 많이 연구되기 위해서는 생물학적 가치뿐만 아니라 사회전반의 관심, 비즈니스 모델로써 가능성, 의학적 니즈(Needs)가 충분히 부합되어야 한다. 실제, 50년 전부터 현재까지 연구된 인간(Human), 생쥐(Mouse), 쥐(Rat), 초파리(Fruit fly) 등과 같은 모델 생물체를 대상으로 한 유전자 연구 논문 130만 건의 조사에서도 연구가 가장 많이 된 100개 유전자 중 2/3이상이 인간의 질병과 건강과 관련된 유전자들이었다고 한다.
또한 한번 상위권에 진입한 유전자들은 큰 변화 없이 지속적으로 연구가 진행되는 패턴을 보임으로써 보수적인 연구 성향을 보여주었다. 즉, 연구를 위한 조건에 부합되는 것이 매우 낮은 확률이지만 선택이 되면 니즈(Needs)를 만족시키기 위해 수많은 연구팀이 앞다투어 새로운 발견을 내놓고 있는 것이다. 하지만 유전학분야는 새로운 기술이 도입되고 새로운 가치가 계속해서 만들어지고 있는 분야이다. 급속도로 발전하고 있는 유전체 해독 기술과 빅데이터 분석 기술이 적용되어 더 많은 유전자를 대상으로 연구가 진행되는 현 트렌드가 새로이 반영된다면 십년, 혹은 몇 십년 후, 가장 유명한 유전자 순위가 어떻게 바뀔지는 아무도 모를 일이다.
출처
1. The most popular genes in the human genome. https://www.nature.com/articles/d41586-017-07291-9