이번 프로젝트를 통해 밝혀진 SNP중 50%가 새로운 SNP라고하는데 너무 많은거 아닌가요?

 

 

김성진 원장의 유전체에서 예측된 SNP는 323 만개로서, 이중 50% 인 1,623,913 개의 SNP가 미국의 국가생명공학정보센터의 dbSNP에 없는 것으로 확인되었습니다. 흑인의 경우 약 24.5%, 2008년 공개된 중국인은 약 13.6%만이 새로운 SNP였다고 합니다. 한국인에게서 이렇게 많은 이유는 dbSNP에 한국인 SNP가 흑인이나 중국인처럼 대량으로 등록된적이 없기 때문입니다. 특히, 흑인 유전체를 해독한 논문에 사용된 샘플 NA18507은 Internatioanl HapMap에서 선별한 나이지리아인 90명의 샘플중에 하나이며, 이 샘플들에서 발굴된 SNP들은 dbSNP에 모두 등록되어 있는 상태입니다. 그 숫자는 400만건(398)에 해당합니다. 이미 dbSNP에 많은 숫자가 등록이 되어있으니 24.5%(흑인)로 한국인에 비해서 신규로 발굴되는 SNP가 비교적 적을 수 밖에 없습니다. 또한 국제 HapMap프로젝트에서 SNP를 대량으로 발굴할 때 나이지리아인 외에도 백인, 중국인, 일본인 4인종에 대해서만 SNP발굴이 진행되었습니다. 중국인의 경우에서도 13.6%로 신규 SNP가 작은 것은 같은 이유입니다. 2008년 현재, dbSNP에 중국인은 405만건이 넘게 등록되어 있습니다. 그 반면에 한국인의 경우는 dbSNP에 흑인, 백인, 중국인, 일본인 처럼 한꺼번에 대량으로 등록된 사례가 없었습니다. 이번 김성진 원장의 유전체 해독을 통해서 한국인의 최초로 새로운 SNP들이 대량으로 발굴된 것으로 보입니다. 그리고 이 연구사례는 소수민족에 있어서도 개인유전체 서열을 만들 필요가 있다는 것을 설명하는 좋은 예가 될 것입니다.

   
 

한국인 유전체를 최초로 해독한 것인가요?

 

 

한국인 유전체 발표의 가장 큰 의미는 유전체 해독 자체가 대중화 단계에 진입했고, 이번 프로젝트를 통해 인프라 기반을 구축했다는 것입니다. 그래서 일부 보도에서 사용된 "최초 해독" 이라는 표현보다는" 서열해독을 한후, 최초로 총 유전체의 정보분석을 하고, 최초로 공개 및 최초로 배포 " 했다는 것이 더 정확합니다. 이것은 눈앞에 다가온 개인 유전체시대와 맞춤의학 시대가 우리나라에서도 현실화 되었으며, 그것을 위해 결과를 최초로 공유한다는데 의미가 있습니다. 유전체 해독의 비용이 아주 저렴해 졌기 때문에, 첫 번째라는 것에 큰 의미를 두지 않았습니다. 가천의대 외에도 (주)마크로젠 회사에도 한국인 유전체 서열을 해독했고(미공개/분석정도미상, 관련뉴스), 한국생명공학연구원 자체에서도 시작할 예정입니다. 총 유전체연구에서는, 해독후 서열을 해석하는 과정이 오히려 더 중요합니다. 아무리 해독기를 많이 돌려 엄청난 양의 DNA조각을 뽑아내도, 그것의 맵핑후, 그로부터 정보를 뽑고, 처리, 정리, 분석하여, 공개하는 과정이 오히려 더 큰 의미를 가집니다. 가천의대와 국가생물자원정보관리센터는 이 과정에을 국내에서 컴퓨터를 최대한 활용하여, 효율적으로 해냈습니다. 굳이 최초를 따지면, 최초로 서열해석을 해서, 최초로 공개하고, 이용토록 했다고 할수 있습니다. 그리고, 해독과 해석등은 영어의 sequencing과 analysis를 번역한 말로서, 설사 해독을 공개하거나, 발표하려면 꼭 해석(분석)이 들어가야합니다. 따라서, "최초의 해독"이라고 하더라도 꼭 틀리다라고 할수 있는 성질의 것도 아닙니다. 이번 공동연구 팀은, 최초해독등에 중요성을 주지 않았고, 그렇게 발표를 하지도 않았습니다.

   
  사람의 유전체를 완전히 해독한 것입니까?

 

  인간 유전체를" 완전히" 해독한 것이 아닙니다. 유전체를 아직 "완전히" 해독한 경우는 아직 없습니다. 그래서, 한국인의 "유전체를 해독하고, 분석했다"가 더 맞습니다. 이런 오해가 생기는 이유중의 하나는, 영어로 흔히, complete genome을 해독했다고 하기 때문에, 한국어로, 완전히 해독했다고 이해 될수 있기 때문인 것 같은데, 완전하게 서열 해독을 한 것이아니라, 전체길이(complete genome 혹은 full genome)의 유전체 서열해독을 한 것입니다. 그러나, 그 전체길이가 100% 완벽하게 해독되는 것은 현재 불가능합니다. 사람 유전체를 완전히 해독하는 것은 아마, 미국에서도 앞으로 몇 년 혹은 몇 십년이 걸릴지 모릅니다. 왜냐하면 유전체에는 서열해독이 아주 어려운 반복된 특수 부분들이 있어서, 이런 부분은 누락되어 있습니다.
   
  발표된 한국인 유전체 결과는 논문에 발표 되었나요?

 

  아닙니다. 연구진은 이번 연구결과를 내년 초 국제학술지 '게놈 리서치' 특별판에 "투고"할 예정 입니다. 그 저널에서 이런 게놈해독 연구특별기고를 2009년 초에 받는다고 하기 때문입니다. 저희 공동연구가 그 특별판에 맞기에 투고할 계획입니다. 하지만, 아직 accept 된 것은 아닙니다. 이번 발표는 대중적 사회적으로 중요한 면이 많습니다 (세종문화회관에서 보도발표시 이점을 강조했습니다). 누구나 서열해독을 할 수 있고, 또, 한국인 한사람을 한다고 해서, 갑자기, 새로운 큰 연구적 성과가 생기는 것은 아닙니다. 오히려, 이런 유전체서열해독만 했다고 그 정보가 논문에 당연히 실리는 것이 않는 시대가 되고 있습니다. 물론, 한 유전체에서, 새로운 과학적인 것을 발견하면 다른 이야기입니다. Nature지의 중국인 유전체 논문도, 큰 학문적 발견이나 가치보다는, 최초의 아시아인 것이라는 것이 가장 큰 장점이었다고 추측합니다.

  왜 논문발표에 앞서 유전체서열을 공개하고, 분석정보를 발표했나요?

 

  지금껏 다른 게놈 서열 프로젝트는 먼저 이런 사회적 보도자료를 내고, 나중에 논문을 실었습니다. [관련 정보] 왜냐하면, 이것의 사회적, 의료적 중요성이 대중에게 중요한 뉴스이었기 때문이라고 생각합니다. 그만큼, 유전체 해독은 대중화되어서 과학에서 사회적인 것으로 옮겨가고 있다는 뜻도 됩니다. 그리고, 유전체 해독을 숨길 이유가 없고, 오히려, 공개를 가능한 빨리해야 다른 연구자를이 모르고, 중복으로 하는 일이 없을 것입니다.
참고로, 2008년 초에, 네들란드의 여성 유전체가 해독되었다고 발표되고, 전세계적으로 보도가 되었습니다. 그러나, 그 서열은 아직 공개되지도, 논문에 발표되지도 않았습니다. 그리고, 그 서열해독 발표에 대해 큰 문제를 삼지 않습니다. 왜냐하면, 누구나, 서열해독기와 돈만 있으면, 서열생산하는 것은 생물학자들 누구든 할수 있기 때문입니다. 하지만, 그것을 제대로, 처리, 분석하는 것은 쉽지 않습니다.
영국 케임브리지의 생어센터의 유전체해독 공개
세계에서 가장 큰 유전체생산센터인 영국 케임브리지의 생어센터는 모든 해독된 유전체 정보를 즉각 공개합니다. 유전체 기술이 발달한 선진국에선, 이미, 유전체해독은 연구논문과 무관한 일종의 기초적 공개 데이타입니다. 그런 공개된 유전체 데이타를 이용하여, 새로운 생물학적 발견을 하면, 학술지에 논문을 싣게 됩니다.

  논문이 없으면, 검증이 되지 않은 것은 아닌가요?

 

  그렇지 않습니다. 사람 유전체서열 해독과 논문을 통한 검증은 서로 다른 성질의 것입니다. 서열해독결과는 논문으로 검정을 받는 것은 아닙니다 (시퀀싱quality는 장비와 방식에 크게 의존). 곧 많은 학술지들이, 사람 유전체서열에 관한 논문은 더 이상 게재하지 않고, 미국의 국가생명공학정보센터에 등록만 하라고 할것입니다. 물론, 많은 사람의 유전체를 해독해서, 예를 들어, 1000명 유전체 프로젝트의 결과, 이것을 통해 새로운 사실을 발견한 것등에 대한 것은 계속 학문적 의의가 있을 수 있습니다. 그러나, 한국인 개인유전체해독 자체에 관한 것은 과학적으로 큰 의미가 없습니다. 본 프로젝트팀은, 일단 많은 한국의 연구자들이 활용할수 있도록 서열을 "공개"하는 것을 일차로, 인종적 계통, 유전적 변이에 관한 연구, 한국인 특이적인 SNP의 분석, 기존의 서양인과 동양인의 유전체와의 비교연구를 '게놈 리서치'에 보고할 계획입니다. 이러한 보고된 논문에, 학문적 연구적인 포인트들이 있을 것입니다. 그런 포인트들은 당연히 학문적 검증을 받게 됩니다.

 

  7.8배수로 했다고 하는데, 이것이 무엇이고, 너무 적다는 지적에 대해서는요?

 

  인간 게놈의 7.8배수로 했다는 것은, 서열해독 최종결과, 해독된 DNA양이 인간의 유전체크기의 7.8배였다는 것입니다. 이것은 한 유전체를 해독할때, 1번만 하는 것이 아니라, 장비에 따라, 그 수를 더 많이 합니다. 완벽하게 읽는 기계가 있다면, 1 배수로도 충분하겠죠. 그러나, 에러가 들어갈수 있고, DNA조각들의 크기가 작기 때문에, 여러번 해서, 공통되는 부분을 최종적으로 취하는 방식을 택합니다. 이과정에서 통계학적인 계산을 넣기도 합니다. 본 프로젝트의 솔렉사 paired-end 기계의 경우, 7.8배는 2008년 Nature지에 발표된 제임스왓슨의 유전체해석때 쓰인 454라는 해독기와 비슷한 정확도 수준입니다. 왓슨을 한 텍사스의 연구자들도, 7.4배정도로 서열해독을 해서, 에러가 있거나, 빠진부분을 가능한 줄이려고 했던 것입니다. 저희들이 벤치마킹을 해온 결과, 이번 7.8배는 유전체를 해석/분석할수 있는 정도의 배수와 정확도였습니다. 그리고, 7.8이나 7.4배수 등이 많다 적다는 단순한 문제가 아닙니다. 유전체해독에는 많은 지표(parameter)가 작용을 합니다. 해독기에서 나오는 DNA조각들의 서열을 합성하는 프로그램에 따라서도, 정확도는 차이를 냅니다. 또, 분석을 할때, 어떤 방식으로 quality검증을 하는가등도 영향을 미칩니다. 이번 프로젝트의 7.8배는 너무 낮은 수치는 아닙니다. 배수보다는, 이렇게 다배수로 나온 서열을 어떻게 분석/해석하는가가 더 문제입니다.

 

   
 

표본 수가 적어 한국인 "표준" 유전체라는 대표성이 없지 않나요?

 

 

한국인 표준유전체를 완성한 것을 발표한 것이 아닙니다. 한국인 참조표준 유전체 프로젝트는 "한 사람의" 한국인 참조표준을 구축하기 위한 프로젝트입니다. 먼저, '참조표준'이란 것이, 우리가 일반적으로 인식하고 있는 "표준"과는 다르다는 것을 알아야합니다. 참조표준은 정보의 정확도와 신뢰도를 과학적으로 분석, 평가하여 공인함으로써 반복사용이 가능하도록 마련되는 자료로서 유효 참조표준, 검증 참조표준, 인중 참조표준을 분류됩니다. 그러므로 참조표준이 되기 위해서는 정확도, 불확도, 적절성, 대표성, 재현성, 예측가능성등이 확인되어야 합니다. 참조표준은 참조데이터로 부터 만들어지는데, 참조데이터란 참조표준으로 등록되지 않았으나 국가사회의 모든 분야에 지속적으로 참조하여 사용할 수 있는 과학 및 산업기술 수치데이터 또는 과학기술적 통계를 말합니다. 이번 김성진 원장의 유전체는 한국인 참조표준 유전체를 만들기 위한 시작이며, 참조표준을 위한 참조데이터입니다. 지속적으로 유전체 해독 비용이 저렴화 되면, 김성진박사의 유전체의 정확도를 높히는 서열해독법과 타 한국인과의 비교, 통계적용을 통해 참조표준유전체를 구축하게 될것입니다. [관련 자료] 2006-12-26 기사

 

 

한국인 것을 한 의의를 미래에 적용할 사례를 들어 설명해주세요.

 

(1) 먼저, 이 프로젝트는 한국인 참조표준 유전체 구축을 위한 프로젝트입니다.
참조표준은, 일반 표준과 다른 제 3의 표준이라고 합니다. 참조표준은 흔히, '참조'나, '표준'이란 말로 쓰이기도 합니다. 하지만, 참조표준은 일반인들이 흔히 생각하는 표준과 다름니다. 참조표준은 '대표'를 뜻하는 것이아닙니다. 그래서, 단 한 사람의 한국인 유전체가 '참조표준유전체'가 될수 있습니다. [관련 정보]
한국인 참조표준은 누가 만들어도, 한번은 꼭 만들어야할 표준입니다. 현재 우리는 단일염기다형성과 같은 유전적 변이를 찾을 때 미국의 국가생명공학정보센터(NCBI)에 저장되어 있는 참조 유전체 (reference genome)를 사용합니다. 조만간 유전체 해석이 보편화되면 누구나 자신의 유전체 서열을 알 수 있게 되고, 더욱 중요한 것은 그것을 가지고 유전의학, 맞춤의학, 예방의학에 활용하는 것입니다. 그렇게 하려면, 단일염기다형성과 같은 유전적 변이를 정확하게 찾아낼 수 있어야 하는데, 서양인의 참조 유전체를 사용할 경우 질병과 상관없이, 단순히 인종적 차이에 의한 차이가 부각됩니다 (분석할 때 단순 노이즈로 작용할 수 있는). 그렇게 불필요한 정보가 생산되면 대량 데이터 분석 (몇 십만 명, 몇 백만 명 혹은 그 이상)시 정보처리에 큰 지장을 줄 수 있으며, 질병과 상관있는 유전형을 정확하게 찾는 일에도 영향을 미치게 됩니다. 따라서, 아시아인에 적합한, 한국인에 적합한 참조 유전체가 있을 경우 인종간의 차이를 최대한 줄이면서 효율적으로 맞춤의학을 구현할 수 있게 됩니다. 참조유전체중, 하나가 큰 신뢰치를 가지고 국가참조표준센터에서 인정을 해주면, '참조표준유전체'가 됩니다. 그래서, 본 한국인 프로젝트는 먼저, 한국인 참조유전체를 생산하고, 이것을 참조표준화 하는 작업을 지속적으로 할 계획입니다. 이것은 단순히, 연구적으로 한국인 유전체를 만들고, 그것이 유용하게 쓰인다는 것과는 다른 공공인프라적인 사업입니다.
(2) 한국인 개인의학, 맞춤의학의 기초연구자료 공개
본 프로젝트의 정리된 서열 정보는, 유전적 변이발견 및 표현형과의 비교분석 등을 통해, 맞춤의학의 기초자료로 쓰이게 됩니다. 예를들면, 모든 인족들은 간의 Cy p450라는 효소가 조금식 다를수 있어, 한국인 체질에 맞는 약품이 있습니다. 또, 개개인도, SNP라는 유전적 변이에 의해 조금씩 다릅니다. 이러한 것을 지도화하여, 한국인에 적합한 맞춤의학의 기초를 제공할수 있습니다.
(3) 서양인과 중국인과 한국인의 유전체 최초비교.
한국인과 서양인 및 중국인과의 총 유전체 수준의 최초의 비교를 할 수 있었습니다. 한국인들이 다른 인종과 어떻게 다른지는 궁극적으로 개개인의 유전체에 대한 많은 정보가 나와야 합니다. 이번 한국인 유전체는, 최초의 그런 분석 결과를 제공합니다. 앞으로, 각국에서 많은 개인유전체 정보가 공개되면, 한민족의 뿌리를 가장 확실히 알게되는 계기가 될것입니다.
(4) 한국인에 특이적인 변이에 대한 가늠 및 개인유전체의 필요성 확인
기존에 많은 유전적 변이(SNP)에 대한 정보가, SNP칩이라는 기술을 통해 쌓여져 있습니다. 그러나, 궁극적으로, 이런 SNP칩들은 서양인위주로 디자인되어 있거나, 동양인, 특히, 한국인의 특이적 변이의 검사에는 완벽하지 않습니다. 총 유전체 서열 해석을 통해, 앞으로 한국인의 변이에 대한 더 많은 정보를 줄수 있는 칩을 생산할 기초가 마련됩니다. 이번 연구를 통해, 한국인이 중국인과도 상당히 다른 SNP들을 가질수 있다는 것으로 판단됩니다. 추측한 것보도 훨씬 많은 수가 한국인 특이적으로 나타났습니다. 물론 김성진원장 한명에 관한 것이라서, 앞으로 더 많은 한국인 유전체의 비교가 필요하지만, 이번 서열 분석을 통해 많은 SNP 및 개인유전체해독의 필요성을 알게 되었습니다.
(5) 예방의학의 기초자료 제공
본 한국인 유전체와 같은 정보가 앞으로 계속 공개되면, 자신의 질병의 연관성을 알수 있고, 의사들이 예방의학을 할 수 있는 계기가 됩니다. 본 유전체 공개는 한국에서 그런 기초자료를 공개하여 이 분야의 연구를 촉진하는 계기가 될 것입니다.

아래 편작의 이야기를 읽어보면 예방의학이 가장 높은 경지이며, 현대의학이 그 눈부신 발전에도 불구하고 아직 가장 낮은 단계에 머무르고 있다는 점을 잘 알 수 있습니다. 개인의 유전체는 곧 그 개인의 청사진입니다. 건물을 보수할 때 청사진이 있어야 하는 것처럼, 또 경험많은 건축가라면 청사진을 보고 어떤 부분에 문제가 있을지 예측할 수 있는 것과 마찬가지로, 이제 우리 몸의 청사진을 누구나 갖게 된다면 부족한 부분을 찾아서 예방하고, 또한 문제가 생겼을 때 가장 효율적으로 대처하는 방법을 찾을 수 있게 됩니다. 물론 이러한 연구는 앞으로도 계속 하나씩 해결해 나가야 할 과제입니다.

중국 위나라에 편작이라는 사람이 살고 있었다. 이 사람은 다 죽어가는 사람도 살려낸다는 명의로 소문이 자자했다. 그 위로 두 형이 있었는데 모두 의사였다.
하루는 위나라 임금이 편작에게 물었다.
“그대 삼형제 중에 누가 병을 가장 잘 고치는가?”
“저의 큰형 의술이 가장 뛰어나고, 다음은 둘째 형이며, 저는 가장 뒤떨어집니다.”
“그런데 그대 형들은 왜 세상에 널리 알려지지 않았는가?”
“제 큰형은 환자가 아픔을 느끼기 전에 얼굴빛으로 이미 그 환자에게 닥쳐올 병을 압니다. 그리하여 환자가 병이 나기도 전에 병의 원인을 제거하여 줍니다. 환자는 아파 보지도 않은 상태에서 치료를 받게 되어 제 큰 형이 자신의 고통을 제거해 주었다는 사실을 깨닫지 못하는 것입니다. 제 큰 형이 명의로 소문나지 않은 이유는 바로 여기에 있습니다.”
“그렇다면 그대 둘째 형은?”
“둘째 형은 환자의 병세가 약할 때 그 병을 알아보고 치료를 해 줍니다. 그래서, 환자들은 제 둘재 형이 자신의 큰 병을 다스려 주었다고 생각하지 않습니다. 둘째 형이 명의로서 이름을 떨치지 않은 이유는 바로 여기에 있습니다.”
“그렇다면 그대는 어떻게 환자를 치료하는가?”
“저는 환자의 병이 커지고 환자가 고통 속에서 신음할 때에야 비로소 병을 알아봅니다. 병세가 심각하므로 맥을 짚어 보아야 했고 진기한 약을 먹어야 했으며 살을 도려내는 수술을 해야 했습니다. 사람들은 그런 행위를 눈으로 확인했으므로 제가 자기들의 큰 병을 고쳐 주었다고 믿는 것입니다. 제가 명의로 소문나게 된 것은 이처럼 하찮은 이유에서 입니다. “

 

  유전체 해독이 유전자 연구 및 예방 의학에 전략적 제안이 될 수 있지만, 유전자에 대해 아직 밝혀지지 않은 부분이 많기 때문에 맞춤의학을 말하기에는 아직 이르다?

 

 

맞습니다. 맞춤의학이 제대로 병원에서 효과를 발휘하려면, 오히려, 더 많은 순수 생명과학연구자들이 더 많은 생물학적 분석을 해야합니다. 포인트는, 이제는 한국인 유전체 지도에다, 하나하나 그런 생물학적인 것을 붙여가면서, 정확한 유전/질병 지도를 구축해나갈수 있다는 것입니다. .

 

  질병 발생 원인으로는 유전적 요인보다 환경적 요인을 더 크게 본다. 예컨대 특정 유전자를 가진 사람에게서 당뇨병이 발생할 확률이 정상인의 1.5배이지만 비만으로 인한 당뇨 발생 확률은 1.7배라면 어떤 쪽을 더 중요하게 봐야 하겠느냐?

 

 

좋은 지적입니다. 환경적 요인의 중요성은 매우 중요합니다. 앞으로, 환경적(식생활, 오염)인 요소에 대한 연구가 더 필요합니다. 그래서, 미국에서는, 환경유전체학이나, 미생물군유전체학이란 것을 추진하고 있습니다. 예를 들면, 우리 장내의 미생물(환경)과 몸의 상호작용을 알아야만, 우리자신과 질병을 이해할수있다는 식입니다. 이미, 엄청난 돈을 투자하여, 많은 양의 미생물을 대량으로 무작위로 해독하고 있습니다. 이것에 사용되는 기술을 '메타게노믹스'라고 합니다. 이것은 환경의 유전체를 해독하는 것이라고 보시면 됩니다. 물론, 이것은 복잡한 환경과의 상호작용을 이햇하는 아주 작은 노력에 불과합니다.

 

 

  유전자 분석 통한 질병 예측, 아직 신뢰도 낮다?

 

 

"프로그램에 따라 조금씩 오차가 다를 수 있지만 유전자 정보를 분석해 현재까지 개발된 질병 예측 프로그램에 입력했을 때 ‘특정 질병에 걸릴 확률이 1.5배' 라고 나타난 사람이 10명이 있다면 그 중 2~3명 정도에는 이 1.5배 확률 예측이 맞지만, 나머지 7~8명에게는 맞지 않는다는 의견이 나온 바 있다."
- 아주대 의대 예방의학 조남한 교수-

맞습니다. 그래서, 앞으로, 이런 예방의학 전문가분들과 계속 신뢰도를 올리는 연구를 공동으로 해야 한다고 생각합니다.

 

   
  CNV란 무엇인가요?

 

 

CNV란 우리나라 말로 "복제수 변이"라고 하면 될것 같습니다.
이것은 유전체내에서 DNA가 결실이나 삽입이 일어나는 현상을 말하며 그 길이가 1000개이상이 한영역에서 한꺼번에 결실/삽입 현상이 일어나면 이를 복제수 변이(CNV)라고 합니다.
그리고 이러한 복제수 변이가 특정 사람들 사이에서 1%이상이 나타나면 이를 "복제수 다형성(CNP)"라고 합니다.
또한 결실/삽입 현상이 1000개의 DNA이하로 일어날 경우는 "in/del"이라고 합니다. 즉 "DNA 결실/삽입"으로 불리어집니다.
이번에 분석된 한국인 유전체에서도 다수의 in/del이 발견되었습니다.
그리고 "복제수 변이(CNV)"가 빈번이 일어나는 영역에서 짧고, 긴 길이의 이들 DNA 결실 및 삽입이 일어 날수가 있는데 이때 그 영역들을 다 포함해서 가장 긴 영역을 "복제수 변이영역(CNVR)"이라고 지칭합니다.

 

 

 

인류학상 중국인과 일본인 중간이라는 데 어떻게 중간이라는 건지 좀더 설명해주세요.

 

 

참고자료의 계보 관련된 부분을 보시면, 현재까지 된 연구를 바탕으로 인류를 크게 아프리카인과 서양인 (코커시안), 동 양인으로 나누게 됩니다. 저희가 계통분석을 수행할 때 일본인과 중국인 데이터를 더 많이 집어넣었기 때문에 일본인과 중국인을 포함한 동양인이 그래프의 거의 절반을 차지하고 있지만, 이는 단순히 집어넣은 데이터의 양 때문에 그런 것입니다. 그런데 흥미롭게도 동양인 그룹에서 일본인과 중국인이 나뉘는데, 김성진 원장님과 모친은 그렇게 나뉘는 거의 정중앙에 위치하게 되지요. 이 자료는 단일염기다형성 (SNP) 마커를 가지고 분류한 자료입니다.

인류의 이주와 상호고립에 따른 다양성
현재 65억 인류는 과거 아프리카로부터의 확산 이후 소규모 부족 단위의 생활을 오랜 시간 지속해왔습니다. 그들이 지구상 여러 지역으로 퍼져나간 고대의 인류는 식량의 부족과 이동 수단의 빈한으로 인한 상호 고립이 "소규모의 부족 단위 생활과 유전적 다양성의 획득"이라는 현상을 초래합니다.

마지막 빙하기 이후 농업을 통한 인구 증가와 영역 확장
약 1만 8천년전 정점을 이룬 마지막 빙하기 이후 인류는 농업이라는 안정적 식량 생산 기술을 개발하게 되고, 이를 통해 늘어난 인구를 지탱하기 위해 거주 영역을 확장하게 됩니다.

사촌들의 재회와 다양성의 확대
이때 과거에 헤어진 동료들을 다시 만나게 되고, 이후에는 상호 문화, 기술을 포괄한 사회적 교류와 "획득한 유전적 다양성"의 교류가 일어나게 됩니다. 이를 소위 "혼혈"이라 하고, 안정화의 시간 후 제 3의 인족이 됩니다.
이러한 "유전적 다양성의 교류"는 새로운 유전적 다양성을 낳게 되고, 현재 우리가 마주치는 다양한 인족(Ethnic group)의 스펙트럼의 결과로 나타나게 됩니다. 이러한 현상에서 또한 주목할 것으로 인족의 스펙트럼에서 "유전적 유사성의 정도는 물리적 거리와 반비례한다"는 사실입니다.

한국인은 일본인과 중국인의 중간에 위치
위에까지 말한 두가지 사실들은
1) 인류의 아프리카로부터의 확산 이후, 상호 고립 및 혼혈에 의한 다양한 인족 형성
2) 물리적 거리가 상호 유전적 교류의 핵심으로 인족들간의 혈연적 유사성은 지리적 거리에 반비례이며,

이에 비추어 한국인, 중국인, 일본인의 유전적 형태를 조사한 최근의 보고들을 보면,
1) 모두다 북동아시아인의 후손으로 세 나라의 구성원들은 상호 유전적 연속성을 보이며(근대적 국가관의 수립 이전에 섞였으므로),
2) 중국인들은 육로를 통해 태국등지의 아시아인들과의 유전적 교류의 흔적이 나타나고, 일본인들은 해양을 통한 남아시아인과의 교류와 아시아계의 또다른 고인류의 흔적이 보인다.
3) 한국인은 이웃한 두 지역들과 유전적으로 상호 교류했으며,
4) 유전적 분석법을 통해 본 이 지역의 계통도는 "한국이 중국과 일본의 중앙에 위치"함과 동시에 "뚜렷한 인족간의 구별"이 가능함을 보여준다.

는 것이 현재까지 "분자적 역사 기록"인 유전체를 통해 본 과거 역사 시대 이전의 세계 및 동북아시아의 역사입니다.

 

 

 

4개국 이외의 다른 나라에서 아직 하지 않는 이유는 무엇인지요.

 

 

선진국의 대부분의 나라에서도 진행중이고, 중국, 사우디에서도 추진중입니다. 현재 영국의 생어센터와 미국 국립보건원이 국제 컨소시엄을 통해 1000명의 개인 유전체를 해독하는 사업이 2008년 시작되었고, 하바드 대학의 조지 처치 교수는 구글 (Google)사와 합작으로 10만 명의 유전체 해독 프로젝트 (Personal genome project)를 공식적으로 출범했습니다. 미국의 Complete Genomics라는 회사는 룩셈부르크 정부의 맞춤의학프로젝트의 일환으로 2010년부터 20,000명의 개인 유전체를 해독할 예정입니다. 모든 나라에서 하지 않고 있는 것은, 각 나라의 유전체분야 기술과 수준이 조금씩 차이가 있고, 각 나라의 주요 연구기관 및 회사들이 개인유전체학을 통해 어떻게 주도권을 잡고 전략적으로 우월한 위치를 점할 수 있을지 고심하고 있는 단계이기 때문입니다. 실제로, 네들란드에서는, 한 여성의 개인유전체가 해독이 되었으나, 기술적인 분석의 문제로 공개가 안된 상황입니다. 또, 이 분야는 순수연구분야가 아니고, 이미 산업화 수준에 와있기 때문에, 개인유전체의 중요성을 인지하는 나라나 기관은 적은 돈으로 서열해석을 시작할 수 있습니다. 가장 큰 걸림돌은 이러한 막대한 개인의 유전체정보가 나왔을때, 그것을 어떻게 컴퓨터로 해석하는가가 가장 어려운 문제입니다. 이런 정보 해석방법에 있어서는 선진국이 높은 기술들을 가지고 있습니다.

구글, 마이크로소프트사같은 정보처리 회사는 개인유전체의 중요성을 몇년전 부터 간파하고, 이미 자본을 투입한 상태라서, 선진국들에서, 개인유전체분야가 대중화되는 데는 2년이 채 안 걸릴 것입니다.

현재 완료된 개인유전체를 보면, 이미 서양인 2명, 나이지리아 흑인 1명, 동양인1명 정보가 알려진 상황입니다. 선진국 뿐만 아니라, 자기 민족의 미래 의료분야에 투자할 여력이 있는 사우디 같은 나라에서는 100명의 아랍인 유전체 프로젝트를 시작했습니다. 사우디의 리야드에서, 국왕을 필두로, 여러 회사가 컨설시움을 이루어 “아랍 민족에게 있어서 개인 맞춤의약 시대를 개척하기 위한 첫 번째 이정표로써 2010년까지 우수한 질의 100명의 아랍인의 유전체를 해석하는 큰 프로젝트를 수행한다. 그리고 우리의 목표는 질적,양적인 면에서 국제적인 어떠한 프로젝트에 뒤지지 않게 하는 것이다.” 라고 선언을 했습니다.

 

 

 

유전체 서열을 밝히는 것이 어느 정도 수준의 기술과 어떤 기술이 필요한지 알려주세요.

 

 

유전체 서열을 밝히는 데는 두 가지가 핵심입니다. 먼저, 실험적으로 DNA의 서열을 해독하는 과정이 필요하고, 이를 다시 생명정보학(Bioinformatics)적으로 분석하는 해석 과정이 필요합니다. 실험적 DNA 서열해독은 현재 서열 해독기술의 비약적인 발전으로 (앞으로 더 큰 기술진보가 이루어질 예정) 비용이 많이 내려갔고, 상업용 장비를 이용하기 때문에 많이 표준화되고 있는 상황입니다. 이렇게 매우 빠른 상업적 기계들을 "차세대 서열해독기"라고 부릅니다. 이 기계들은 첨단 나노기술들을 겸비한 고가의 장비들입니다. 따라서, 개인유전체 분석을 위한 실험에서는 서열해독 자체보다는 오히려 서열해독 전에 시료를 준비하는 과정에 있어서 기술의 우열이 가려지고 있습니다. 시료를 잘 분리해내는 장비기술, 시료를 증폭하는 기술, 시료의 신호를 측정하는 기술등도 필요합니다. 간단히 말하면, 서열해독은 나노기술의 복합체라고 볼수있습니다. 서열해독은 이런 장비의 발달로 인해, quality등에서 문제가 없어서, 연구비만 있으면, 유전체 서열을 쉽게 해독해 낼수 있는 시대가 되었습니다.

생명정보학은 이렇게 해독된 서열에서 생물학적 의미를 찾아내는 역할을 하기 때문에 그 중요성이 더욱 증대될 것이며, DNA 서열해독이 보편화될 경우 (예를 들어, 우리나라의 모든 신생아의 유전체 서열이 일상적으로 분석될 경우) 엄청난 양의 컴퓨터 CPU를 이용해, 대용량으로 데이터를 처리하고 분석해서, 의학적으로 활용할 수 있는 정보를 추출하는 일을 하게 됩니다. 생명정보학은 단순한 개인용 컴퓨터를 이용하는 것이 아니라, 수백개의 생명정보학 알고리듬을 수천개의 생물관련 데이타베이스와 서로 엮고, 이것을 클러스터화된 컴퓨터 수백 개를 동시에 사용하여 정보를 처리합니다. 따라서, 많은 전산관리 경험을 요구합니다. 예를 들면, 수천개의 컴퓨터를 동시에 엮는 그리드(GRID)전산 시스템등이 앞으로 필요합니다. 생명정보학부분에서 가장 어려운 것은 수십억개의 DNA염기들이 개개인간 서로 어떻게 다른가를 찾아내고, 그 차이들이 어떤 실용적 차이(표현형질)를 내는가를 정확히 계산해 내는 일입니다. 이것을 위해, 수 많은 생명의학분야의 논문을 분석하고, 데이타베이스를 뒤지는 컴퓨터 프로그램을 만듭니다.

 

 

 

벤터나 중국인과 0.05%,0.04% 다르다는 데 어떤 것이 다른지 구체적인 예를 들어주면 좋겠습니다.

 

 

개인간의 총체적 유전적 차이를 쉽게 퍼센트로 표현한 것입니다. 글에 보시면, 유전체내에서 단염기다형성 (SNP)를 비교했을 때 그만큼 차이가 난다는 말이 나오는데 이를 비유하여 설명하면 다음과 같습니다. 팔만대장경 원본에는 약 5천2백만 글자가 수록되어있습니다. 인간의 유전체에는 약 30억개의 글자가 수록되어 있습니다. 사람은 모두 같은 종에 속하기 때문에, 개개인의 유전체는 그 구조나 본 바탕이 거의 동일하지만, 세밀히 분석하면 조금씩 다릅니다. 이러한 미세한차이의 대부분을 차지하는 것이 단염기다형성(SNP)입니다. 이 미세한 차이 때문에 우리의 겉모습, 키, 그 외의 모든 신체적 특징과, 체질, 성격에 차이가 나는 것입니다.

여기서, 우리와 매우 가까운 인족인 중국인과도, 수십에서 수백만개의 단염기다형성(SNP)이 차이가 나는데, 그것을 쉽게 계산하면, 약 0.04% 의 DNA차이가 난다는 뜻입니다. 이것이 매우 작은 것 같지만, 실제적으로는 매우 큰 표현 형질을 나타낼수도 있도, 질병을 일으키기도 합니다.
이번 분석을 통해, 중국인과 한국인은 많은 유전적 차이를 가지고 있기 때문에, 한국인의 개인유전체를 해독했었어야 했다는 결론도 얻었습니다.

예를 들면, 중국인의 10번 염색체의 20000 번째 염기는 A 많은데, 한국인은 G가 많은 경우입니다. 이 경우, 그 염기가 유전자의 기능에 영향을 미칠수 있습니다.