3'30" 읽기
- 남성호르몬의 복잡한 구조가 비정상적으로 많은 반복 부분으로 이뤄져 해독이 어려웠다.
- 이전에 알려진 서열에 약 3천만 개의 염기쌍과 41개의 단백질 코딩 유전자를 추가
- Y 염색체의 완전한 서열 분석으로 이제 전체 인간 게놈이 완전히 매핑됨
- 불임의 원인을 진단하기가 더 쉽다.
Y 염색체가 처음으로 완전히 해독됨
남성 성염색체의 최초의 완전한 DNA 코드
처음으로 남성 성염색체의 전체 DNA 코드 서열이 분석됐다. 이는 Y 염색체에 대한 최초의 완전한 매핑이다. 이전에 알려진 서열에 약 3천만 개의 염기쌍과 41개의 단백질 코딩 유전자를 추가한 것이다. 또한 의학적으로 중요한 많은 유전자 복합체와 복사본의 기본 서열을 보여준다. Y 염색체의 완전한 서열 분석으로 이제 전체 인간 게놈이 완전히 지도화되었다.
 |
▲ 남성 성염색체는 생물학적 성과 생식에 중요합니다. © vchal/게티 이미지 |
남성 성염색체는 인간 염색체 중 가장 작고 가장 열악한 염색체다. 진화 과정에서 유전 정보의 거의 90%가 손실되었다. 그럼에도 불구하고 Y 염색체는 반드시 필요하다. 남성의 성 발달과 정자 생산을 조절하고 세포 분열인 감수분열에 중요한 유전자를 운반하기도 한다. 최근 연구에 따르면 노인 남성의 일부 세포에서 Y 염색체가 손실되면 심장병, 암 및 기타 질병의 위험이 증가하는 것으로 나타났다.
Y 염색체가 복잡한 이유이러한 중요성에도 불구하고 Y 염색체는 아직 완전히 서열이 밝혀지지 않은 게놈의 유일한 부분이었다. X 염색체와 게놈의 나머지 부분은 2022년부터 원활하게 매핑되었다. 그에게서 필수 유전자가 알려졌음에도 불구하고 그의 DNA 코드 중 약 절반은 순서가 없는 상태로 남아 있었다. 그 이유는 남성호르몬의 복잡한 구조가 비정상적으로 많은 반복 부분으로 이루어져 있기 때문이다. 회문구조(palindrome : DNA 분자상의 염기서열이 오른쪽에서 읽어도, 왼쪽에서 읽어도 같은 구조를 가지는 현상)그 그 안에 축적된다. DNA 코드가 서로의 거울 이미지처럼 정확하게 복사되는 긴 뻗기이다.
과거에 사용된 서열 분석 방법으로는 복사된 부분이나 매우 유사한 부분을 읽고 올바른 순서로 재조립하는 것이 불가능했다. 그러나 기술 발전 덕분에 시퀀싱 시스템은 이제 한 번에 최대 백만 개의 염기쌍 섹션을 읽을 수 있다. 이를 통해 동일한 반복을 많이 수행하여 게놈의 일부라도 해독할 수 있다. 한편, 인공지능은 DNA 조각을 조립하는 데에도 사용된다.
 |
▲ Y 염색체는 가장 작고 열악한 염색체이지만, 특히 서열을 완전하게 파악하는 것은 어렵다. © Darryl Leja/국립인간게놈연구소(NHGRI) |
이전에 매핑되지 않은 3천만 개의 염기쌍이러한 방법을 사용하여 T2T(Telomere-to-Telomere) 컨소시엄은 이제 Y 염색체의 염기서열을 완전히 분석하는 데 성공했다. 베데스다 소재 국립인간게놈연구소(NHGRI)의 Arang Rhie와 그의 동료들은 "결과 지도에는 간격이나 모델 추가 서열 없이 Y 염색체의 6246만 염기쌍이 모두 포함되어 있다"고 보고했다. 따라서 서열분석은 이전에 알려진 이 염색체의 DNA 부분에 약 3천만 개의 염기쌍을 추가했다.
새로 배열된 섹션에는 41개의 단백질 코딩 유전자와 수많은 팔린드롬(회문) 및 반복된 시퀀스가 포함된다. NHGRI의 컨소시엄 리더인 Adam Phillippy는 "가장 놀라운 점은 이러한 반복이 어떻게 정렬되어 있는지였다"며 “우리는 누락된 부분이 어떻게 구성되어 있는지 사전에 정확히 알지 못했고 매우 혼란스러웠을 수도 있다. 대신에 이 염색체의 거의 절반은 위성 DNA라고도 알려진 두 개의 특정 반복 서열의 교대 블록으로 구성된다. 퀼트 같은 멋진 패턴을 만들어낸다”고 말했다.
불임의 원인을 진단하기가 더 쉽다.Y 염색체의 완전한 서열분석은 또한 의학적으로 중요한 부분에서 몇 가지 특징을 드러낸다. 그중 하나는 정자 생산에 중요한 여러 유전자를 포함하는 소위 무정자증 인자 영역에 영향을 미친다. 이 시퀀싱에서는 여러 개의 회문(palindrpme)이 나타났다.
"이러한 회문은 때때로 DNA 가닥에 루프를 생성할 수 있기 때문에 이 구조는 매우 중요하다"라고 Rhie는 설명했다. "이러한 루프가 우연히 절단되면 게놈에 유전적 결함이 발생할 수 있다." 무정자증 인자 영역의 이러한 DNA 손실은 영향을 받은 남성의 정자 생산을 방해하고 불임을 유발하는 것으로 알려져 있다. 현재 알려진 이 영역의 시퀀스 덕분에 이러한 손실은 미래에 더 쉽게 식별될 수 있다.
복사 복합체의 개별 변형Y 염색체의 의학적으로 중요한 또 다른 부분은 소위 TSPY 배열이다. 여기에는 정자 생산에도 중요한 TSPY 유전자와 그 수많은 사본이 포함된다. 그들은 함께 전체 인간 게놈의 두 번째로 큰 복사본 복합체를 형성한다. 새로운 서열 분석은 이제 처음으로 이 TSPY 배열의 정확한 기본 서열을 보여 주며, 사본의 수가 남성마다 10~40개 사이로 다양할 수 있음을 알게 됐다.
"이전에 알려지지 않은 변종을 발견하면 인간 건강을 더 잘 이해하는 데 도움이 될 것이라는 희망이 항상 있다"고 Phillippy는 말했다. "의학적으로 관련된 게놈 변이체는 미래에 더 나은 진단 방법을 개발하는 데 도움이 될 수도 있다." 볼티모어에 있는 존스 홉킨스 대학교의 공동 저자 Dylan Taylor도 비슷한 견해를 가지고 있다. "이제 우리는 Y 염색체의 100% 완전한 서열을 얻었으므로 우리는 이전에 인간의 특성과 질병에 영향을 미칠 수 있었던 수많은 유전적 변이를 식별하고 탐색할 수 있다"라고 Taylor는 말했다.
박테리아 게놈의 Y-DNAY 염색체의 완전한 해독은 완전히 예상치 못한 또 다른 발견을 가져왔다. 연구자들은 새로 생성된 DNA 서열을 박테리아 게놈의 대규모 데이터베이스의 서열과 비교했을 때 놀라운 수의 유사성을 발견했다. 데이터베이스에 포함된 5,100개 이상의 박테리아 게놈에는 인간 Y 염색체 코드의 짧은 부분이 포함되어 있다.
Rhie는 “놀랐다”라고 말했다. 해독 후 박테리아 게놈은 인간 DNA에 의한 오염 가능성을 정기적으로 확인했다. 그러나 이러한 테스트는 서열이 알려진 인간 DNA 단편만을 검출할 수 있으며, 남성 성염색체의 큰 부분에는 그렇지 않다. 이제 Y 염색체의 DNA 지도에 있는 간격의 현재 순서를 통해서만 이러한 불순물을 식별할 수 있다.
(Nature, 2023; doi: 10.1038/s41586-023-06457-y)
출처: NIH/ National Human Genome Research Institute, Johns Hopkins University
[더사이언스플러스=문광주 기자]
[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]