.Genome analysis of 500,000 people completed, revealing 1.5 billion mutations
mss(magic square system)master:jk0620
http://blog.naver.com/mssoms
http://jl0620.blogspot.com
https://www.facebook.com/junggoo.lee.54/photos_by
https://www.facebook.com/jennidexter/photos_by
Starship version space science


메모 2508121726_소스1. 재해석【】
소스1. https://share.google/mnhHOTg8S91cKa4LC
.Genome analysis of 500,000 people completed, revealing 1.5 billion mutations
50만명 유전체 정밀 분석 완료…변이만 15억개 발견
2025.08.08 07:51
세계 최대 규모 英 바이오뱅크 전장유전체시퀀싱 마무리
'세계 최대 유전자 정보 보관소'라 불리는 영국 바이오뱅크(UK Biobank)에 참가한 약 50만 명의 유전체 전체가 '시퀀싱'됐다.
1-1.
'세계 최대 유전자 정보 보관소'라 불리는 영국 바이오뱅크(UK Biobank)에 참가한 약 50만 명의 유전체 전체가 '시퀀싱'됐다. 시퀀싱이란 유전정보를 담고 있는 약 30억개에 달하는 DNA의 염기서열을 읽는 작업이다.
<<<<<>>>>^!^
^인간의 염기서열은 30억개가 msbase.mode화 되었다. 이들의 msdna 고유배열은 도대체 몇개일까?
^sample4.을 기준으로 18차 msbase.dna는 2^43의 고유 배열이 나타난다.
sample4. msoss(darkdna?)
zxdxybzyz
zxdzxezxz
xxbyyxzz
zybzzfxzy
cadccbcdc
cdbdcbdbb
xzezxdyyx
zxezybzyy
bddbcbdca
^ sample4.msdna를 재차 oss로 증식하면 36차 msdna가 나타나고, 이를 msbase화 하면 6차 msoss.base.dna가 나타난다. 이는 유한적 무한의 고유 배열수가 된다.
^왜 이처럼 많은 정보를 가질까?
지적인 우주 생물체에게는 다중우주적인 DNA 데이타가 필요했으리라. 허허. 지적인 인간은 단순하게 생물학적으로 다윈 진화된 게 아니다. multiuniverse.msoss.dna를 가졌기에, 무한대의 고유 염기배열을 가질 수 있었다. 어허.
^ 인간의 개체 고유속성을 dnabase로 풀어보면 거의 기적인 염기서열의 조합이다.
인간의 dna 모든 속성을 100퍼센트 빅데이타화 시킬 수 있다. 다만 그 데이타가 우주적 크기 이라는데, 난맥이 있다. 어허.
그래서, 개인의 dna 유전체로 의학정보을 완벽하게 치료에 적용한다는 건 넌센스이다.
^ 다만 확률적인 범주형 데이타는 유효할 수 있다. 허허.
1-2.
이미 데이터가 전 세계에 공개돼 생명공학 연구에 큰 기여를 하고 있는 영국 바이오뱅크는 이번 작업이 희귀 유전질환 원인 분석, 신약 개발, 유전자 변이 발견 등에 중요한 역할을 할 것으로 기대된다.
1-3.
영국 바이오뱅크 재단, 영국·스웨덴 아스트라제네카, 아이슬란드 디코드 제네틱스 등 국제 공동연구팀은 영국 바이오뱅크의 참가자 49만 640명의 유전체 데이터를 대상으로 전장 유전체 시퀀싱(WGS)를 완료하고 분석한 결과를 6일(현지시간) 네이처에 공개했다.
2.
영국 바이오뱅크는 영국인들을 대상으로 한 대규모 건강 연구 데이터다. 영국 정부의 지원을 받아 영국 국민 약 50만명의 건강·유전체·생활습관 데이터를 장기적으로 수집한 데이터다. 암과 희귀질환 극복을 위한 최첨단 유전자 발굴 연구 수행이 목표다.
2-1.
현재 전 세계 과학자들이 영국 바이오뱅크 데이터를 공공 데이터 자원으로 활용하고 있다. 세계에서 가장 크고 영향력 있는 데이터베이스인 셈이다.
2-2.
연구팀은 영국 바이오뱅크 참가자 유전체 전체를 시퀀싱하는 작업을 완료했다. 지금까지는 데이터를 대상으로 단일염기서열변이(SNP) 어레이 분석, 전장 엑솜 시퀀싱(WES)만 이뤄졌다.
2-3.
SNP 어레이 분석이란 개인의 유전적 차이를 만드는 결정적인 염기서열 변이를 파악하는 기술이다. WES는 유전자 중 단백질을 만드는 부위만 읽는 방법이다. 단백질을 만드는 부위는 질병을 일으키는 유전자를 찾는 데 결정적인 힌트를 준다.
두 방법 모두 희귀한 변이나 단백질을 만들지 않지만 질병을 일으킬 수 있는 부위를 읽지 못하는 한계가 있다. 크기가 큰 구조 변이를 파악하기도 어렵다. WGS를 이용하면 다양한 변이를 다수 발견할 수 있고 유전체에 대한 정확한 분석이 가능해진다.
3.
연구팀은 참가자 유전체 전체를 32.5배 커버리지로 시퀀싱했다. 인간의 DNA는 매우 길기 때문에 한 번에 통째로 읽을 수 없다. 짧게 쪼개서 읽는다. 이렇게 나누어서 읽다 보니 여러 조각을 여러 번 읽게 되는 경우가 발생한다. 여러 번 읽는 정도를 커버리지라고 한다.
3-1.
32.5배 커버리지로 시퀀싱했다는 말은 한 DNA 조각을 평균 32.5번씩 겹쳐서 읽을 정도로 여러 번 유전체를 반복해서 읽고 비교했다는 의미다. 데이터가 매우 정확하고 신뢰할 수 있는 수준이라는 뜻이다.
3-2.
-연구팀이 참가자 유전체 전체를 시퀀싱한 결과 약 15억개의 유전 변이를 발견했다. 기존 SNP 어레이 분석 대비 18.8배, WES 대비 40배 이상의 변이를 확보한 것이다.
_WES로는 볼 수 없었던 비암호화(non-coding) 영역도 대거 발견했다. 비암호화 영역이란 단백질을 만들지는 않지만 질병을 일으킬 수 있는 부위를 가리킨다. 또 크기가 큰 구조 변이 270만 개를 새로 발견했다.
_연구팀은 "연구결과는 인간 유전체에 대한 이해를 진전시키고 진단 기술·치료제 개발을 앞당기고 정밀의료 기술을 발전시킬 것으로 기대된다"며 "전 세계 생명공학 연구와 의료의 수준을 높일 것이다"고 말했다.

댓글