SlideShare a Scribd company logo
휴먼게놈프로젝트와 컴퓨터   Human genome project and Computer science 김형용 , Insilicogen, Inc.
순서 생물학 백그라운드 Genome의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여
Genome 게놈 ?  지놈 ? 유전자 (gene),  유전체 (genome)
Great 3 books 우주 – 생명 - 인간
Central Dogma of Molecular Biology
 
Protein structure 20 Amino acids Sequence specifies conformation RNase
Life DNA’s common method of producing more DNA Review the life
Evolution Self replicator
Chromosome 1 cM ~= 1 Mbps
Gene structure
 
Junk DNA 전체  Genome 의  5% 만이 단백질이 되는 영역 .  그렇다면 나머지는 ? Repetitive sequence LINE (>300bps) SINE (300bps), Alu (30000~50000 개 ) Microsatelite
Human genome 3~4x10 14  cells (~=2 45 ) > 200 cell type  3x10 9  bps (3Gbps = 3Gbyte)  20000~25000  Gene s  98% unknown functional  DNA   0.1% difference with you Information theory : 30Mbyte
Human genome project DOE, NHGRI  에서 시작 . 2003 년 공식 완료 . 13 년 . 7 개국 참여 95% 나 되는  Junk DNA  를 꼭 그 많은 돈을 들여서 해야만 했는가 ? 목적 Human DNA  에서 모든  Gene 의 동정  30 억 염기서열의 결정  Database 에 결과의 저장  이를 분석할 수 있는 도구의 향상  관련 윤리적 문제의 연구
History PCR RFLP Genetic marker BAC Shotgun sequencing Whole genome shotgun
Gel Electrophoresis 젤 ( 그물막 ) 에 전하를 띤 물질을 통과시킴으로 ,  분리하는 방법 .  작을수록 멀리 ~ DNA, Protein
PCR Polymerase Chain Reaction
Genetic marker Polymorphic allele locus
 
Genetic map
Cloning 무지 작은 저 분자를 하나씩 직접 읽을 수 없다 . 따라서 , “ 동일” 한 것들 여러 개를 갖고 실험
Gene cloning Gene cloning  과정 Genome 상에서 원하는 영역을 정한다 .  원하는 영역을 뽑아낼 수 있는  PrimerDesign 을 한다 .  PCR 로 해당영역의  major band 를 확인하고 ,  추출한다 .  CloningVector 에 삽입한다 .  Selection 의 과정을 통해 ,  해당 유전자가 삽입된 벡터가 들어있는 클론을 선발한다 .  Cloning vector Plasmid  :  Cosmid  : 30 kb  BAC  : 350 kb  YAC  : 2 Mb  이상  PAC  : 300 kb
DNA sequencing
DNA sequencing
Frederic Sanger DNA, Protein 유효길이  700-800bp DNA sequencing
Shotgun sequencing 게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤 ,  아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다 .  재조립하기 위해 파괴하는 것 ,  그것이 분자생물학자들의 저주받을 운명이고 직업적 강박관념이다 .  --  다니엘코엥 ,  휴먼게놈을 찾아서
Genome sequencing Clone by clone method Genetic marker 에 따라  BAC  선발 후  shotgun Whole genome shotgun 무작정  shotgun Repeat  로 인한 조립에의 어려움 . 컴퓨터만 믿는다 .
Current status (since 2003) Human Chromosome 4 Completed, April 2005.  Human Chromosome 2 Completed, April 2005.  Human Chromosome X Completed, March 2005.  Human Chromosome 16 Completed, December 2004.  Human Gene Count Estimates Changed to 20,000 to 25,000, October 2004.  Human Chromosome 5 Completed, September 2004.  Human Chromosome 9 Completed, May 2004.  Human Chromosome 10 Completed, May 2004.  Human Chromosome 19 Completed, March 2004.  Human Chromosome 13 Completed, March 2004.  Human Chromosome 6 Completed, October 2003.  Human Chromosome 7 Completed, July 2003.  Human Chromosome Y Completed, June 2003.  Human Genome Project Completion: 1990-2003 (April 2003)
Genome browser UCSC Genome browser NCBI Genome browser Ensembl VistaBrowser
Genetic disease – before HGP
Genetic disease – after HGP
Comparative genomics Synteny (Gene order), Gene duplication, Gene fusion
 
Comparative genomics
SNP Single Nucleotide Polymorphism 종간 다양성    종내 다양성 염기변화    유전자내    아미노산변화    구조변화
Haplotype
 
HapMap 일본 ,  영국 ,  중국 ,  캐나다 ,  미국 ,  나이지리아  Project 의 목표는  MinorAllele 의 빈도가 최소  5%  이상이고 평균 간격이  5 kilobase  인  60 만개  SNPs 을  genotype  하는 것
Transcriptome, Proteome EST DNA chip Proteomics
EST Expression Sequence Tag
 
 
 
Transformational grammar Regular grammar : computer program Context free grammar : DNA  Palindrome, “다시 합창합시다” Context sensitive grammar Unrestricted Grammar : 자연어
Sequence alignment
Smith-Waterman algorithm
BLAST Unknown sequence Known sequence Database
Object oriented programming Computer programming paradigm 생명현상의 모델링
마치며… Rosetta stone Programming

More Related Content

PDF
NGS(Next-Generation Sequencing) Introduction
Shin Kim
 
PPT
Social Networking Service
semi06
 
PDF
맥스 서밋 부스 매뉴얼
Mobidays
 
PPTX
Coffee u sequencing_0609
Rightbrain UX1 Consulting group
 
PPT
SIMTOS2008_relation ppt
bsofa
 
PPTX
감각기관(후각, 미각, 촉각)
supia317
 
PPTX
SolidWorks Model : SW2015XB-07
Taehwan Kim
 
PDF
Sequencing technology 분석 이승배
SEUNG BAE LEE
 
NGS(Next-Generation Sequencing) Introduction
Shin Kim
 
Social Networking Service
semi06
 
맥스 서밋 부스 매뉴얼
Mobidays
 
Coffee u sequencing_0609
Rightbrain UX1 Consulting group
 
SIMTOS2008_relation ppt
bsofa
 
감각기관(후각, 미각, 촉각)
supia317
 
SolidWorks Model : SW2015XB-07
Taehwan Kim
 
Sequencing technology 분석 이승배
SEUNG BAE LEE
 

Similar to HGP And Computer (11)

PPTX
2013_08_30_Bioinformatics1_yes
Eunsil Yoon
 
PDF
Analytics of genomics tech 이승배
SEUNG BAE LEE
 
PDF
[2014년 5월 20일] 바이오 및 의료산업동향
gilforum
 
PPTX
2009 생명공학백서 4장
Soo-Ik Chang
 
PPTX
유전통계학의 오늘과 내일(고려대학교 특강)
Woosung Yang
 
PPTX
생명공학백서
혜지 신
 
PDF
[2014년 5월 20일] 바이오 및 의료산업동향
gilforum
 
PDF
유전자 분석시장 개요 및 동향 2013년 4월
민영 김
 
PDF
Ngs cancer panel 이승배
SEUNG BAE LEE
 
PPTX
차원용의 미래_12_유전자 가위(CRISPR/Cas)
wycha
 
PDF
Bioinformatics tool & database 20130722 이승배
SEUNG BAE LEE
 
2013_08_30_Bioinformatics1_yes
Eunsil Yoon
 
Analytics of genomics tech 이승배
SEUNG BAE LEE
 
[2014년 5월 20일] 바이오 및 의료산업동향
gilforum
 
2009 생명공학백서 4장
Soo-Ik Chang
 
유전통계학의 오늘과 내일(고려대학교 특강)
Woosung Yang
 
생명공학백서
혜지 신
 
[2014년 5월 20일] 바이오 및 의료산업동향
gilforum
 
유전자 분석시장 개요 및 동향 2013년 4월
민영 김
 
Ngs cancer panel 이승배
SEUNG BAE LEE
 
차원용의 미래_12_유전자 가위(CRISPR/Cas)
wycha
 
Bioinformatics tool & database 20130722 이승배
SEUNG BAE LEE
 
Ad

HGP And Computer

  • 1. 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science 김형용 , Insilicogen, Inc.
  • 2. 순서 생물학 백그라운드 Genome의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여
  • 3. Genome 게놈 ? 지놈 ? 유전자 (gene), 유전체 (genome)
  • 4. Great 3 books 우주 – 생명 - 인간
  • 5. Central Dogma of Molecular Biology
  • 6.  
  • 7. Protein structure 20 Amino acids Sequence specifies conformation RNase
  • 8. Life DNA’s common method of producing more DNA Review the life
  • 10. Chromosome 1 cM ~= 1 Mbps
  • 12.  
  • 13. Junk DNA 전체 Genome 의 5% 만이 단백질이 되는 영역 . 그렇다면 나머지는 ? Repetitive sequence LINE (>300bps) SINE (300bps), Alu (30000~50000 개 ) Microsatelite
  • 14. Human genome 3~4x10 14 cells (~=2 45 ) > 200 cell type 3x10 9 bps (3Gbps = 3Gbyte) 20000~25000 Gene s 98% unknown functional DNA 0.1% difference with you Information theory : 30Mbyte
  • 15. Human genome project DOE, NHGRI 에서 시작 . 2003 년 공식 완료 . 13 년 . 7 개국 참여 95% 나 되는 Junk DNA 를 꼭 그 많은 돈을 들여서 해야만 했는가 ? 목적 Human DNA 에서 모든 Gene 의 동정 30 억 염기서열의 결정 Database 에 결과의 저장 이를 분석할 수 있는 도구의 향상 관련 윤리적 문제의 연구
  • 16. History PCR RFLP Genetic marker BAC Shotgun sequencing Whole genome shotgun
  • 17. Gel Electrophoresis 젤 ( 그물막 ) 에 전하를 띤 물질을 통과시킴으로 , 분리하는 방법 . 작을수록 멀리 ~ DNA, Protein
  • 20.  
  • 22. Cloning 무지 작은 저 분자를 하나씩 직접 읽을 수 없다 . 따라서 , “ 동일” 한 것들 여러 개를 갖고 실험
  • 23. Gene cloning Gene cloning 과정 Genome 상에서 원하는 영역을 정한다 . 원하는 영역을 뽑아낼 수 있는 PrimerDesign 을 한다 . PCR 로 해당영역의 major band 를 확인하고 , 추출한다 . CloningVector 에 삽입한다 . Selection 의 과정을 통해 , 해당 유전자가 삽입된 벡터가 들어있는 클론을 선발한다 . Cloning vector Plasmid : Cosmid : 30 kb BAC : 350 kb YAC : 2 Mb 이상 PAC : 300 kb
  • 26. Frederic Sanger DNA, Protein 유효길이 700-800bp DNA sequencing
  • 27. Shotgun sequencing 게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤 , 아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다 . 재조립하기 위해 파괴하는 것 , 그것이 분자생물학자들의 저주받을 운명이고 직업적 강박관념이다 . -- 다니엘코엥 , 휴먼게놈을 찾아서
  • 28. Genome sequencing Clone by clone method Genetic marker 에 따라 BAC 선발 후 shotgun Whole genome shotgun 무작정 shotgun Repeat 로 인한 조립에의 어려움 . 컴퓨터만 믿는다 .
  • 29. Current status (since 2003) Human Chromosome 4 Completed, April 2005. Human Chromosome 2 Completed, April 2005. Human Chromosome X Completed, March 2005. Human Chromosome 16 Completed, December 2004. Human Gene Count Estimates Changed to 20,000 to 25,000, October 2004. Human Chromosome 5 Completed, September 2004. Human Chromosome 9 Completed, May 2004. Human Chromosome 10 Completed, May 2004. Human Chromosome 19 Completed, March 2004. Human Chromosome 13 Completed, March 2004. Human Chromosome 6 Completed, October 2003. Human Chromosome 7 Completed, July 2003. Human Chromosome Y Completed, June 2003. Human Genome Project Completion: 1990-2003 (April 2003)
  • 30. Genome browser UCSC Genome browser NCBI Genome browser Ensembl VistaBrowser
  • 31. Genetic disease – before HGP
  • 32. Genetic disease – after HGP
  • 33. Comparative genomics Synteny (Gene order), Gene duplication, Gene fusion
  • 34.  
  • 36. SNP Single Nucleotide Polymorphism 종간 다양성  종내 다양성 염기변화  유전자내  아미노산변화  구조변화
  • 38.  
  • 39. HapMap 일본 , 영국 , 중국 , 캐나다 , 미국 , 나이지리아 Project 의 목표는 MinorAllele 의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60 만개 SNPs 을 genotype 하는 것
  • 40. Transcriptome, Proteome EST DNA chip Proteomics
  • 42.  
  • 43.  
  • 44.  
  • 45. Transformational grammar Regular grammar : computer program Context free grammar : DNA Palindrome, “다시 합창합시다” Context sensitive grammar Unrestricted Grammar : 자연어
  • 48. BLAST Unknown sequence Known sequence Database
  • 49. Object oriented programming Computer programming paradigm 생명현상의 모델링