SlideShare a Scribd company logo
การวิเคราะหขอมูลผูปวยมะเร็งเตานม
ในขั้นตอนการวินิจฉัย
โดย
B5304516 นายภูริเดช สุดสี
Sunday, December 9, 12
ชื่อขอมูล : Wisconsin Diagnostic Breast Cancer (WDBC)
ผูสราง : Dr. William H. Wolberg , W. Nick Street,
Olvi L. Mangasarian
จำนวนตัวอยาง : 569 ตัวอยาง
จำนวน Attributes : 32 Attributes
Missing value : ไมมี
การกระจายของ diagnosis ในกลุมตัวอยาง :
357 benign , 212 malignant
ขอมูลของ Dataset
Sunday, December 9, 12
3
ลำดับที่ 1 : ID number
ลำดับที่ 2 : ระดับความรุนแรง (M – “รุนแรงมาก” , B – “รุนแรงนอย”)
ลำดับที่ 3-32 : แบงขอมูลออกเปน 3 ชุด แตละชุดมี 10 คาขอมูล ดังนี้
a) รัศมี
b) ความแนน
c) ความยาวโดยรอบ
d) พื้นที่
e) ความเรียบ
f) การจัดกลุม
g) สวนเวา (สวนตางสวนเวาของรูปราง)
h) จุดสวนเวา
i) คาความสมมาตร
j) มิติเศษสวน (“การประมาณชวงขอบ” – 1)
(1) id (2) diagnosis (3) raius_m (4) texture_m (5) perimeter_m
(6) area_m (7) smoothness_m (8) compactness_m (9) concavity_m (10) concave_point_m
(11) symmetry_m (12) fractal_dimension_m (13) raius_se (14) texture_se (15) perimeter_se
(16) area_se (17) smoothness_se (18) compactness_se (19) concavity_se (20) concave_point_se
(21) symmetry_se, (22) fractal_dimension_se (23) raius_w (24) texture_w (25) perimeter_w
(26) area_w (27) smoothness_w (28) compactness_w (29) concavity_w (30) concave_point_w
(31) symmetry_w (32) fractal_dimension_w
Attributes
Sunday, December 9, 12
Sunday, December 9, 12
Dataset
Sunday, December 9, 12
Sunday, December 9, 12
Target goal เปนระดับ
ความรุนแรง (diagnosis)
Sunday, December 9, 12
8
Decision Tree 94.56%
Rule Induction93.15%
k-NN 83.65%
Naive Bayes 93.51%
Sunday, December 9, 12

More Related Content

PPTX
A Novel Approach for Breast Cancer Detection using Data Mining Techniques
ahmad abdelhafeez
 
PPTX
Data Mining Techniques In Computer Aided Cancer Diagnosis
DataminingTools Inc
 
PPTX
Machine Learning - Breast Cancer Diagnosis
Pramod Sharma
 
PPTX
a novel approach for breast cancer detection using data mining tool weka
ahmad abdelhafeez
 
PPS
Data Mining - Classification Of Breast Cancer Dataset using Decision Tree Ind...
Sunil Nair
 
PDF
Kafka for developer
Bhuridech Sudsee
 
PDF
Xss and sql injection
Bhuridech Sudsee
 
PPTX
Introduction to Quantum Computing
Bhuridech Sudsee
 
A Novel Approach for Breast Cancer Detection using Data Mining Techniques
ahmad abdelhafeez
 
Data Mining Techniques In Computer Aided Cancer Diagnosis
DataminingTools Inc
 
Machine Learning - Breast Cancer Diagnosis
Pramod Sharma
 
a novel approach for breast cancer detection using data mining tool weka
ahmad abdelhafeez
 
Data Mining - Classification Of Breast Cancer Dataset using Decision Tree Ind...
Sunil Nair
 
Kafka for developer
Bhuridech Sudsee
 
Xss and sql injection
Bhuridech Sudsee
 
Introduction to Quantum Computing
Bhuridech Sudsee
 

More from Bhuridech Sudsee (18)

PDF
$ Spark start
Bhuridech Sudsee
 
PDF
เสี่ยวเอ้อสอน Spark
Bhuridech Sudsee
 
PDF
Jpa sa-60
Bhuridech Sudsee
 
PDF
18 ฝ่ามือพิชิต docker
Bhuridech Sudsee
 
PDF
Cloud computing
Bhuridech Sudsee
 
PDF
หนังสือภาษาไทย Spark Internal
Bhuridech Sudsee
 
PDF
VBoxManage tutorial
Bhuridech Sudsee
 
PDF
Git ฉบับอนุบาล 2
Bhuridech Sudsee
 
PDF
sample plot 3D form depth map using OpenCV
Bhuridech Sudsee
 
PDF
illustrator & design workshop
Bhuridech Sudsee
 
PDF
The bounded buffer
Bhuridech Sudsee
 
PDF
operating system
Bhuridech Sudsee
 
PDF
Producer and Consumer problem
Bhuridech Sudsee
 
PDF
OPD System with ZK Grails
Bhuridech Sudsee
 
PDF
Market management with ZK Grails
Bhuridech Sudsee
 
PDF
Websocket & HTML5
Bhuridech Sudsee
 
PDF
Networking section present
Bhuridech Sudsee
 
PDF
Phonegap book
Bhuridech Sudsee
 
$ Spark start
Bhuridech Sudsee
 
เสี่ยวเอ้อสอน Spark
Bhuridech Sudsee
 
Jpa sa-60
Bhuridech Sudsee
 
18 ฝ่ามือพิชิต docker
Bhuridech Sudsee
 
Cloud computing
Bhuridech Sudsee
 
หนังสือภาษาไทย Spark Internal
Bhuridech Sudsee
 
VBoxManage tutorial
Bhuridech Sudsee
 
Git ฉบับอนุบาล 2
Bhuridech Sudsee
 
sample plot 3D form depth map using OpenCV
Bhuridech Sudsee
 
illustrator & design workshop
Bhuridech Sudsee
 
The bounded buffer
Bhuridech Sudsee
 
operating system
Bhuridech Sudsee
 
Producer and Consumer problem
Bhuridech Sudsee
 
OPD System with ZK Grails
Bhuridech Sudsee
 
Market management with ZK Grails
Bhuridech Sudsee
 
Websocket & HTML5
Bhuridech Sudsee
 
Networking section present
Bhuridech Sudsee
 
Phonegap book
Bhuridech Sudsee
 
Ad

Breast Cancer data mining KDD

  • 2. ชื่อขอมูล : Wisconsin Diagnostic Breast Cancer (WDBC) ผูสราง : Dr. William H. Wolberg , W. Nick Street, Olvi L. Mangasarian จำนวนตัวอยาง : 569 ตัวอยาง จำนวน Attributes : 32 Attributes Missing value : ไมมี การกระจายของ diagnosis ในกลุมตัวอยาง : 357 benign , 212 malignant ขอมูลของ Dataset Sunday, December 9, 12
  • 3. 3 ลำดับที่ 1 : ID number ลำดับที่ 2 : ระดับความรุนแรง (M – “รุนแรงมาก” , B – “รุนแรงนอย”) ลำดับที่ 3-32 : แบงขอมูลออกเปน 3 ชุด แตละชุดมี 10 คาขอมูล ดังนี้ a) รัศมี b) ความแนน c) ความยาวโดยรอบ d) พื้นที่ e) ความเรียบ f) การจัดกลุม g) สวนเวา (สวนตางสวนเวาของรูปราง) h) จุดสวนเวา i) คาความสมมาตร j) มิติเศษสวน (“การประมาณชวงขอบ” – 1) (1) id (2) diagnosis (3) raius_m (4) texture_m (5) perimeter_m (6) area_m (7) smoothness_m (8) compactness_m (9) concavity_m (10) concave_point_m (11) symmetry_m (12) fractal_dimension_m (13) raius_se (14) texture_se (15) perimeter_se (16) area_se (17) smoothness_se (18) compactness_se (19) concavity_se (20) concave_point_se (21) symmetry_se, (22) fractal_dimension_se (23) raius_w (24) texture_w (25) perimeter_w (26) area_w (27) smoothness_w (28) compactness_w (29) concavity_w (30) concave_point_w (31) symmetry_w (32) fractal_dimension_w Attributes Sunday, December 9, 12
  • 8. 8 Decision Tree 94.56% Rule Induction93.15% k-NN 83.65% Naive Bayes 93.51% Sunday, December 9, 12