Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Chapter 5: Analysis of Variance : ANOVA
การวิเคราะห์ความแปรปรวน
1
เนื้อหา:• ความคิดรวบยอดและนิยาม (Concept and Definition)• ศัพท์เทคนิคที่ควรทราบ (Technical Terms)• แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD)• การเปรียบเทียบเชิงซ้อน (Multiple Comparisons)• แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design :
RCBD)
2
3
การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป ?????เช่น - เปรียบเทียบปุ๋ย 4 ชนิด ที่ใช้ส าหรับปลูกข้าวพันธุ์หนึ่งจะให้ผลผลิต
แตกต่างกัน ?????- เปรียบเทียบวิธีการสอน 5 วิธี จะท าให้ผลสัมฤทธิ์ทางการเรียนของนักเรียน
แตกต่างกันหรือไม่ ?????
4
ถ้าท าการเปรียบเทียบทีละ 2 กลุ่ม จะท าให้เกิดปัญหา คือ1. เสียเวลา2. จะท าให้ α (Type I Error) สูงขึ้นจากที่ก าหนด3. ไม่ถูกต้องตามหลักสถิติ
ดังนั้นเราจึงควรท าการทดสอบค่าเฉลี่ยของประชากรทั้งหมดพร้อมๆ กัน โดยมีสมมติฐานดังนี้
H0 : µ1= µ2 = ... = µk
H1 : มี µ1 อย่างน้อย 1 กลุ่ม ท่ีแตกต่างจากกลุ่มอื่น ๆ ; i =1,2,…,k
ซึ่งเรียกวิธีการดังกล่าวว่า
การวิเคราะหค์วามแปรปรวน(Analysis of Variance : ANOVA)
ผู้คิดวิธีดังกล่าวเป็นนักสถิติชาวอังกฤษ ชื่อ Ronald A. Fisherจุดประสงค์ของการวิเคราะหค์วามแปรปรวน คือ
การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป
5
6
Definition การวิเคราะห์ความแปรปรวน (Analysis of variance) คือ วิธีการที่ใช้ในการเปรียบเทียบหรือวิธีการที่ใช้ในการทดสอบสมมติฐานเกี่ยวกับ
ค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป พร้อม ๆ กัน โดยในการวิเคราะห์ความแปรปรวนนี้ ความแปรปรวนหรือความผันแปรทั้งหมด (Total variation) ที่เกิดขึ้นในข้อมูลจะถูกแบ่งออกเป็นส่วนๆ ตามแหล่งก าเนิดหรือสาเหตุของการเกิดความแปรปรวนนั้น
- ทรีทเมนต์ (Treatment) สิ่งหรือวิธปฏิบัติต่อวัตถุทดลอง เพ่ือ ใช้ในการวัดผลเปรียบเทียบตามวัตถุประสงค์ของการทดลอง
- วัตถุทดลอง (Experimental Material) วัตถุหรือสิ่งที่ใช้ในการทดลอง- หน่วยทดลอง (Experimental Unit) สิ่งหนึ่งหรือกลุ่มหนึ่งของวัตถุทดลองที่ได้รับ
ทรีทเมนต์เดียวกัน- ค่าสังเกต (Observation) ค่าที่เก็บรวบรวมได้จากการทดลองหรือการส ารวจ
ซึ่งจะเป็นข้อมูลที่น ามาวิเคราะห์เปรียบเทียบ
7
Technical Terms
8
ตัวอย่างเช่น- การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษาคนไข้- การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ในการสอนนักเรียน- การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูกข้าวพันธ์ุหนึ่ง
จากแต่ละตัวอย่างข้างต้น ปัจจัย (Factor) ที่สนใจศึกษา คืออะไรและอะไรคือ - Treatment
- Experimental Material- Experimental Unit- Observations
9
ในการวิเคราะห์ความแปรปรวน จะต้องมีการวางแผนการทดลองซึ่งการวางแผนการทดลอง เป็นลักษณะของการจัด Treatment ให้กับหน่วยทดลอง โดยสุ่ม (Randomization) ซึ่งมีอยู่หลาย design
ในบทนี้ จะกล่าวเพียง 2 design เท่านั้น คือ1. แผนการทดลองแบบสุ่มตลอด
(Completely Randomized Design : CRD)2. แผนการทดลองแบบสุ่มในบล็อก
(Randomized Complete Block Design : RCBD)
แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD)
เป็นการวิเคราะห์ข้อมูลจากหน่วยทดลองที่ได้จากการทดลองโดยใช้ปัจจัยที่ศึกษาเพียงปัจจัยเดียว (Single factor) แต่แบ่งเป็นหลายระดับหรือหลายชนิด ซึ่งชนิดหรือระดับของปัจจัยดังกล่าวก็คือ Treatment นั่นเอง
10
ตัวอย่างเช่น- การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษาคนไข้- การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ในการสอนนักเรียน- การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูกข้าวพันธุ์หนึ่ง
11
แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD)หลักการส าคัญของแผนการทดลองนี้ ใช้ในกรณีที่หน่วยทดลองมีความสม่่าเสมอหรือคล้ายคลึงกัน (Uniform ; Homogeneous)
วิธีการจัด Treatment ให้แก่หน่วยทดลองจะใช้วิธีการสุ่ม ที่ท าให้หน่วยทดลองทุก ๆหน่วยทดลอง มีโอกาสได้รับ Treatment ใด Treatment หนึ่ง เท่าๆ กัน ค่าข้อมูลที่ได้เชื่อว่าเกิดจากอิทธิพลของ Treatment เพียงอย่างเดียว
การวิเคราะห์ความแปรปรวนในแผนการทดลองดังกล่าว บางครั้งจะเรียกว่า
การวิเคราะหค์วามแปรปรวนแบบจ่าแนกทางเดียว(One – way ANOVA)
12
ผังข้อมูล (Layout)
ผังข้อมูลส าหรับการวางแผนแบบสุม่ตลอด
13
14
15
16
1. ตัวอย่างทั้ง k กลุ่ม จะต้องเป็นตัวอย่างสุ่มจากประชากร k กลุ่ม และการก าหนด treatment ให้กับหน่วยทดลองต้องเป็นไปอย่างสุ่ม
2. ประชากรแต่ละกลุ่มเป็นอิสระกัน3. ประชากรแต่ละกลุ่มมีการแจกแจงปกติมีค่าเฉลี่ยเท่ากับ
และมีค่าความแปรปรวนเท่ากันหมด คือ
ซึ่งอาจเขียนในรูปสัญลักษณ์ได้ว่า
ข้อตกลงเบื้องต้น (Basic Assumptions)
i
222
2
2
1 ... k
),(~ 2iij Nx
17
พิจารณาค่าสังเกตแต่ละค่าที่รวบรวมได้จากหน่วยทดลองที่ j ของทรีทเมนต์ที่ i
ว่ามีความแตกต่างกัน เนื่องมาจากสาเหตุใดบ้าง ซึ่งค่าสังเกต xijจะเขียนแสดงได้ดังนี้
18
19
20
21
โดยทั่วไป μ , πi และ εij จะไม่ทราบค่า ซึ่งจะใช้ข้อมูลจากตัวอย่างหรือจากการทดลองมาประมาณค่าเหล่านี้ แล้วจึงท าการทดสอบสมมติฐานว่าอิทธิพล
ของ Treatment ต่าง ๆ กัน k Treatments แตกต่างกันอย่างมีนัยส าคัญหรือไม่
ซึ่งใช้
............... (a)
หลักการวิเคราะห์ความแปรปรวน
22
ต้องพยายามแยกความผันแปรทั้งหมด (Total variation) ที่เกิดขึ้นในการทดลองออกเป็นส่วนต่าง ๆ ตามแหล่งก าเนิดหรือตามสาเหตุของการเกิดความผันแปรนั้น ๆจาก (a) ใส่ผลบวกและยกก าลังสองท้ังสองข้าง จะได้ว่า
23
สมมติฐานเพื่อการทดสอบ เป็นดังนี้
24
สถิติส าหรับทดสอบสมมติฐานกรณีนี้ คือ
25
26
ตัวอย่างที่ 1 ข้อมูลต่อไปนี้แสดงผลผลิตข้าวจากการใช้ยาปราบแมลงต้นข้าวชนิดต่างๆ โดยใช้แผนการทดลองแบบ CRD จงทดสอบว่ายาปราบแมลงทั้ง 7 ชนิดมีประสิทธิภาพแตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.05
27
28
ตัวอย่างที่ 2 ในการศึกษาเปรียบเทียบวิธีการพักฟื้น 4 วิธี ว่าจะมีผลท าให้ระยะเวลาที่แผลหลังการผ่าตัดช่องท้องปิดสนิทแตกต่างกันหรือไม่จึงท าการสุ่มผู้ป่วยมา ศึกษา 24 คน ได้ข้อมูลดังนี้ จงวิเคราะห์ข้อมูลดังกล่าวที่ระดับนัยส าคัญ 0.05
29
30
วิธีท า ให้ μA , μB , μC , μD แทน ระยะเวลาเฉลี่ยที่ใช้ในการพักฟื้นด้วยวิธีต่างๆของคนไข้ที่ได้รับการผ่าตัดช่องท้อง
ค านวณค่าต่าง ๆ ได้ดังนี้
31
ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)
32
33
การเปรียบเทียบเชิงพหุหรือ การเปรียบเทียบเชิงซ้อน(Multiple comparisons)
1. Least Significant Difference (LSD)2. Tukey ' s Procedure3. Scheffe ' s Test4. Duncan ' s New Multiple Range Test (DMRT)5. Student - Newman - Keuls ' s Test (S-N-K)
34
1. Least Significant Difference (LSD)
35
สมมติว่าเปรียบเทียบระหว่าง treatment ที่ i และ treatment ที่ j
36
การเปรียบเทียบ
37
38
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดยเรียงล าดับค่าเฉลี่ยจากน้อยไปมาก
สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้นแบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยส าคัญทางสถิติที่ระดับนัยส าคัญ 0.05ส าหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
2. Tukey 's Procedure
39
40
การเปรียบเทียบ
41
42
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดยเรียงล าดับค่าเฉลี่ยจากน้อยไปมาก
สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้นแบบ A กับ แบบ B แตกต่างกันอย่างมีนัยส าคัญทางสถิติที่ระดับนัยส าคัญ 0.05 ส าหรับวิธีการพักฟื้นคู่อื่นๆ ไม่
แตกต่างกัน
3. Scheffe' s Test
43
44
การเปรียบเทียบ
45
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดยเรียงล าดับค่าเฉลี่ยจากน้อยไปมาก
สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้นแบบ A กับ แบบ B แตกต่างกันอย่างมีนัยส าคัญทางสถิติที่ระดับนัยส าคัญ 0.05 ส าหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
46
4. Duncan's New Multiple Range Test (DMRT)
ค านวณสถิติทดสอบ LSR (Least Significant Ranges) จากสูตร
47
การเปรียบเทียบ
48
49
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดยเรียงล าดับค่าเฉลี่ยจากน้อยไปมาก
สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟ้ืนแบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยส าคัญทางสถิติที่ระดับนัยส าคัญ 0.05 ส าหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
50
5. Student - Newman - Keuls' s Test (S-N-K)
ค านวณสถิติทดสอบ
51
การเปรียบเทียบ
52
53
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดยเรียงล าดับค่าเฉลี่ยจากน้อยไปมาก
สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟ้ืนแบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยส าคัญทางสถิติที่ระดับนัยส าคัญ 0.05 ส าหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
54
แผนการทดลองแบบสุ่มในบล็อก(Randomized Complete Block Design : RCBD)
ในการทดลองบางครั้งไม่สามารถหาหน่วยทดลองที่มีความเหมือนกันได้จ านวนมากพอหรือหน่วยทดลองมีความแตกต่างกัน และเราท าการทดลองโดยวางแผนการทดลองแบบสุ่มตลอด (CRD) จะท าให้การทดลองดังกล่าวไม่มีประสิทธิภาพ เนื่องจากจะมีความคลาดเคลื่อน ระหว่างหน่วยทดลองมาก ซึ่งอาจจะท าให้ผลการทดลองไม่ได้เนื่องมาจากทรีทเมนต์ที่เราต้องการศึกษาเพราะว่ามีตัวแปรหรือความผันแปรอื่นเข้ามาเกี่ยวข้อง
55
แผนการทดลองแบบสุ่มในบล็อก(Randomized Complete Block Design : RCBD) --ต่อ--
ดังนั้น เพื่อขจัดปัญหาดังกล่าวเราจึงจ าเป็นต้องขจัดตัวแปรหรือความผันแปรบางอย่างในหน่วยทดลองออกก่อนก่อนที่จะให้ทรีทเมนต์กับหน่วยทดลอง นั่นคือพยายามลดความคลาดเคลื่อนของการทดลองลงนั่นเอง โดยอาจจัดความผันแปรนั้นเป็นกลุ่มหรือบล็อก โดยหน่วยทดลองที่อยู่ในบล็อกเดียวกันจะมีลักษณะเหมือนกัน ต่างบล็อกจะมีลักษณะต่างกันจุดประสงค์ของการวางแผนการทดลองแบบสุ่มในบล็อกก็เพ่ือลดความผันแปรเนื่องจากความแตกต่างของหน่วยทดลอง และท าให้เห็นอิทธิพลของทรีทเมนต์ชัดเจนขึ้น
56
Definition
57
การทดลองแบบสุ่มในบล็อก หรือการทดลองแบบบล็อกสุ่ม หมายถึงการทดลองที่จัดให้หน่วยทดลองอยู่รวมกันเป็นพวกหรือเป็นกลุ่ม ซึ่งจะเรียกว่า บล็อก (Block) โดยที่
1. หน่วยทดลองแต่ละหน่วยที่อยู่ในบล็อกเดียวกันต้องจะมีลักษณะคล้ายคลึงกัน(Homogeneous) และหน่วยทดลองที่อยู่ต่างบล็อกกันจะมีลักษณะแตกต่างกัน (Heterogeneous) และจ านวนหน่วยทดลองในแต่ละบล็อกจะต้องเท่ากับจ านวนทรีทเมนต์ที่ต้องการทดสอบ ซึ่งลักษณะเช่นนี้เรียกว่า เป็นการทดลองแบบบล็อกสมบูรณ์ (Complete Block)
2. การจัดสรรทรีทเมนต์ให้กับหน่วยทดลองในแต่ละบล็อกจะต้องเป็นไปอย่างสุ่ม
ผังข้อมูล (Layout) ส าหรับ RCBD
58
59
1. ข้อมูลแต่ละตัวเป็นตัวอย่างสุ่มขนาด 1 หน่วย จากประชากรแต่ละกลุ่มซึ่งมีทั้งหมด kb กลุ่ม
2. ประชากรแต่ละกลุ่มมีการแจกแจงปกติซึ่งมีค่าเฉลี่ย µij และค่าความแปรปรวน
เท่ากันหมดคือเท่ากับ σ2
3. ทรีทเมนต์และบล็อกต้องมีคุณสมบัติเชิงบวกหรืออาจกล่าวได้อีกนัยหนึ่งว่าทรีทเมนต์และบล็อกไม่มีการกระท า (interaction) ร่วมกัน
60
61
62
63
64
65
ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)
66
สมมติฐานเพื่อการทดสอบ
67
สถติทิี่ใช้ทดสอบสมมตฐิาน คือ
68
ตัวอย่างที่ 4 ในการศึกษาคุณภาพของน้ ามันรถยนต์4 สูตร กับรถยนต์ที่มีขนาดกระบอกสูบเท่ากันของ 5 บริษัท คือ Ford, Honda, BMW, Nissan และ Toyota โดยใช้รถยนต์บริษัทละ 4 คัน เติมน้ ามันคันละสูตร ๆ ละ 3 ลิตร แล้วน าไปทดลอง ด้วยความเร็วและเส้นทางเดียวกันจนน้ ามันหมด หลังจากนั้นบันทึกระยะทางที่รถแต่ละคันวิ่งได้ ข้อมูลปรากฏดังตาราง
69
70
ที่ระดับนัยส าคัญ 0.05 จงทดสอบว่าน้ ามันแต่ละสูตรมีผลท าให้ระยะทางที่รถแล่นได้แตกต่างกันหรือไม่และระยะทางที่รถยนต์แต่ละบริษัทแล่นได้แตกต่างกันหรือไม่
71