Bài giảng môn Xác suất thống kê - Chương 7: Lý thuyết kiểm định
Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một
giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi
kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau:
1. Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H
trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm
loại này là và gọi là mức ý nghĩa.
2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H
trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại
này là và gọi 1- là lực kiểm định.
Trong các bài toán kiểm định ta sẽ xét sau này mức ý
nghĩa là cho trước.
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng môn Xác suất thống kê - Chương 7: Lý thuyết kiểm định", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng môn Xác suất thống kê - Chương 7: Lý thuyết kiểm định
Chương 7. Lý thuyết kiểm định §1: Khái niệm chung về kiểm định Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau: 1. Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm loại này là và gọi là mức ý nghĩa. 2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại này là và gọi 1- là lực kiểm định. Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa là cho trước. Khoa Khoa Học và Máy Tính 1Xác Suất Thống Kê. Chương 7 @Copyright 2010 Giả thiết (thiếu) Giả thiết đối lập: (thừa) (đối xứng-ta chỉ xét bài này) §2: Kiểm định giả thiết về tỉ lệ 1. Bài toán 1 mẫu: Bài toán: Ký hiệu tỉ lệ của 1 tổng thể là P(chưa biết). Từ tổng thể lấy 1 mẫu kích thước n, có tỉ lệ mẫu f. Với mức ý nghĩa hãy kiểm định giả thiết: 0: 0 0 0 0: Khoa Khoa Học và Máy Tính 2Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 3 Giải: Bước 1: Tra Bước 2: Tính giá trị quan sát: Bước 3: Kết luận: H đúng H sai qs qs U U 0 0 0 0 0 qs qs U U 0 0 01 qs f n U 2. Bài toán 2 mẫu Bài toán: kí hiệu tỉ lệ của tổng thể 1, 2 là (cả 2 chưa biết).Từ các tổng thể lấy các mẫu kích thước ,có tỉ lệ mẫu .Với mức ý nghĩa , hãy kiểm định giả thiết: Bước 1: Bước 2: 1 2, 1 2,n n 1 2 1 2 1 2 , m m f f n n 1 2: 1 2 1 2 1 2 1 2 1 2 1 2 1 . qs m m n n U m m m m n n n n Khoa Khoa Học và Máy Tính 4Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 5 • Bước 3: Kết luận: H đúng H sai qs qs U U 1 2 1 2 1 2 1 2 qs qs U U 1 2 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 6 Ví dụ 2.1: Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là 6%, còn nếu áp dụng phương pháp II thì trong 100 phế phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương pháp thứ I không? Hãy kết luận với mứa ý nghĩa 0,05. Giải: Ký hiệu là tỉ lệ phế phẩm của phương pháp I ; P là tỉ lệ phế phẩm của phương pháp II ( chưa biết) Bước 1: Bước 2: 0 0,06 0: 0,06 1,96, 0,05f 0 0 0 0,05 0,06 .10 0,42 0,06.0,941 qs f n U Bước 3: .Vậy tỉ lệ phế phẩm của phương pháp II bằng với tỉ lệ của phương pháp I • Ví dụ 2.2. Thống kê số phế phẩm của 2 nhà máy cùng sản xuất một loại sản phẩm có bảng số liệu : Với mức ý nghĩa 0.05 ,hãy xét xem tỷ lệ phế phẩm ở 2 nhà máy trên có như nhau hay không ? 0,05 01,96qsU Nhà máy Số sản phẩm Số phế phẩm I 1200 20 II 1400 60 Khoa Khoa Học và Máy Tính 7Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 8 -tỷ lệ phế phẩm của nhà máy I -tỷ lệ phế phẩm của nhà máy II Bước 1 Bước 2 Bước 3 Vậy tỷ lệ phẩm của nhà máy 1 thấp hơn nhà máy 2 20 60 1200 1400 3,855 20 60 80 1 1200.1400 2600 Uqs 1 21,96Uqs Z 1 2 0,05 1,96Z 1 2:H § 3.Kiểm định giả thiết về giá trị trung bình 1.Bài toán 1 mẫu: Ký hiệu trung bình của 1 tổng thể là a (chưa biết).Từ tổng thể lấy 1 mẫu kích thước n có trung bình mẫu , và phương sai điều chỉnh mẫu . Với mức ý nghĩa ,hãy kiểm định giả thiết: Giải: Trường hợp1: Đã biết phương sai tổng thể B1: B2: x 0H a a 2S Z 0 qs x a n U 2 Khoa Khoa Học và Máy Tính 9Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 10 B3. H đúng: H sai : TH 2: Chưa biết phương sai tổng thể B1: B2: B3: H đúng: H sai: qs qs U Z U Z 0 0 a a a a 0 0 0 : qs qs U Z a a a a U Z a a 2 , 30n Z 0 qs x a n U S qs qs U Z U Z 0 0 a a a a Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 11 . TH3: Chưa biết phương sai tổng thể B1. B2: B3:Kết luận 0 0 0 qs qs U Z a a a a U Z a a 2 , 30n 1n T 0 qs x a n T S 1 0 1 0 H ñuùng : a=a H sai : a a n qs n qs T T T T 1 0 0 1 0 n qs n qs T T a a a a T T a a Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 12 .Ví dụ 3.1. Trọng lượng (X) của một loại sản phẩm do nhà máy sản xuất ra là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là ,trọng lượng trung bình là 50kg. Nghi ngờ hoạt động không bình thường làm thay đổi trọng lượng trung bình của sản phẩm người ta cân thử 100 sản phẩm và thu được kết quả sau: Với mức ý nghĩa 0.05,hãy kết luận về nghi ngờ nói trên. Trọng lượng sản phẩm(kg) 48 49 50 51 52 Số lượng sản phẩm 10 60 20 5 5 1kg Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 13 . Giải. Vì nên đây là trường hợp 1 Vậy máy đã hoat động không bình thường làm giảm trọng lượng trung bình của sản phẩm. 1 0,05 0 49,35 50 100 6,5 1,96 50 qsU Z a a 49,35x Ví dụ 3.2. .Mức hao phí xăng(X) cho một loại xe ô tô chạy trên đoạn đường AB là một đại lượng ngẫu nhiên có phân phối chuẩn có kỳ vọng là 50 lít. Nay do đường được tu sửa lại, người ta cho rằng hao phí trung bình đã giảm xuống. Quan sát 36 chuyến xe chạy trên đường AB ta thu được bảng số liệu sau : Với mức ý nghĩa hãy cho kết luận về ý kiến trên. Mức hao phí(lít) 48,5-49,0 49,0-49,5 49,5-500 500-505 505-510 Số chuyến xe 10 11 10 4 20in 0,05 Khoa Khoa Học và Máy Tính 14Xác Suất Thống Kê. Chương 7 @Copyright 2010 mức hao phí xăng khi sửa lại đường mức hao phí xăng khi chưa sửa lại đường 0 0,05 : 50 1,96 49,416 0,573 H a a Z x S 0 a a 0 0 49,416 50 36 0,573 6,115 1,96 qs x a n U S Z a a Vậy mức hao phí xăng trung bình đã giảm . Khoa Khoa Học và Máy Tính 15Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 16 .Ví dụ 3.3. Định mức để hoàn thành 1 sản phẩm là 14,5 phút. Có nên thay đổi định mức không,nếu theo dõi thời gian hoàn thành của 25 công nhân,ta có bảng số liệu sau: Hãy kết luận với mức ý nghĩa 0.05 biết rằng thời gian hoàn thành một sản phẩm (X) là một đại lượng ngẫu nhiên có phân phối chuẩn. Thời gian sản xuất một sản phẩm(phút) 10-12 12-14 14-16 1-18 18-20 Số công nhân tương ứng 2 6 10 4 3 in Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 17 . Giải là định mức cũ ,a là năng suất trung bình mới Vậy không nên thay đổi định mức. (24) 0.05 2,064T 0:H a a 0 14,5a 0 15 14,5 25 1,118 2.046 2,226 qsT a a 2. Bài toán 2 mẫu: Kí hiệu trung bình của tổng thể 1,2 là ( cả hai chưa Biết).Từ các tổng thể lấy các mẫu kích thước có trung bình mẫu và phương sai hiệu chỉnh mẫu Với mức ý nghĩa ,hãy kiểm định giả thiết: Trường hợp1. Đã biết phương sai tổng thể B1: B2: 1 2,a a 1 2,n n 1 2,x x 1 2:H a a 2 2 1 2,S S 2 2 1 2, 1 2 2 2 1 2 1 2 qs Z x x U n n Khoa Khoa Học và Máy Tính 18Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 19 . B3. Kết luận H đúng: H sai : TH2: Chưa biết B1: B2: 1 2 1 2 qs qs qs qs U Z U Z U Z a a U Z a a 1 2 1 2 a a a a 2 2 1 2 1 2, , và 30 n n 1 2 2 2 1 2 1 2 qs Z x x U S S n n Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 20 TH3: Chưa biết B1. B2. H đúng H sai Quy ước: Vì giới hạn của bảng tra cho trong SGK nên nếu 1 2 1 2 a a a a 2 2 1 2 1 2 , , hoaëc 30n n 1 2 2 2 1 2 1 2 qs qs qs x x T S S n n T T T T 1 2 2n nT 1 2 1 2 qs qs T T a a T T a a 1 2 2 1 2 22 30 n n n n T Z Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 21 Ví dụ 3.4: Ngườì ta thí nghiệm 2 phương pháp chăn nuôi gà khác nhau, sau 1 tháng kết quả tăng trọng như sau: Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu quả hơn phương pháp I không? Phương pháp Số gà được theo dõi Mức tăng trọng trung bình (kg) Độ lệch tiêu chuẩn I 100 1,2 0,2 II 150 1,3 0.3 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 22 Giải: - Mức tăng trong trung bình của phương pháp I -Mức tăng trọng trung bình của phương pháp II Vậy phương pháp 2 hiệu quả hơn phương pháp 1 1 2 a a 1 2 1,2 1,3 3,16 0,04 0,09 100 150 qsU Z a a 1 2: 1,96 H a a Z 1 2 1 2 1 2100, 150, 0,2, 0,3, 1,2, 1,3n n x x Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 23 Ví dụ 3.5: Tương tự ví dụ trên nhưng thay bảng số liệu sau Vậy hai phương pháp hiệu quả như nhau. 1 2 1 2 1 2 10, 15, 0,2, 0,3 1,2, 1,3 n n S S x x 23 0,05 2 2 1 2 1,2 1,3 1 2,069 0,2 0,3 10 15 qsT T a a §4. Kiểm định giả thiết về phương sai Bài toán: kí hiệu phương sai cuả tổng thể là ,từ tổng thể lấy 1 mẫu kích thước n có phương sai hiệu chỉnh mẫu , với mức ý nghĩa ,hãy kiểm định giả thiết: B1: B2: B3: Kết luận: 2 2S 2 2 0:H 2 2 1 2 2 2 2 2 0 ( 1) ( 1) 1 . qs n n n S 2 2 2 2 2 0 1 2 2 2 2 2 2 0 1 2 2 2 2 2 0 2 ( 1) ( 1) ( 1) ( 1) qs qs qs n n n n Khoa Khoa Học và Máy Tính 24Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 25 Ví dụ 4.1. Chọn ngẫu nhiên 27 vòng bi cùng loại thì thấy độ lệch trung bình S=0.003. Theo số liệu quy định thì độ lệch chuẩn cho phép không vượt quá 0.0025. Với mức ý nghĩa 0.05, hãy cho kết luận? Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 26 .Giải : Vậy lô vòng bi này chưa vượt mức cho phép về độ phân tán 2 20.975 0.025 2 2 2 2 2 2 0 27, (26) 13,84, 26 41,92, 26.0,003 37,44 0,0025 13,84 41,92 qs qs n §5. Kiểm định giả thiết về quy luật phân phối. Bài toán: Giả sử đại lượng ngẫu nhiên gốc X của tổng thể chưa rõ phân phối. Từ tổng thể lấy một mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H: có X có phân phối F(x) I.F(x) là phân phối rời rạc Giả sử bảng phân phối tần số mẫu có dạng ... 1x 2x kx in 1n 2n k n X Khoa Khoa Học và Máy Tính 27Xác Suất Thống Kê. Chương 7 @Copyright 2010 B1:Ký hiệu r là số tham số chưa biết của phân phối F(x),ta thay các tham số đó bằng các ước lượng hợp lý tối đa . B2: Tra B3: Tính B4: Tính giá trị quan sát B5: Kết luận: H đúng: X có phân phối F(X) H sai : X không có phân phối F(X) 2 1 , , 1,2,....i i k r p X x X F x i k 2 2 1 k i i qs i i n np np 2 2 1qs k r 2 2 1qs k r Khoa Khoa Học và Máy Tính 28Xác Suất Thống Kê. Chương 7 @Copyright 2010 1. Kiểm định giả thiết về phân phối đều rời rạc H:X có phân phối đều rời rạc B1. r = 0 (do phân phối đều không có tham số chưa biết) B2. B3. B4. B5. Theo bài toán chung như trên 2 2 22 1 1 1 1 , 1, 1 . i ik k qs i i i k p i k k n n k n k n n nk k Khoa Khoa Học và Máy Tính 29Xác Suất Thống Kê. Chương 7 @Copyright 2010 Ví dụ 5.1. Tung 1 con xúc xắc ta được bảng điểm sau đây: Số điểm 1 2 3 4 5 6 Số lần 3 7 6 5 6 4 Với mức ý nghĩa 0.05 ,hãy kết luận con xúc sắc trên có đều hay không? Giải: Vậy con xúc xắc đều 2 2 2 2 22 2 0.05 1 3.6 31 7.6 31 6.6 31 .2 5.6 31 4.6 31 31.6 2,1 (5) 11,4 qs Khoa Khoa Học và Máy Tính 30Xác Suất Thống Kê. Chương 7 @Copyright 2010 2. Kiểm định giả thiết về phân phối Poison. . X 0 1 2 k-1 B1.r =1 (có 1 tham số chưa biết là a), B2. B3. B4. B5. Như b5 ở bài trên :H a 2n0n 1n 1kn 2 2 1 2 0 2 , 0, 1 ! i a i k i i qs i i k a p p i e i k i n np np a x in Khoa Khoa Học và Máy Tính 31Xác Suất Thống Kê. Chương 7 @Copyright 2010 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 32 Ví dụ 5.2: Để kiểm tra công việc của 200 công nhân,người ta chọn ngẫu nhiên 1000 sản phẩm của mỗi người đem đi thử nghiệm để tìm ra phế phẩm. Kết quả như sau: Với mức ý nghĩa 0.01, có thể coi mẫu trên phù hợp với phân phối Poisson hay không ? Số phế phẩm trên1000 sản phẩm 0 1 2 3 4 Số công nhân 109 65 22 3 1 Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 33 Giải: i 0 1 2 3 4 109 65 22 3 1 108,67 66,29 20,21 4,111 0,627 0,61 0,61 0,61 200. . , 0,4 ! i i a x np e i i in inp Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 34 . Vậy mẫu trên phù hợp với phân phối Poison. 2 2 2 2 2 2 2 0.01 109 108,67 65 66,29 22 20,21 108,67 66,29 20,21 3 4,11 1 0,637 0,72 11,34 4,11 0,637 qs Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 35 II. Trường hợp F(x) liên tục: Giả sử bảng phân phối tần số mẫu có dạng: B1. r là số tham số chưa biết.Thay các tham số đó bằng các ước lượng hợp lý tối đa của chúng. B2.Tra B3. Tính Chú ý: :H F x X 0, 1a a 1,k ka a 1 2,a a in 1n 2n kn 2 1k r 1 1 2 1 2 1 2 1 1 , ,..., ( ) k k k k k p a p a a X F x p a a p a 1i i p Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 36 B4. B5. Giống trường hợp F(x) rời rạc. Kiểm định về phân phối chuẩn. B1: 2 2 2 1 1 1 . k k i i i qs i ii i n np n n np p n 2: ,H N a 0 1,a a 1,k ka a in 2n1n k n 1 2,a a 2, ,r a x S x n Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 37 B2. B3. 2 3k 1 1 2 1 2 1 2 1 1 0,5 ,..., 0,5 k k k k k a x p a x a x p a x a x p a x p Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 38 B4. B5. Kết luận như b5 bài toán chung Ví dụ 5.3 : Bảng điểm của 1 lớp học như sau Với hãy kết luận bảng này có phù hợp với phân phối chuẩn hay không? Số điểm 0-3 3-5 5-7 7-8 8-10 Số học sinh 6 24 43 16 11 2 2 2 1 1 1 . k k i i i qs i ii i n np n n np p n 0,05 5,82, 1,8688x x n Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 39 Bài giải: . 1 2 3 4 3 5,82 0,5 1,51 0,5 0,43448 0,5 0,06552 1,8688 5 5,82 0,43448 0,44 0,43448 1,8688 0,17003 0,43448 0,26445 7 5,82 0,17003 0,03 0,17003 0,40568 1,8688 8 5,82 1,8688 p p p p 5 2 2 2 2 2 2 2 0.05 0,23565 1,17 0,23565 0,14335 0,5 1,17 0,12 6 24 43 16 11 :100 100 0,06552 0,26445 0,40568 0,14335 0,121 0,707 (2) 6 qs p Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 40 §6.Bảng phân phối tần số mẫu đồng thời hay bảng tương quan mẫu Giả sử X,Y là 2 đại lượng ngẫu nhiên gốc của cùng 1 tổng thể. Bảng phân phối tần số mẫu đồng thời của X,Y là: X n Y 1y 2y hy in 1x 2x kx ... ... jm 11n 12n 1n1hn 21n 22n 2hn 2n 1kn 2kn khn kn 1m 2m hm ... ... Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 41 ix iy ijn 1x 1x kx ... 1y 2y hy 11n 12n khn Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 42 §7. Kiểm định độc lập. Giả sử X,Y là 2 đại lượng ngẫu nhiên của cùng 1 tổng thể,từ tổng thể lấy 1 mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H:X,Y độc lập B1. B2. B3. độc lập phụ thuộc 2 ij2 ij i,j ij 2 2 , 2 2 2 2 1 1 . , 5 1 . . () , () , ij i j qs ij qs i j i j qs qs k h n n m n n n n m Y Y Khoa Khoa Học và Máy Tính Xác Suất Thống Kê. Chương 7 @Copyright 2010 43 Ví dụ.7.1: Nghiên cứu ảnh hưởng của hoàn cảnh gia đình đối với tình trạng phạm tội của trẻ em có kết quả: Vậy hoàn cảnh gia đình không ảnh hưởng tới tính trạng phạm tội 2 2 2 2 2 0,05 20 25 18 ... 1 .148 0,32 (2) 6 58.49 58.68 90.31 qs Tình trạng phạm tội Bố mẹ đã mất Bố mẹ ly hôn Còn cả bố mẹ Không phạm tội 20 25 13 58 Có phạm tội 29 43 18 90 49 68 31 148 in jm
File đính kèm:
- bai_giang_mon_xac_suat_thong_ke_chuong_7_ly_thuyet_kiem_dinh.pdf