Bài giảng Xác suất và thống kê (Bản mới)
2. Quy tắc nhân
Giả sử một công việc nào đó được chia thành k giai
đoạn. Có n1 cách thực hiện giai đoạn thứ 1, có n2 cách
thực hiện giai đoạn thứ 2,., có nk cách thực hiện giai
đoạn thứ k. Khi đó ta có n = n1.n2 nk cách thực hiện
toàn bộ công việc.
3. Quy tắc cộng
Giả sử một công việc có thể thực hiện được k cách
(trường hợp) loại trừ lẫn nhau: cách thứ nhất cho m1 kết
quả, cách thứ hai cho m2 kết quả, , cách thứ k cho mk
kết quả. Khi đó việc thực hiện công việc trên cho
m = m1 + m2 + + mk kết quả.
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất và thống kê (Bản mới)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Xác suất và thống kê (Bản mới)
ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 1 XÁC SUẤT VÀ THỐNG KÊ (ðại học và Cao ñẳng) Tài liệu tham khảo: 1. Giáo trình Xác suất – Thống kê và Ứng dụng – Nguyễn Phú Vinh – NXB Thống kê. 2. Ngân hàng câu hỏi Xác suất – Thống kê và Ứng dụng – ðHCN TP.HCM. 3. Lý thuyết Xác suất và Thống kê – ðinh Văn Gắng – NXB Giáo dục. 4. Lý thuyết Xác suất và Thống kê toán – Nguyễn Thanh Sơn, Lê Khánh Luận – NXBTKê. 5. Xác suất – Thống kê – Lý thuyết và các bài tập – ðậu Thế Cấp – NXB Giáo dục. 6. Lý thuyết Xác suất và Thống kê – ðinh Văn Gắng – NXB Giáo dục. 7. Xác suất – Thống kê và Ứng dụng – Lê Sĩ ðồng – NXB Giáo dục. 8. Xác suất và Thống kê – ðặng Hấn – NXB Giáo dục. 9. Giáo trình Xác suất và Thống kê – Phạm Xuân Kiều – NXB Giáo dục. 10. Giáo trình Lý thuyết Xác suất & Thống kê Toán–Nguyễn Cao Văn–NXB Ktế Quốc dân. PHẦN I. LÝ THUYẾT XÁC SUẤT BỔ TÚC ðẠI SỐ TỔ HỢP 1. Tính chất các phép toán ∩ , ∪ a) Tính giao hoán: A B B A=∩ ∩ , A B B A=∪ ∪ . b) Tính kết hợp: (A B) C A (B C)=∩ ∩ ∩ ∩ , (A B) C A (B C)=∪ ∪ ∪ ∪ . c) Tính phân phối: A (B C) (A B) (A C)=∩ ∪ ∩ ∪ ∩ , A (B C) (A B) (A C)=∪ ∩ ∪ ∩ ∪ . d) Tính ñối ngẫu (De–Morgan): A B A B=∩ ∪ , A B A B=∪ ∩ . 2. Quy tắc nhân Giả sử một công việc nào ñó ñược chia thành k giai ñoạn. Có n1 cách thực hiện giai ñoạn thứ 1, có n2 cách thực hiện giai ñoạn thứ 2,..., có nk cách thực hiện giai ñoạn thứ k. Khi ñó ta có n = n1.n2nk cách thực hiện toàn bộ công việc. 3. Quy tắc cộng Giả sử một công việc có thể thực hiện ñược k cách (trường hợp) loại trừ lẫn nhau: cách thứ nhất cho m1 kết quả, cách thứ hai cho m2 kết quả, , cách thứ k cho mk kết quả. Khi ñó việc thực hiện công việc trên cho m = m1 + m2 + + mk kết quả. 4. Mẫu lặp, mẫu không lặp − Mẫu không lặp: các phần tử của mẫu chỉ có mặt một lần (các phần tử khác nhau từng ñôi một). − Mẫu có lặp: các phần tử của mẫu có thể lặp lại nhiều lần trong mẫu. − Mẫu không thứ tự: khi thay ñổi vị trí các phần tử khác nhau của mẫu ta không nhận ñược mẫu mới. − Mẫu có thứ tự: khi thay ñổi vị trí các phần tử khác nhau của mẫu ta nhận ñược mẫu mới. 5. Các công thức thường dùng 5.1. Hoán vị ðịnh nghĩa: Hoán vị của n phần tử là một nhóm có thứ tự gồm ñủ mặt n phần tử ñã cho. Số hoán vị của n phần tử ñược ký hiệu là nP , nP n!= . 5.2. Chỉnh hợp lặp (có thứ tự) ðịnh nghĩa: Chỉnh hợp lặp k của n phần tử (k n)≤ là một nhóm (bộ) có thứ tự gồm phần k tử không nhất thiết khác nhau chọn từ n phần tử ñã cho. Số các chỉnh hợp lặp k của n phần tử là nk. 5.3. Chỉnh hợp (mẫu không lặp, có thứ tự) ðịnh nghĩa: Chỉnh hợp chập k của n phần tử (k n)≤ là một nhóm (bộ) có thứ tự gồm phần k tử khác nhau chọn từ n phần tử ñã cho. Số chỉnh hợp chập k của n phần tử ký hiệu là knA . k n n! A n(n 1)...(n k 1) (n k)! = − − + = − . 5.4. Tổ hợp (mẫu không lặp, không có thứ tự) ðịnh nghĩa: Tổ hợp chập k của n phần tử (k n)≤ là một nhóm (bộ) không phân biệt thứ tự gồm k phần tử khác nhau chọn từ n phần tử ñã cho. Số tổ hợp chập k của n phần tử ký hiệu là knC và ( ) k n n! C k! n k ! = − . Quy ước: 0! = 1. Tính chất: k n k n nC C −= ; k k 1 kn n 1 n 1C C C − − −= + . ---------------------------------------------- ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 2 Chương 1. CÁC KHÁI NIỆM CƠ BẢN CỦA XÁC SUẤT §1. BIẾN CỐ NGẪU NHIÊN 1.1. Phép thử và biến cố • Phép thử là việc thực hiện 1 thí nghiệm hay quan sát một hiện tượng nào ñó ñể xem có xảy ra hay không. Hiện tượng có xảy ra hay không trong phép thử ñược gọi là biến cố ngẫu nhiên. Biến cố ngẫu nhiên thường ñược ký hiệu A, B, C VD 1. + Tung ñồng tiền lên là một phép thử, biến cố là “mặt sấp xuất hiện” hay “mặt ngửa xuất hiện”. + Chọn ngẫu nhiên một số sản phẩm từ một lô hàng ñể kiểm tra là phép thử, biến cố là “chọn ñược sản phẩm tốt” hay “chọn ñược phế phẩm”. + Gieo một số hạt lúa là phép thử, biến cố là “hạt lúa nảy mầm” hay “hạt lúa không nảy mầm”. 1.2. Các loại biến cố a) Không gian mẫu và biến cố sơ cấp • Trong một phép thử, tập hợp tất cả các kết quả có thể xảy ra ñược gọi là không gian mẫu ký hiệu là Ω . • Mỗi phần tử ω ∈ Ω không thể phân nhỏ thành hai biến cố ñược gọi là biến cố sơ cấp. VD 2. Xét phép thử gieo 3 hạt lúa. Gọi Ai là biến cố “có i hạt nảy mầm” (i = 0, 1, 2, 3). Khi ñó các Ai là các biến cố sơ cấp và Ω = {A0, A1, A2, A3}. Gọi B là “có ít nhất 1 hạt nảy mầm” thì B không là biến cố sơ cấp. b) Biến cố chắc chắn và biến cố không thể • Trong một phép thử, biến cố nhất ñịnh xảy ra là chắc chắn, ký hiệu là Ω . • Biến cố không thể là biến cố không thể xảy ra khi thực hiện phép thử, ký hiệu ∅ . VD 3. Từ một nhóm có 6 nam và 4 nữ chọn ra 5 người. Khi ñó, biến cố “chọn ñược 5 người nữ” là không thể, biến cố “chọn ñược ít nhất 1 nam” là chắc chắn. c) Số trường hợp ñồng khả năng • Hai hay nhiều biến cố trong một phép thử có khả năng xảy ra như nhau ñược gọi là ñồng khả năng. • Trong một phép thử mà mọi biến cố sơ cấp ñều ñồng khả năng thì số phần tử của không gian mẫu ñược gọi là số trường hợp ñồng khả năng của phép thử. VD 4. Gọi ngẫu nhiên một học sinh trong lớp ñể kiểm tra thì mỗi học sinh trong lớp ñều có khả năng bị gọi như nhau. d) Các phép toán • Tổng của A và B là C, ký hiệu C A B= ∪ hay C = A + B, xảy ra khi ít nhất 1 trong hai biến cố A, B xảy ra. VD 5. Bắn hai viên ñạn vào 1 tấm bia. Gọi A1: “viên thứ nhất trúng bia”, A2: “viên thứ hai trúng bia” và C: “bia bị trúng ñạn” thì 1 2C A A= ∪ . • Tích của A và B là C, ký hiệu C AB A B= = ∩ , xảy ra khi và chỉ khi cả A và B cùng xảy ra. VD 6. Một người chọn mua áo. Gọi A: “chọn ñược áo màu xanh”, B: “chọn ñược áo sơ–mi” và C: “chọn ñược áo sơ–mi màu xanh” thì C = AB. VD 7. Chọn ngẫu nhiên 10 linh kiện trong 1 lô ra kiểm tra. Gọi Ai: “chọn ñược linh kiện thứ i tốt” và C: “chọn ñược 10 linh kiện tốt” thì 10 1 2 10 i i 1 C A A ... A A = = =∩ ∩ ∩ ∩ . • Phần bù của A, ký hiệu: { }A \ A A= Ω = ω ∈ Ω ω ∉ . VD 8. Bắn lần lượt 2 viên ñạn vào 1 tấm bia. Gọi Ai: “có i viên ñạn trúng bia” (i = 0, 1, 2), B: “có không quá 1 viên ñạn trúng bia”. Khi ñó 2B A= , 0 2A A≠ và 1 2A A≠ . 1.3. Quan hệ giữa các biến cố a) Biến cố xung khắc • Hai biến cố và B ñược gọi là xung khắc nếu chúng không ñồng thời xảy ra trong một phép thử. • Họ các biến cố A1, A2,, An ñược gọi là xung khắc (hay ñôi một xung khắc) khi một biến cố bất kỳ trong họ xảy ra thì các biến cố còn lại không xảy ra. Nghĩa là i jA A , i j= ∅ ∀ ≠∩ . VD 9. Một hộp có 3 viên phấn màu ñỏ, xanh và trắng. Chọn ngẫu nhiên 1 viên. Gọi A: “chọn ñược viên màu ñỏ”, B: “chọn ñược viên màu trắng” và C: “chọn ñược viên màu xanh” thì A, B, C là xung khắc. b) Biến cố ñối lập • Hai biến cố A và B ñược gọi là ñối lập nhau nếu chúng thỏa mãn 2 ñiều sau: 1) A và B xung khắc với nhau. 2) Phải có ít nhất một trong 2 biến cố xảy ra. VD 10. Trồng 1 cây bạch ñàn. Gọi A: “cây bạch ñàn sống”, B: “cây bạch ñàn chết” thì A và B là ñối lập. • Họ các biến cố {Ai} (i = 1,, n) ñược gọi là hệ ñầy ñủ các biến cố nếu thỏa mãn 2 ñiều sau: 1) Họ xung khắc, nghĩa là i jA A , i j= ∅ ∀ ≠∩ . 2) Phải có ít nhất 1 biến cố trong họ xảy ra, nghĩa là 1 2 nA A ... A = Ω∪ ∪ ∪ . VD 11. Họ {A, B, C} trong VD 9 là ñầy ñủ. Chú ý. Họ { }A, A là ñầy ñủ với biến cố A tùy ý. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 3 §2. XÁC SUẤT CỦA BIẾN CỐ 2.1. ðịnh nghĩa xác suất dạng cổ ñiển • Trong một phép thử có tất cả n biến cố sơ cấp ñồng khả năng, trong ñó có m khả năng thuận lợi cho biến cố A xuất hiện thì xác suất của A là: m P(A) n = = Soá bieán coá thuaän lôïi cho A Soá taát caû caùc bieán coá coù theå . VD 1. Một hộp chứa 10 sản phẩm trong ñó có 3 phế phẩm. Tính xác suất: a) Chọn ngẫu nhiên 1 sản phẩm từ hộp ñược phế phẩm. b) Chọn ngẫu nhiên 1 lần từ hộp ra 2 sản phẩm ñược 2 phế phẩm. VD 2. Một hộp có 10 sản phẩm trong ñó có 4 phế phẩm. Lấy ngẫu nhiên từ hộp ñó ra 3 sản phẩm (lấy 1 lần), tính xác suất ñể: a) Cả 3 sản phẩm ñều tốt; b) Có ñúng 2 phế phẩm. VD 3. Một lớp có 60 học sinh trong ñó có 28 em giỏi toán, 30 em giỏi lý, 32 em giỏi ngoại ngữ, 15 em vừa giỏi toán vừa giỏi lý, 10 em vừa giỏi lý vừa giỏi ngoại ngữ, 12 em vừa giỏi toán vừa giỏi ngoại ngữ, 2 em giỏi cả 3 môn. Chọn ngẫu nhiên một học sinh của lớp. Tính xác suất: a) Chọn ñược em giỏi ít nhất 1 môn. b) Chọn ñược em chỉ giỏi toán. c) Chọn ñược em giỏi ñúng 2 môn. Ưu ñiểm và hạn chế của ñịnh nghĩa dạng cổ ñiển • Ưu ñiểm: Tính ñược chính xác giá trị của xác suất mà không cần thực hiện phép thử. • Hạn chế: Trong thực tế có nhiều phép thử vô hạn các biến cố và biến cố không ñồng khả năng. 2.3. ðịnh nghĩa theo hình học Cho miền Ω . Gọi ñộ ño của Ω là ñộ dài, diện tích, thể tích (ứng với Ω là ñường cong, miền phẳng, khối). Gọi A là biến cố ñiểm M S∈ ⊂ Ω . Ta có P(A) = Ω ñoä ño S ñoä ño . VD 6. Tìm xác suất của ñiểm M rơi vào hình tròn nội tiếp tam giác ñều cạnh 2 cm. VD 7. Hai người bạn hẹn gặp nhau tại 1 ñịa ñiểm theo quy ước như sau: – Mỗi người ñộc lập ñi ñến ñiểm hẹn trong khoảng từ 7 ñến 8 giờ. – Mỗi người ñến ñiểm hẹn nếu không gặp người kia thì ñợi 30 phút hoặc ñến 8 giờ thì không ñợi nữa. Tìm xác suất ñể hai người gặp nhau. 2.4. Tính chất của xác suất 1) 0 P(A) 1≤ ≤ , với mọi biến cố A; 2) P( ) 0∅ = ; 3) P( ) 1Ω = . 2.5. Ý nghĩa của xác suất • Xác suất là số ño mức ñộ tin chắc, thường xuyên xảy ra của 1 biến cố trong phép thử. Chú ý. Xác suất phụ thuộc vào ñiều kiện của phép thử. §3. CÔNG THỨC TÍNH XÁC SUẤT 3.1. Công thức cộng xác suất a) Biến cố xung khắc • A và B xung khắc thì: P(A B) P(A) P(B)= +∪ . • Họ {Ai} (i = 1, 2,, n) thì: ( )1 2 n 1 2 nP A A ... A =P(A )+P(A )+...+P(A )∪ ∪ ∪ . b) Biến cố tùy ý • A và B là hai biến cố tùy ý thì: P(A B) P(A) P(B) P(AB)= + −∪ . • Họ {Ai} (i = 1, 2,, n) các biến cố tùy ý thì: nn i i i j i 1 i 1 i j n 1 i j k 1 2 n i j k P A P(A ) P(A A ) P(A A A )+...+( 1) P(A A ...A ) = = < − < < = − + − ∑ ∑ ∑ ∪ . c) Biến cố ñối lập ( )P A 1 P(A)= − . VD 1. Một hộp phấn có 10 viên trong ñó có 3 viên màu ñỏ. Lấy ngẫu nhiên từ hộp ra 3 viên phấn. Tính xác suất ñể lấy ñược ít nhất 1 viên phấn màu ñỏ. VD 2. Có 33 học sinh tham dự kỳ thi chọn học sinh giỏi gồm 2 vòng thi. Biết rằng có 17 học sinh thi ñỗ vòng 1; 14 học sinh thi ñỗ vòng 2 và 11 học sinh trượt cả hai vòng thi. Chọn ngẫu nhiên một học sinh trong danh sách dự thi. Tìm xác suất ñể học sinh ñó chỉ thi ñỗ duy nhất 1 trong 2 vòng thi. 3.2. Công thức nhân xác suất a) Xác suất có ñiều kiện • Trong một phép thử, xét 2 biến cố bất kỳ A, B với P(B) 0> . Xác suất có ñiều kiện của A với ñiều kiện B ñã xảy ra ñược ký hiệu và ñịnh nghĩa: ( ) P(AB)P A B P(B) = . • Xác suất có ñiều kiện cho phép chúng ta sử dụng thông tin về sự xảy ra của 1 biến cố ñể dự báo xác suất xảy ra biến cố khác. • Tính chất: 1) ( )0 P A B 1≤ ≤ ; 2) ( )P B B 1= ; 3) ( ) ( )P A B 1 P A B= − ; 4) nếu A1 và A2 xung khắc thì: ( ) ( ) ( )1 2 1 2P A A B P A B P A B= +∪ . VD 3. Một hộp có 10 vé, trong ñó có 3 vé trúng thưởng. Người thứ nhất ñã bốc 1 vé không trúng thưởng. Tính xác suất ñể người thứ 2 bốc ñược vé trúng thưởng (mỗi người chỉ bốc 1 vé). b) Công thức nhân • A và B là 2 biến cố ñộc lập nếu B có xảy ra hay không cũng không ảnh hưởng ñến khả năng xảy ra A và ngược lại, nghĩa là ( )P A B P(A)= và ( )P B A P(B)= . Khi ñó ta có P(AB) P(A).P(B)= . • Với A, B không ñộc lập (phụ thuộc) thì: ( ) ( )P(AB) P(B)P A B P(A)P B A= = . ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 4 VD 4. Một lô hàng có 100 sản phẩm trong ñó có 10 phế phẩm. Kiểm tra liên tiếp không hoàn lại 5 sản phẩm, nếu có ít nhất 1 phế phẩm thì không nhận lô hàng ñó. Tính xác suất ñể nhận lô hàng. VD 5. Một lô hàng gồm 12 sản phẩm trong ñó có 8 sản phẩm tốt và 4 phế phẩm. Rút ngẫu nhiên 1 sản phẩm từ lô hàng và không ñể ý tới sản phẩm ñó, sau ñó rút tiếp sản phẩm thứ 2. Tính xác suất ñể sản phẩm thứ hai là tốt. VD 6. Một cầu thủ bóng rổ có 4 quả bóng ñang ném từng quả vào rổ. Nếu bóng vào rổ hoặc hết bóng thì cầu thủ ngừng ném. Biết xác suất vào rổ của quả bóng thứ 1, 2, 3 và 4 lần lượt là 90%, 80%, 85% và 70%. Tính xác suất cầu thủ ném ñược bóng vào rổ. 3.3. Công thức xác suất ñầy ñủ và Bayes. a) Công thức xác suất ñầy ñủ • Cho họ các biến cố {Ai} (i = 1, 2,, n) ñầy ñủ và B là biến cố bất kỳ trong phép thử, ta có: ( ) ( ) ( ) n i i i 1 1 1 n n P(B) P(A ) B A P(A )P B A ... P(A )P B A = = = + + ∑ . VD 7. Một ñám ñông có số ñàn ông bằng nửa số ñàn bà. Xác suất ñể ñàn ông bị bịnh tim là 0,06 và ñàn bà là 0,0036. Chọn ngẫu nhiên 1 người từ ñám ñông, tính xác suất ñể người này bị bịnh tim. b) Công thức Bayes • Cho họ các biến cố {Ak} (k = 1, 2,, n) ñầy ñủ và B là biến cố bất kỳ trong phép thử. Xác suất ñể xuất hiện Ak sau khi ñã xuất hiện B là: ( ) ( ) ( ) k k k n i i i 1 P(A )P B A P A B P(A )P B A = = ∑ . VD 8. Tỷ số ôtô tải và ôtô con ñi qua ñường có trạm bơm dầu là 5/2. Xác suất ñể 1 ôtô tải ñi qua ñường này vào bơm dầu là 10%; ôtô con là 20%. Có 1 ôtô qua ñường ñể bơm dầu, tính xác suất ñể ñó là ôtô tải. VD 9. Có 3 bao lúa cùng loại. Bao 1 nặng 20kg chứa 1% hạt lép, bao 2 nặng 30kg chứa 1,2% hạt lép và bao 3 nặng 50kg chứa 1,5% hạt lép. Trộn cả 3 bao lại rồi bốc ngẫu nhiên 1 hạt thì ñược hạt lép. Tính xác suất ñể hạt lép này là của bao thứ ba. VD 10. Ba kiện hàng ñều có 20 sản phẩm với số sản phẩm tốt tương ứng là 12, 15, 18. Lấy ngẫu nhiên 1 kiện hàng (giả sử 3 kiện hàng có cùng khả năng) rồi từ kiện ñó lấy tùy ý ra 1 sản phẩm. a) Tính xác suất ñể sản phẩm chọn ra là tốt. b) Giả sử sản phẩm chọn ra là tốt, tính xác suất ñể sản phẩm ñó thuộc kiện hàng thứ hai. Chương II. BIẾN (ðẠI LƯỢNG) NGẪU NHIÊN §1. BIẾN NGẪU NHIÊN VÀ LUẬT PHÂN PHỐI XÁC SUẤT 1.1. Khái niệm và phân loại biến ngẫu nhiên a) Khái niệm • Một biến số ñược gọi là ngẫu nhiên nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác ñộng của các nhân tố ngẫu nhiên. • Các biến ngẫu nhiên ñược ký hiệu: X, Y, Z, còn các giá trị của chúng là x, y, z, VD 1. Khi tiến hành gieo n hạt ñậu ta chưa thể biết có bao nhiêu hạt sẽ nảy mầm, số hạt nảy mầm có thể là 0, 1, , n. Kết thúc phép thử gieo hạt thì ta biết chắc chắn có bao nhiêu hạt nảy mầm. Gọi X là số hạt nảy mầm thì là X biến ngẫu nhiên và X = {0, 1, 2, , n}. b) Phân loại biến ngẫu nhiên • Biến ngẫu nhiên (bnn) ñược gọi là rời rạc nếu các giá trị có thể có của nó lập nên 1 tập hợp hữu hạn hoặc ñếm ñược. • Biến ngẫu nhiên ñược gọi là liên tục nếu các giá trị có thể có của nó lấp ñầy 1 khoảng trên trục số. VD 2. + Biến X trong VD 1 là bnn rời rạc (tập hữu hạn). + Gọi Y là số người ñi qua 1 ngã tư trên ñường phố thì Y là bnn rời rạc (tập ñếm ñược). VD 3. + Bắn 1 viên ñạn vào bia, gọi X là “khoảng cách từ ñiểm chạm của viên ñạn ñến tâm của bia” thì X là biến ngẫu nhiên liên tục. + Gọi Y là “sai số khi ño 1 ñại lượng vật lý” thì Y là ... 9. Trọng lượng gói mì X(gr) là bnn có phân phối chuẩn. Cân kiểm tra 15 gói mì có số liệu: X(gr) 84 84,5 85 85,5 Số gói 2 3 8 2 Với ñộ tin cậy 93%, hãy ước lượng phương sai X trong mỗi trường hợp sau: a) Biết trọng lượng trung bình gói mì là 84,9gr. b) Chưa biết trọng lượng trung bình gói mì. VD 10. Khảo sát 16 sinh viên về ñiểm trung bình của học kỳ 2 thì tính ñược s2 = 2,25 ñiểm. Ước lượng phương sai về ñiểm trung bình học kỳ 2 của sinh viên với ñộ tin cậy 97%, biết rằng ñiểm trung bình X của sinh viên là biến ngẫu nhiên có phân phối chuẩn. VD 11. Mức hao phí nguyên liệu cho 1 ñơn vị sản phẩm là ñại lượng ngẫu nhiên X (gr) có phân phối chuẩn. Quan sát 28 sản phẩm này người ta thu ñược bảng số liệu: X (gr) 19,0 19,5 20,0 20,5 Số sản phẩm 5 6 14 3 Với ñộ tin cậy 90%, hãy ước lượng phương sai của mức hao phí nguyên liệu trên trong 2 trường hợp: a) Biết EX = 20gr. b) Chưa biết EX. Chương VI. KIỂM ðỊNH GIẢ THIẾT THỐNG KÊ §1. KIỂM ðỊNH GIẢ THIẾT VỀ ðẶC TRƯNG TỔNG THỂ (ðÁM ðÔNG) 1.1. Khái niệm bài toán kiểm ñịnh • Dùng các thống kê từ mẫu ñể chấp hay bác bỏ một giả thiết H nào ñó nói về tổng thể gọi là kiểm ñịnh giả thiết thống kê. • Khi kiểm ñịnh giả thiết H có thể xảy ra 1 trong 2 sai lầm sau: 1) Loại 1: Bác bỏ H trong khi H ñúng; 2) Loại 2: Chấp nhận H trong khi H sai. • Phương pháp kiểm ñịnh là cho phép xác suất xảy ra sai lầm loại 1 không vượt quá mức ý nghĩa α. Với mức ý nghĩa α ñã cho, ta chấp nhận H nếu xác suất xảy ra sai lầm loại 2 là nhỏ nhất. Chú ý • Mức ý nghĩa α giảm thì P(loại I) giảm ⇒ P(loại II) tăng, nghĩa là khả năng chấp nhận H tăng. 1.2. Kiểm ñịnh giả thiết tỉ lệ tổng thể p ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 19 Với tỉ lệ p0 cho trước thì 0 0 0 F p T N(0; 1) p q n − = ∈ và { }W t T P(t t )α α= ∈ > ≤ α là miền bác bỏ giả thiết H. Các bước giải • ðặt giả thiết H: p = p0 (nghĩa là tỉ lệ tổng thể như tỉ lệ cho trước). • Từ mẫu cụ thể ta tính tỉ lệ mẫu mf n = và giá trị kiểm ñịnh 0 0 0 f p t p q n − = . • Từ mức ý nghĩa 1α ⇒ − α B1 (t ) t 2 α α − α ⇒ = ϕ → . – Nếu t tα≤ thì ta chấp nhận giả thiết, nghĩa là p = p0. – Nếu t tα> thì ta bác bỏ giả thiết, nghĩa là 0p p≠ . • Trong trường hợp bác bỏ, nếu f > p0 thì kết luận p > p0 và f < p0 thì p < p0. VD 1. Kiểm tra 800 sinh viên thấy có 128 sinh viên giỏi. Trường báo cáo tổng kết là có 40% sinh viên giỏi thì có thể chấp nhận ñược không với mức ý nghĩa 5%? VD 2. ðể kiểm tra 1 loại súng thể thao, người ta cho bắn 1000 viên ñạn vào bia thấy có 540 viên trúng ñích. Sau ñó, bằng cải tiến kỹ thuật người ta nâng tỉ lệ trúng lên 70%. Hãy cho kết luận về cải tiến với mức ý nghĩa 1%. VD 3. Theo báo cáo, tỉ lệ hàng phế phẩm trong kho là 12%. Kiểm tra ngẫu nhiên 100 sản phẩm thấy có 13 phế phẩm. Với mức ý nghĩa 5% thì báo cáo trên có ñáng tin không ? VD 4. Một công ty tuyên bố rằng 40% dân chúng ưa thích sản phẩm của công ty. Một cuộc ñiều tra 400 người tiêu dùng thấy có 175 người ưa thích sản phẩm của công ty. Với mức ý nghĩa 3%, hãy kiểm ñịnh tuyên bố trên ? 1.3. Kiểm ñịnh giả thiết trung bình tổng thể µ • Với trung bình µ0 cho trước, tương tự bài toán ước lượng khoảng cho trung bình tổng thể, ta có các trường hợp sau (tóm tắt): • ðặt giả thiết H: µ = µ0 (nghĩa là trung bình tổng thể như trung bình cho trước). a) Trường hợp 1. Với 2n 30, ≥ σ ñã biết. • Tính 0 x t , t n α − µ = σ . • Nếu t tα≤ ta chấp nhận giả thiết; t tα> ta bác bỏ giả thiết. b) Trường hợp 2. Với 2n 30, ≥ σ chưa biết. Làm như trường hợp 1 nhưng thay sσ = . c) Trường hợp 3. Với 2n 30, < σ ñã biết, X có phân phối chuẩn (làm như trường hợp 1). d) Trường hợp 4. Với 2n 30, < σ chưa biết, X có phân phối chuẩn. • Tính 0 x t s n − µ = . Từ mức ý nghĩa C n 1t −αα → . • Nếu n 1t t −α≤ ta chấp nhận giả thiết; n 1t t −α> ta bác bỏ giả thiết. Chú ý • Trong trường hợp bác bỏ: Nếu 0 0x > µ ⇒ µ > µ và 0 0x < µ ⇒ µ < µ . VD 5. Trọng lượng trung bình của của một loại sản phẩm là 6kg. Kiểm tra 121 sản phẩm thấy trọng lượng trung bình là 5,795 kg và phương sai 2 s 5,712=ɵ . Hãy kiểm ñịnh về trọng lượng trung bình của sản phẩm này với mức ý nghĩa 5%. VD 6. Cân thử 15 con gà tây ở 1 trại chăn nuôi khi xuất chuồng ta tính ñược x 3,62kg= . Biết trọng lượng gà tây là biến ngẫu nhiên có 2 0,01σ = . a) Giám ñốc trại nói rằng trọng lượng trung bình của gà tây là 3,5kg, với mức ý nghĩa 2% hãy kiểm ñịnh lời nói trên ? b) Giả sử người ta dùng thức ăn mới và khi xuất chuồng trọng lượng trung bình của gà tây là 3,9 kg. Với mức ý nghĩa 3%, hãy cho kết luận về loại thức ăn này ? VD 7. Khối lượng của một bao gạo của 1 nhà máy là biến ngẫu nhiên có ñộ lệch tiêu chuẩn là 0,3kg. Ban giám ñốc tuyên bố khối lượng mỗi bao gạo của nhà máy là 50kg. Cân thử 50 bao thì thấy khối lượng trung bình là 49,97kg. Với mức ý nghĩa 1%, hãy kiểm tra lời tuyên bố trên ? VD 8. ðiểm trung bình môn toán của sinh viên năm trước là 5,72. Năm nay theo dõi 100sv ñược số liệu: ðiểm 3 4 5 6 7 8 9 Số sinh viên 3 5 27 43 12 6 4 Với mức ý nghĩa 5%, phải chăng ñiểm trung bình của sinh viên năm nay cao hơn năm trước? ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 20 VD 9. Chiều cao cây giống X(m) trong một vườm ươm là biến ngẫu nhiên có phân phối chuẩn. ðo ngẫu nhiên 25 cây ta có: X (m) 0,8 0,9 1,0 1,1 1,2 1,3 Số cây 1 2 9 7 4 2 Theo quy ñịnh khi nào cây cao trung bình trên 1m thì ñem ra trồng. Với mức ý nghĩa 5%, có thể ñem cây ra trồng ñược chưa ? 1.4. Kiểm ñịnh giả thiết phương sai tổng thể có phân phối chuẩn 2σ (tham khảo) Với 20σ cho trước, ta thực hiện các bước sau: • ðặt giả thiết H: 2 20σ = σ (nghĩa là phương sai tổng thể như phương sai cho trước). • Từ mẫu ta tính giá trị kiểm ñịnh 2 2 2 0 (n 1)s− χ = σ . • Từ D 2 2n 1 n 11 , 12 2 2− − α α α − α ⇒ →χ χ − . • Nếu 2 2 2n 1 n 1 12 2− − α α χ < χ < χ − ta chấp nhận giả thiết, ngược lại thì bác bỏ giả thiết. • Trong trường hợp bác bỏ, nếu 2 20s > σ thì kết luận 2 2 0σ > σ và 2 2 0s < σ thì 2 2 0σ < σ . VD 10. Tiến hành 25 quan sát về chỉ tiêu X của 1 loại sản phẩm, ta tính ñược s2 = 416,667. Có tài liệu nói rằng phương sai của chỉ tiêu X là 400. Với mức ý nghĩa 3%, cho nhận xét về tài liệu này? §2. KIỂM ðỊNH SO SÁNH HAI ðẶC TRƯNG 2.1. So sánh hai tỉ lệ px và py của hai tổng thể X, Y • ðặt giả thiết H: px = py. • Từ 2 mẫu ta tính xx x m f n = , yy y m f n = , x y 0 x y m m p n n + = + (tỉ lệ thực nghiệm chung của hai mẫu). • Tính 0 0q 1 p= − x y 0 0 x y f f t 1 1 p q n n − ⇒ = + (giá trị kiểm ñịnh). • Nếu t tα≤ thì chấp nhận H x yp p⇒ = ; nếu x y x y t t p p f f α > ⇒ < < ; nếu x y x y t t p p f f α > ⇒ > > . VD 1. Từ hai tổng thể X1, X2 tiến hành 2 mẫu có kích thước n1 = 100, n2 = 120 ta tính ñược f1 = 0,2 và f2 = 0,3. Với mức ý nghĩa 1% hãy so sánh hai tỉ lệ của hai tổng thể ñó. VD 2. Kiểm tra 120 sinh viên trường A thấy có 80 sinh viên giỏi, 150 sinh viên trường B có 90 sinh viên giỏi. Hỏi tỉ lệ sinh viên giỏi của 2 trường như nhau không với mức ý nghĩa là 5%? VD 3. Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế phẩm. Kiểm tra 200 sản phẩm ở kho II thấy có 24 phế phẩm. Chất lượng hàng ở hai kho có khác nhau không với: 1) Mức ý nghĩa 5% ? 2) Mức ý nghĩa 1% ? 2.2. So sánh hai trung bình µx và µy của hai tổng thể Tóm tắt 4 trường hợp (chấp nhận hay bác bỏ giả thiết như bài kiểm ñịnh trung bình): • ðặt giả thiết H: µx = µy. Trường hợp 1. x yn , n 30≥ và 2 2 x y, σ σ ñã biết. • Từ 2 mẫu cụ thể ta tính kiểm ñịnh 22 yx x y x y t n n − = σσ + và so sánh với tα . Trường hợp 2. x yn , n 30≥ và 2 2 x y, σ σ chưa biết. Ta thay 2 2x y, σ σ bởi 2 2 x ys , s trong trường hợp 1. Trường hợp 3. x yn , n 30< và 2 2 x y, σ σ ñã biết ñồng thời X, Y có phân phối chuẩn (như trường hợp 1). Trường hợp 4. x yn , n 30< và 2 2 x y, σ σ chưa biết; X, Y có phân phối chuẩn. • Tính phương sai mẫu chung chưa hiệu chỉnh của 2 mẫu 2 2 x x y y2 x y (n 1)s (n 1)s s n n 2 − + − = + − . • Tính giá trị kiểm ñịnh x y x y t 1 1 s. n n − = + . • Từ x yn n 2C t + −αα → và so sánh với t. VD 4. Cân thử 100 trái cây ở nông trường I ta tính ñược 2 xx 101,2gr; s 571,7= = và 361 trái cây ở nông trường II tính ñược 2yy 66,39gr; s 29,72= = . Hãy so sánh trọng lượng trung bình của trái cây ở 2 nông trường với mức ý nghĩa 1%. VD 5. ðo ñường kính 20 trục máy do máy I sản xuất và 22 trục máy do máy II sản xuất ta tính ñược x 251,7mm= ; 2xs 52,853= và y 249,8mm= ; 2 ys 56,2= . Có thể xem ñường kính trung bình của các trục máy ở 2 máy như nhau với mức ý nghĩa 1% không? ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 21 VD 6. Khối lượng trung bình của 50 trái dưa hấu do xã A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình của 80 trái dưa hấu do xã B trồng là 6,46kg với sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng trung bình trái dưa hấu do xã A trồng nặng hơn không ? VD 7. Khối lượng trung bình của 23 trái dưa hấu do xã A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình của 19 trái dưa hấu do xã B trồng là 6,46kg với sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng trung bình trái dưa hấu do xã A trồng nặng hơn không ? 2.3. So sánh hai phương sai 2xσ và 2yσ của hai tổng thể (so sánh tỉ lệ phương sai) (tham khảo) • ðặt giả thiết H: 2 2x yσ = σ . • Tính giá trị kiểm ñịnh 2 x 2 y s g s = . • Từ mức ý nghĩa α 2 α ⇒ . Tra bảng E ta tìm ñược x y 2 f f (n 1, n 1)α= − − . • Nếu g f ta bác bỏ giả thiết. • Trong trường hợp bác bỏ giả thiết: – Nếu 2 2x ys s> thì kết luận 2 2 x yσ > σ và ngược lại. VD 8. Giá cổ phiếu là biến ngẫu nhiên có phân phối chuẩn. ðiều tra ngẫu nhiên giá cổ phiếu của công ty X trong 25 ngày tính ñược ñộ lệch tiêu chuẩn mẫu hiệu chỉnh là 7,5 ngàn ñồng; của công ty Y trong 22 ngày là 6,2 ngàn ñồng. Với mức ý nghĩa 5%, hãy so sánh về ñộ rủi ro cổ phiểu của hai công ty trên. VD 9. Doanh số bán hàng (ñơn vị: triệu ñồng) của 1 công ty A là biến ngẫu nhiên có phân phối chuẩn. Công ty A cho người theo dõi doanh số bán hàng trong 7 ngày ở vùng X thì tính ñược phương sai mẫu chưa hiệu chỉnh là 82,1; ở vùng Y trong 6 ngày thì tính ñược 25,3. Với mức ý nghĩa 3%, hãy so sánh ñộ rủi ro ñầu tư của công ty A ở hai vùng trên. Chương VII. LÝ THUYẾT TƯƠNG QUAN VÀ HÀM HỒI QUY 1. Hệ số tương quan giữa X và Y • ðể minh họa cho vấn ñề, chúng ta thử xem xét nghiên cứu sau ñây mà trong ñó nhà nghiên cứu ño lường ñộ cholesterol (Y) trong máu của 10 ñối tượng nam ở ñộ tuổi (X). Kết quả ño lường như sau: X 20 52 30 57 28 Y 1,9 4,0 2,6 4,5 2,9 X 43 57 63 40 49 Y 3,8 4,1 4,6 3,2 4,0 Biểu ñồ liên hệ giữa ñộ tuổi và ñộ cholesterol: Biểu ñồ trên ñây gợi ý cho thấy mối liên hệ giữa ñộ tuổi (X) và cholesterol (Y) là một ñường thẳng (tuyến tính). • ðể “ño lường” mối liên hệ này, chúng ta có thể sử dụng hệ số tương quan: n i i i 1 xy n n 2 2 x y2 2 i i i 1 i 1 (x x)(y y) xy x.y r s .s (x x) (y y) = = = − − − = = − − ∑ ∑ ∑ ⌢ ⌢ . Trong ñó ij i i i 1 j 1 1 xy n x n y = = = ∑ , ijn n= ∑ . Chú ý. 2 2x ys .s⌢ ⌢ có sai số bé hơn x ys .s⌢ ⌢ . Ý nghĩa • Hệ số tương quan ño mối quan hệ tuyến tính giữa x, y. 1) xy1 1r− ≤ ≤ . 2) Nếu xyr 0= thì hai biến số không có quan hệ tuyến tính; nếu xyr 1= ± thì hai biến số có quan hệ tuyến tính tuyệt ñối. 3) Nếu xyr 0< thì quan hệ giữa x, y là giảm biến (có nghĩa là khi x tăng thì y giảm). 4) Nếu xyr 0> thì quan hệ giữa x, y là ñồng biến (có nghĩa là khi x tăng thì y cũng tăng). ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 22 VD 1. Tính hệ số tương quan giữa ñộ tuổi và cholesterol cho ở bảng trên. Ta có: n i 1 ix 1 x 43 n ,9 = = =∑ ; n i 1 iy 1 y 3, n 56 = = =∑ ; ij i i i 1 j 1 xy y 167,2 1 6n x n = = = =∑ ; 2 xs 183,29= ⌢ ; 2ys 0,6944= ⌢ . Vậy xy 2 2 x y xy x.y r 0,9729 s .s − = = ⌢ ⌢ . 2. ðường thẳng hồi qui • ðể tiện việc theo dõi và mô tả mô hình, gọi ñộ tuổi cho cá nhân i là xi và cholesterol là yi, i 1,10= . – Các ñiểm có tọa ñộ (xi; yi) tạo thành ñường gấp khúc và gần với ñường thẳng có dạng y = ax + b. Người ta dùng ñường thẳng y = ax + b ñể tính xấp xỉ các giá trị yi theo xi: i i iy ax b= + ε+ với một sai số iε , ñường thẳng này ñược gọi là ñường thẳng hồi quy. – Các thông số a, b phải ñược ước tính từ dữ liệu. Phương pháp ñể ước tính các thông số này là phương pháp bình phương bé nhất. Phương pháp bình phương bé nhất là tìm giá trị a, b sao cho tổng bình phương sai số n n i 1 i 1 22 i i i(axy b) = = ε = − +∑ ∑ là nhỏ nhất. – Ước lượng cho a, b ñáp ứng ñiều kiện trên là: 2 x xy x.y a , b y ax s − = = −⌢ . Chú ý x xy y x y y x x r s s − − =⌢ ⌢ . VD 2. ðo chiều cao X(m) và khối lượng Y(kg) của 5 học sinh, ta có kết quả: X(m) 1,45 1,6 1,5 1,65 1,55 Y(kg) 50 55 45 60 55 a) Tìm hệ số tương quan rxy. b) Lập phương trình hồi quy tuyến tính của Y theo X. c) Dự ñoán nếu một học sinh cao 1,62m thì nặng khoảng bao nhiêu kg? VD 3. Số vốn ñầu tư X(triệu ñồng) và lợi nhuận Y(triệu ñồng) trong một ñơn vị thời gian của 100 quan sát là: Y X 0,3 0,7 1,0 1 20 10 2 30 10 3 10 20 a) Lập phương trình hồi tuyến tính của X theo Y. b) Dự ñoán nếu muốn lợi nhuận thu ñược là 0,5 triệu ñồng thì cần ñầu tư bao nhiêu? VD 4. Số thùng bia Y(thùng) ñược bán ra phụ thuộc vào giá bán X (triệu ñồng/ thùng). ðiều tra 100 ñại lý về 1 loại bia trong một ñơn vị thời gian có bảng số liệu: Y X 100 110 120 0,150 5 15 30 0,160 10 25 0,165 15 a) Tính hệ số tương quan rxy. b) Lập phương trình hồi tuyến tính của X theo Y. c) Dự ñoán nếu muốn bán ñược 115 thùng bia thì giá bán mỗi thùng cỡ bao nhiêu? 3. Sử dụng máy tính tìm ñường hồi qui VD 5. (fx 500ES) Bài toán cho dạng cặp i i(x , y )như sau X 20 52 30 57 28 43 57 63 40 49 Y 1,9 4 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4 Tìm hệ số xyr , ñường hồi qui mẫu xy ax b= + . Nhập liệu: SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn mục Stat-> 2 (chế ñộ không tần số) MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, Y vào 2 cột) X Y 20 1,9 49 4 Xuất kết quả: SHIFT - > 1 -> 7 ->1(A chính là b trong phương trình) - >2 (B chính là a trong phương trình) -> 3 (r chính là xyr ). VD 6. (fx 500ES) Bài toán cho dạng bảng như sau X Y 21 23 25 3 2 4 5 3 5 11 8 Nhập liệu: SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn muc Stat-> 1 (chế ñộ có tần số) MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, Y, tần số vào 2 cột) X Y FREQ 21 3 2 21 4 5 23 4 3 23 5 11 25 5 8 Xuất kết quả giống ví dụ trên. ------------------------------------Hết--------------------------------------
File đính kèm:
- bai_giang_xac_suat_va_thong_ke_ban_moi.pdf