Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu
Tổng thể
- Là tập hợp tất cả các
phần tử cần khảo sát
một tính chất A nào
đó.
- Gọi N: số phần tử
của tổng thể.
Mẫu
- Là tập hợp gồm
các phần tử được
chọn từ tổng thể.
- Gọi n: số phần tử
của mẫu (cỡ mẫu).
Ví dụ 1: Tính chiều cao trung bình của người
Việt Nam ở độ tuổi 18.
Đo chiều cao của tất cả người Việt Nam ở
độ tuổi 18! Tốn thời gian, tiền bạc, công sức.
Không xác định được chính xác tổng thể.
Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong
kho gồm 1 triệu hộp.
Kiểm tra từng hộp! Phá vỡ tổng thể.
Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con
đường tiêm chích ma tuý trong số những người
nhiễm HIV ở Việt Nam.
Xác định tất cả những người nhiễm HIV!
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu
11/24/2019 1 LOG O Chương 4: LÝ THUYẾT MẪU & ƯỚC LƯỢNG THAM SỐ Giảng viên: Phan Trung Hiếu 2 I. Tổng thể và mẫu: Tổng thể - Là tập hợp tất cả các phần tử cần khảo sát một tính chất A nào đó. - Gọi N: số phần tử của tổng thể. Mẫu - Là tập hợp gồm các phần tử được chọn từ tổng thể. - Gọi n: số phần tử của mẫu (cỡ mẫu). 3 Ví dụ 1: Tính chiều cao trung bình của người Việt Nam ở độ tuổi 18. Đo chiều cao của tất cả người Việt Nam ở độ tuổi 18! Tốn thời gian, tiền bạc, công sức. Không xác định được chính xác tổng thể. Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong kho gồm 1 triệu hộp. Kiểm tra từng hộp! Phá vỡ tổng thể. Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con đường tiêm chích ma tuý trong số những người nhiễm HIV ở Việt Nam. Xác định tất cả những người nhiễm HIV! 4 Tổng thể (N) Mẫu (n) Nghiên cứuKết quả Hoàn lại Không hoàn lại 5 II. Các đặc trưng của tổng thể: Tỉ lệ (xác suất) phần tử có tính chất A: Trung bình của tổng thể: E(X) Phương sai của tổng thể: 2 Var(X) , :mp m N Số phần tử có tính chất A. 6 III. Các đặc trưng của mẫu: 3.1. Bảng số liệu: Gọi là những kết quả quan sát.1 2, ,..., kx x x Dạng liệt kê: x1,x2,, xk trong đó mỗi xi có thể lặp lại. Dạng bảng tần số: (Bảng pp thực nghiệm) Dạng khoảng: xi x1 x2 ... xk Tần số (ni) n1 n2 ... nk xi a1-b1 ai-bi ak-bk ni n1 ni nk Sắp xếp lại số liệu 2 a bx i ii 11/24/2019 2 7 3.2. Các đặc trưng mẫu: Cho bảng tần số xi x1 x2 ... xk Tần số (ni) n1 n2 ... nk n1+n2++ nk = n Trung bình mẫu ( ):x 1 1 k i i i x n x n 8 Phương sai mẫu (s2): 22 2 2 2 1 1 . . ( ( ) ) 1 1 k i i i ns n x n x x x n n Độ lệch mẫu (s): 2s s Tỉ lệ mẫu ( f ): mf n m: số phần tử có tính chất A nào đó. trong đó: 2 2 1 1 k i i i x n x n 9 fx-570 ES Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MODE→3: STAT→1:1-VAR Nhập số liệu: dùng nút tròn và nút = Khai báo cột tần số: SHIFT→MODE→▼→4: STAT→1: ON Nhập xong nhấn AC 10 Đọc kết quả: Đại lượng cần tìm Thao tác n SHIFT→ 1 → 5:Var→1: n→ = SHIFT→ 1 → 5:Var→ → = s SHIFT→ 1 → 5:Var→ → = x : x2 : 1x n 4 11 fx-570 ES PLUS Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MODE→3: STAT→1:1-VAR Nhập số liệu: dùng nút tròn và nút = Khai báo cột tần số: SHIFT→MODE→▼→4: STAT→1: ON Nhập xong nhấn AC 12 Đọc kết quả: Đại lượng cần tìm Thao tác n SHIFT→ 1 → 4:Var→1: n→ = SHIFT→ 1 → 4:Var→ → = s SHIFT→ 1 → 4:Var→ → = x : x2 :sx4 11/24/2019 3 13 fx-580 VNX Xóa bộ nhớ: SHIFT→ 9 → 2 → = Vào chế độ thống kê (STAT): MENU→6: STAT→1:1-VAR Nhập số liệu: dùng nút tròn và nút = Khai báo cột tần số: SHIFT→MENU→▼→3: STAT→1: ON Nhập xong nhấn AC 14 Đọc kết quả: Đại lượng cần tìm Thao tác n Nhấn ▼ Nhìn màn hình thấy n Nhìn màn hình thấy s Nhấn ▼ Nhìn màn hình thấy sx x OPTN→2:1-VAR x IV. Lý thuyết ước lượng: 15 Tổng thể (N) Mẫu (n) 2 p x 2s f Ước lượng (dự đoán) V. Ước lượng điểm: 16 -Kết quả được cho bởi một con số cụ thể. 2 p Ví dụ: Ta lấy mẫu và ước lượng chiều cao trung bình của người Việt Nam. Nếu kết luận chiều cao trung bình của người Việt Nam là 170cm thì 170cm là một ước lượng điểm. -Khi đó: x 2s f VI. Ước lượng khoảng: 17 -Kết quả cần ước lượng được cho bởi một khoảng (a,b). Ví dụ: Ta lấy mẫu và ước lượng chiều cao trung bình của người Việt Nam. Nếu kết luận chiều cao trung bình của người Việt Nam trong khoảng (158cm,172cm) thì (158cm,172cm) là một ước lượng khoảng. 18 Giả sử là tham số cần ước lượng 2( , , )p ( a b ) ( , ) γP a b (a,b): Khoảng tin cậy (khoảng ước lượng) với độ tin cậy .γ 1 γ, : Mức ý nghĩa. 11/24/2019 4 VII. Ước lượng trung bình của tổng thể: 19 : trung bình của tổng thể -Giả thiết: Cho cỡ mẫu n. Biết Cho độ tin cậy ,x s γ -Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho ( ; )x x -Phương pháp: Tùy vào n và : Khoảng tin cậy đối xứng. ( ; )x : Khoảng tin cậy tối đa. ( ; )x : Khoảng tin cậy tối thiểu. 20 KHOẢNG TIN CẬY ĐỐI XỨNG (2 PHÍA) (Xem Phương pháp dạng sơ đồ trang 18) 21 KHOẢNG TIN CẬY TỐI ĐA, TỐI THIỂU (1 PHÍA) (Xem Phương pháp dạng sơ đồ trang 18) 22 Ví dụ 1: Mẫu điều tra về chỉ tiêu X của một loại sản phẩm được kết quả cho trong bảng: xi (%) 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5 ni(số sp) 7 12 20 25 18 12 5 1 a) Hãy ước lượng khoảng cho trung bình chỉ tiêu X với độ tin cậy 95%. b) Hãy ước lượng khoảng cho trung bình tối đa của chỉ tiêu X với độ tin cậy 95%. c) Hãy ước lượng trung bình tối thiểu của chỉ tiêu X với độ tin cậy 95%. d) Những sản phẩm có chỉ tiêu X không quá 10% là sản phẩm loại 2. Hãy ước lượng khoảng cho trung bình chỉ tiêu X các sản phẩm loại 2 với độ tin cậy 95%, biết rằng chỉ tiêu X các sản phẩm loại 2 có phân phối chuẩn. 23 Giải a) n chưa biết và x s γ ( ) 2 C C 100. 17,3. 8,0691. 0,95. 0,95 0, 475 2 1,96. Gọi (%) là trung bình chỉ tiêu X. 30.n 24 sC n (15,7185 ; 18,8815) (%) 8,06911,96 1,5815. 100 ( ; )x x b) ( ) 0,5C C 1,65. γ 0,95 1 0,95 0, 05. 0, 45 sC n 8, 06911,65 1,3314. 100 11/24/2019 5 25 Vậy trung bình tối đa của chỉ tiêu X với độ tin cậy 95% là 18,6314%. ( ; ) ( ; 18,6314).x c) ( ; ) (15,9686 ; ).x Vậy trung bình tối thiểu của chỉ tiêu X với độ tin cậy 95% là 15,9686%. d) Bảng phân phối thực nghiệm các sản phẩm loại 2: xi (%) 2,5 7,5 ni(số sp) 7 12 26 Gọi (%) là trung bình chỉ tiêu X các sản phẩm loại 2 . n chưa biết và x s γ 7 12 19 5,6579 2,4779. 0,95 1 0,95 0,05. 21,C t n 0,05219 1,t 18; 0,025 2,101.t sC n 2, 47792,101 1,1944. 19 30.n VII. Ước lượng trung bình của tổng thể: 27 ; (4,4635 ; 6,8523) (%).x x Ví dụ 2: Chủ một kho cung cấp sơn muốn ước lượng lượng sơn chứa trong một thùng được sản xuất từ một dây chuyền công nghệ quốc gia. Biết rằng theo tiêu chuẩn của dây chuyền công nghệ đó, độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng. Điều tra một mẫu 50 thùng được lượng sơn trung bình là 0,97 thùng. Với độ tin cậy 99%, hãy ước lượng khoảng cho lượng sơn trung bình chứa trong một thùng. 28 Giải Gọi (thùng) là n x γ ( )C C 29 (thùng). VIII. Ước lượng tỉ lệ của tổng thể: 30 :p tỉ lệ của tổng thể -Giả thiết: Cho cỡ mẫu n. Biết tỉ lệ mẫu , m: số phần tử có tính chất A nào đó. Cho độ tin cậy γ -Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho với độ tin cậy ;p f f γ mf n : Khoảng tin cậy đối xứng. ;p f : Khoảng tin cậy tối đa. ;p f : Khoảng tin cậy tối thiểu. 11/24/2019 6 31 -Sai số ước lượng khoảng tin cậy đối xứng: (Xem Phương pháp dạng sơ đồ trang 22) 32 -Sai số ước lượng khoảng tin cậy tối đa, tối thiểu: (Xem Phương pháp dạng sơ đồ trang 22) 33 Ví dụ 1: Kiểm tra 100 sản phẩm trong một lô hàng lớn gồm 50000 sản phẩm thấy có 20 phế phẩm. Hãy ước lượng khoảng cho tỉ lệ phế phẩm với độ tin cậy 99%? Số phế phẩm của lô hàng đó nằm trong khoảng nào? Giải Gọi p : tỉ lệ phế phẩm của lô hàng. f : tỉ lệ phế phẩm trong 100 sản phẩm được kiểm tra γ ( )C C f 20 0, 2. 100 0,99. 2,58γ 0,99 0,495 2 2 34 p Số phế phẩm của lô hàng đó nằm trong khoảng: 0,0968 50000; 0,3032 50000 4840; 15160 (sản phẩm). (1 ) 0,2(1 0, 2)2,58 100 f fC n 0,1032 ; (0,0968 ; 0,3032).f f 35 Ví dụ 2: Cân ngẫu nhiên 45 con heo 3 tháng tuổi trong một trại chăn nuôi, ta được kết quả sau xi 35 37 39 41 43 45 47 ni 2 6 10 11 8 5 3 Heo có khối lượng trên 38kg là heo đạt tiêu chuẩn. Giả sử khối lượng tuân theo quy luật phân phối chuẩn. a) Hãy tìm khoảng ước lượng cho tỉ lệ heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90%. b) Hãy ước lượng tối đa cho tỉ lệ heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90%. 36 Gọi p : f : γ γ 0,9 0,45 1,64. 2 2 ( )C C f a) tỉ lệ heo đạt tiêu chuẩn. tỉ lệ heo đạt tiêu chuẩn trong 45 con heo được cân Giải 11/24/2019 7 37 p với độ tin cậy 90%. 38 b) γ ( )C C p Vậy, tỉ lệ tối đa cho heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90% là IX. Ước lượng phương sai của tổng thể: 39 Sinh viên tự nghiên cứu. X. Các bài toán liên quan đến ước lượng trung bình: 40 Xem trang 19 XI. Các bài toán liên quan đến ước lượng tỉ lệ: 41 Xem trang 23 42 Ví dụ 1: Một khách hàng nhận được lô hàng từ một nhà máy sản xuất bút bi rẻ tiền. Để ước lượng tỉ lệ bút hỏng, khách hàng lấy ngẫu nhiên 300 bút từ lô hàng kiểm tra và thấy có 30 bút hỏng. a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảm bảo độ tin cậy là bao nhiêu? b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt độ tin cậy 96% và độ chính xác 3% thì cần kiểm tra thêm bao nhiêu bút bi nữa? 11/24/2019 8 43 Giải a) 200n . (1 ) nC f f γ 2 ( )C 3 . 30 0,1. 300 f 0,025. 3000,025. 1,44. 0,1.(1 0,1) 2. (1,44) 2. 0, 4251 0,8502 85,02%. Gọi f : tỉ lệ bút hỏng trong 300 bút được kiểm tra. 44 b) γ 0,95 0, 475 1,96. 2 ) 2 (C C Gọi n là số bút bi cần kiểm tra. Vậy cần kiểm tra thêm 300 125m n (bút). , 6 , 8 2,06. 424,36 1n 425. 0,96 0, 03 2 2 2 2 . .(1 ) (2,06) .0,1.(1 0,1) 424,36 (0,03) C f fn 45 Ví dụ 2: Đo đường kính của 100 chi tiết do một máy sản xuất được số liệu xi(cm) 9,75 9,80 9,85 9,90 ni(số sản phẩm) 5 37 42 16 a) Nếu sử dụng mẫu này và muốn ước lượng đường kính trung bình với độ chính xác 0,006 cm thì đảm bảo độ tin cậy bao nhiêu? b) Nếu muốn ước lượng đường kính trung bình với độ chính xác là 0,003 cm và độ tin cậy là 95% thì cần kiểm tra thêm bao nhiêu chi tiết? 46 Giải a) 100 30. 0,04.n s γ C 47 b) 0,003. 0 9γ , 5. γ 0,95 0, 475 1,96. 2 ) 2 (C C Vậy cần kiểm tra thêm: Gọi n là số chi tiết cần kiểm tra. n (chi tiết). LOG O Chương 5: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: Phan Trung Hiếu Việc kiểm tra lại thông tin mà ta nhận được xem có đáng tin cậy không chính là bài toán kiểm định. 11/24/2019 9 49 I. Các khái niệm: Giả thuyết thống kê: là các giả thuyết nói về - Các tham số của tổng thể; -Quy luật phân phối xác suất hoặc tính độc lập của các biến ngẫu nhiên. Kiểm định giả thuyết thống kê: là công việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết thống kê từ các thông tin thu được trên mẫu điều tra. Ký hiệu: H: giả thuyết không. : giả thuyết đối (đối thuyết) của H.H 50 -Dựa vào mẫu lấy ra để đưa ra kết luận: "chấp nhận H (bác bỏ ) hay chấp nhận (bác bỏ H)". H H Ví dụ 1: Một tổ chức cho rằng chiều cao trung bình hiện nay của thanh niên Việt Nam là 1,65m. Hãy lập giả thuyết để kiểm chứng kết quả này? 51 Giải Gọi : chiều cao trung bình của thanh niên hiện nay (theo thực tế). Giả thuyết : 1, 65 . : 1,65 H H lấy một mẫu để điều tra kiểm định chấp nhận H bác bỏ 52 Ví dụ 2: Một ý kiến cho rằng tỉ lệ sinh viên thi đạt môn XSTK là thấp hơn 50%. Hãy lập giả thuyết để kiểm chứng điều này? Giải Gọi p: tỉ lệ sinh viên thi đạt môn XSTK (theo thực tế). Giả thuyết : 0,5 . H p : 0,5H p 53 Tiêu chuẩn kiểm định giả thuyết: là một thống kê T=T(X1, X2,,Xn) có thể phụ thuộc vào tham số đã biết trong giả thuyết H. Thống kê T được chọn sao cho thỏa điều kiện: Khi H đúng thì luật phân phối xác suất của T hoàn toàn được xác định. Miền bác bỏ: Với số bé cho trước, ta có thể tìm được tập hợp thỏa 0 W P{T W H đúng} . :W Miền bác bỏ giả thuyết H. :W Miền chấp nhận giả thuyết H. : Mức ý nghĩa. ( 0,1; 0,05; 0,01...) 54 Tiến hành quan trắc dựa trên mẫu ngẫu nhiên (X1, X2,, Xn) ta thu được mẫu cụ thể (x1, x2,, xn), ta tính được giá trị t=T(x1, x2,, xn). Từ đó: ■ Nếu thì ta bác bỏ H. ■ Nếu thì ta chấp nhận H (chưa đủ cơ sở để bác bỏ H). t W t W 11/24/2019 10 55 II. Các loại sai lầm trong kiểm định: : mức ý nghĩa. Thực tế Kết luận Sai lầm nào nghiêm trọng hơn? Cách làm giảm khả năng mắc sai lầm? 56 Ví dụ: Tôi đi khám bệnh Ebola, có 2 giả thiết H: Tôi thực sự bị bệnh Ebola. H: Tôi thực sự không bệnh Ebola. Kết luận của bác sĩ: Có bệnh Không bệnh Sai lầm loại I: Bác sĩ cho tôi về trong khi tôi thực sự có bệnh. Sai lầm loại II: Bác sĩ cách ly tôi trong khi tôi thực sự không có bệnh. Nghiêm trọng cách ly (tạm giam) cho về 57 -Ta không thể làm giảm P(sai lầm I) và P(sai lầm II) xuống cùng một lúc được vì khi P(sai lầm I) giảm thì P(sai lầm II) sẽ tăng và ngược lại. -Ta sẽ ấn định trước P(Sai lầm I) = , và trong điều kiện đó P(Sai lầm II) được hạn chế ở mức thấp nhất. III. Kiểm định tham số: 58 Giả sử là tham số cần kiểm định theo thực tế. 2( , , )p là giá trị đã biết theo 1 ý kiến nào đó.0 2 0 0 0 0( , , )p Kiểm định 2 phía Kiểm định 1 phía Kiểm định phía trái Kiểm định phía phải 0 0 : : H H 0 0 : : H H 0 0 : : H H 59 Các bước kiểm định tổng quát: -Bước 1: Đặt cặp giả thuyết thống kê. -Bước 2: Kiểm định giả thuyết thống kê. -Bước 3: Kết luận (chấp nhận hay bác bỏ H). IV. So sánh trung bình với một số: 60 : trung bình của tổng thể (thực tế, chua biết) 0 : cho trước. Cho trước mức ý nghĩa Nhắc lại: 1 . 11/24/2019 11 61 Các bước làm: xem trang 20 62 Ví dụ 1: Mẫu điều tra về năng suất của một giống lúa ở một vùng, kết quả cho trong bảng: xi (tạ/ha) 25 26 27 28 29 30 31 ni (Số ha) 3 5 8 10 7 6 2 Với mức ý nghĩa 2%, có thể cho rằng năng suất trung bình của giống lúa này là 29tạ/ha được không? 63 Giải Gọi (tạ) là năng suất lúa trung bình của giống lúa. 41.n chưa biết và 27,9512.x Giả thuyết: : 29, : 29. H H 1, 6117.s 30.n IV. So sánh trung bình với một số: 64 ( 29 4, 66) 1 8x nt s 0,02 ( ) 0,49 2 C 2,33.C Vì nên ta chấp nhận . Vậy, với mức ý nghĩa 2%, không thể cho rằng năng suất trung bình của giống lúa này là 29tạ/ha. t C 1 0,98. 4,1668.t | | H 65 Ví dụ 2: Trọng lượng của một gói chè do một máy tự động đóng theo thiết kế là 500 gam/gói. Người ta lấy ngẫu nhiên 30 gói cân thử được trọng lượng trung bình là 495 gam và độ lệch tiêu chuẩn là 10 gam. Một ý kiến cho rằng máy đóng gói chè làm việc không bình thường làm cho trọng lượng trung bình của gói chè giảm sút. Với mức ý nghĩa 5%, ý kiến này có đáng tin hay không. 66 Giải Gọi (gam) là trọng lượng trung bình của gói chè được máy đóng gói. n Giả thuyết: : : H H x s n 11/24/2019 12 IV. So sánh trung bình với một số: 67 t ( )C C Vì nên ta Vậy, với mức ý nghĩa 5%, ý kiến t H 68 Ví dụ 3: Trong năm trước trọng lượng trung bình khi xuất chuồng của một trại heo là 100 kg/con. Năm nay, người ta cho heo ăn một loại thức ăn mới với hy vọng sẽ làm tăng trọng nhiều hơn. Sau thời gian thử nghiệm, người ta cân ngẫu nhiên 50 con và tính được trọng lượng trung bình là 110 kg/con. Giả thiết trọng lượng của heo trong trại là biến ngẫu nhiên có độ lệch chuẩn là 50kg. a) Với mức ý nghĩa 5%, hãy xét xem loại thức ăn mới có làm tăng trọng lượng trung bình của heo lên hay không? b) Giải lại câu a) với mức ý nghĩa 10%. 69 Giải Gọi là trọng lượng trung bình của heo sau khi cho dùng loại thức ăn mới. ( )kg n Giả thuyết: : : H H x IV. So sánh trung bình với một số: 70 t ( )C C Vì nên ta H. Vậy, với mức ý nghĩa 5%, loại thức ăn mới a) IV. So sánh trung bình với một số: 71 ( )C C Vì nên ta Vậy, với mức ý nghĩa 10%, loại thức ăn mới H b) t V. So sánh tỉ lệ với một số: 72 p : tỉ lệ của tổng thể (thực tế, chua biết) 0p : cho trước. Cho trước mức ý nghĩa mf n : tỉ lệ mẫu. 11/24/2019 13 73 Các bước làm: xem trang 24 74 Ví dụ 1: Điều tra doanh số bán hàng của các hộ kinh doanh một loại hàng năm nay cho số liệu: xi (triệu đồng/tháng) 11 11,5 12 12,5 13 13,5 ni (Số hộ) 10 15 20 30 15 10 Những hộ có doanh số trên 12,5 triệu đồng/tháng là những hộ có doanh số cao. Theo một báo cáo, tỉ lệ hộ có doanh số cao là 35%. Với mức ý nghĩa 5%, số liệu trong báo cáo có đáng tin hay không. 75 Giải Gọi p: tỉ lệ hộ có doanh số cao. f : tỉ lệ hộ có doanh số cao trong 100 hộ. : 0,35 : 0,35. H p H p Giả thuyết: n = 100. 15 10 0, 25. 100 f 76 ( 0,35). 0,35(1 0,35 2 0966. ) ,nt f 0,05 1 0,95. ( ) 0,475 2 C 1,96.C Vì chấp nhận . Vậy, với mức ý nghĩa 5%, số liệu trong báo cáo không đáng tin. t C 2, 0966.t | | H 77 Ví dụ 2: Một công ty tuyên bố rằng 60% khách hàng ưa thích sản phẩm của công ty. Điều tra 400 khách hàng có 230 người ưa thích sản phẩm của công ty này. Với mức ý nghĩa 5%, số liệu trong tuyên bố trên có cao hơn so với thực tế hay không? 78 Giải Gọi p: tỉ lệ khách hàng ưa thích sản phẩm của công ty theo thực tế. f : tỉ lệ khách hàng ưa thích sản phẩm trong 400 khách hàng. : : H H Giả thuyết: n = f 11/24/2019 14 79 t ( )C C Vì nên ta H . Vậy, với mức ý nghĩa 5%, số liệu trong tuyên bố trên t VI. So sánh hai trung bình: 80 i : trung bình của tổng thể thứ i (i=1,2) m : cỡ mẫu lấy ra từ tổng thể thứ 1. ix : trung bình mẫu thứ i. is : độ lệch chuẩn của mẫu thứ i. i : độ lệch chuẩn của tổng thể thứ i. n : cỡ mẫu lấy ra từ tổng thể thứ 2. 81 Các bước làm: xem trang 21 82 Ví dụ: Người ta muốn so sánh chất lượng đào tạo tại hai cơ sở A, B căn cứ trên điểm trung bình ở kì thi quốc gia. Một mẫu 100 thí sinh được đào tạo tại cơ sở A có điểm trung bình 9,25, độ lệch chuẩn 0,8, và một mẫu 80 thí sinh được đào tạo tại cơ sở B có điểm trung bình 9, độ lệch chuẩn 1. a) Với mức ý nghĩa 5%, hãy cho biết chất lượng đào tạo của cơ sở A và B có khác nhau hay không? b) Nếu biết cơ sở A có đội ngũ giáo viên tốt hơn cơ sở B. Với mức ý nghĩa 5%, hãy cho biết chất lượng đào tạo của cơ sở A có tốt hơn cơ sở B không? IV. So sánh trung bình với một số: 83 Giải Gọi là điểm trung bình của các thí sinh được đào tạo tại cơ sở A, B. ,A B 100.m 1 2, chưa biết và 1 9,25.x Giả thuyết: : . : A B A B H H 1 0,8.s 80.n 2 9.x 2 1.s a) , 30.m n IV. So sánh trung bình với một số: 84 1 2 1,8185x xt m n 2 1 2 2s s 0,05 ( ) 0,475 2 C 1,96.C Vì nên ta chấp nhận H. Vậy, với mức ý nghĩa 5%, chất lượng đào tạo của hai cơ sở là như nhau. t C 1 0,95. 1,8185.t | | 11/24/2019 15 IV. So sánh trung bình với một số: 85 Giả thuyết: : : H H b) ( )C C Vì nên ta Vậy, với mức ý nghĩa 5%, H VII. So sánh hai tỉ lệ: 86 ip : tỉ lệ của tổng thể thứ i (i=1,2) m : cỡ mẫu lấy ra từ tổng thể thứ 1. if : tỉ lệ của mẫu thứ i. n : cỡ mẫu lấy ra từ tổng thể thứ 2. 1 2. .m f n ff m n 87 Các bước làm: xem trang 25 88 Ví dụ 1: Có 2 lô hạt giống. Từ lô thứ nhất gieo thử ngẫu nhiên 850 hạt thấy có 680 hạt nảy mầm. Từ lô thứ hai gieo thử 1200 hạt thấy có 1020 hạt nảy mầm. Với mức ý nghĩa 5%, có thể coi tỉ lệ hạt giống nảy mầm của 2 lô là khác biệt nhau hay không? IV. So sánh trung bình với một số: 89 Giải Gọi là tỉ lệ hạt nảy mầm của lô thứ nhất, lô thứ hai. 1 2,p p 1f là tỉ lệ hạt nảy mầm trong 850 hạt 1 680 0,8. 850 f 2f là tỉ lệ hạt nảy mầm trong 1200 hạt 2 1020 0,85. 1200 f 850.m 1200.n 90 1 2. . 0,8293.m f n ff m n Giả thuyết: 1 2 1 2 : . : H p p H p p 0,05 ( ) 0, 475 2 C 1,96.C 1 0,95. 11/24/2019 16 IV. So sánh trung bình với một số: 91 1 2 1 1(1 ) 2,9643f ft m n f f Vì nên ta chấp nhận . Vậy, với mức ý nghĩa 5%, có thể coi tỉ lệ hạt giống nảy mầm của 2 lô là khác biệt nhau. t C 2,9643.t | | H 92 Ví dụ 2: Kiểm tra chất lượng sản phẩm cùng loại do hai nhà máy A và B sản xuất, kết quả cho trong bảng: Nhà máy Số sản phẩm được kiểm tra Số phế phẩm A 1800 54 B 1200 30 Với mức ý nghĩa 5%, có thể cho rằng chất lượng sản phẩm của nhà máy B hơn nhà máy A không? IV. So sánh trung bình với một số: 93 Giải Gọi là tỉ lệ phế phẩm của nhà máy A, B.,A Bp p Af là tỉ lệ phế phẩm trong 1800 sản phẩm Af Bf là tỉ lệ phế phẩm trong 1200 sản phẩm Bf m n 94 f Giả thuyết: : : H H ( )C C IV. So sánh trung bình với một số: 95 t Vì nên ta H. Vậy, với mức ý nghĩa 5%, 17 65 18 6619 6720 6821 6922 7123 7024 7225 26 BÀI TẬP CHƯƠNG 4 VÀ CHƯƠNG 5 Bài 1 (A-ĐH-HK1-2012-2013): Năm 2011, công ty A tiến hành khảo sát về mức tiêu thụ sản phẩm của công ty (sản phẩm) đối với một số hộ gia đình (hộ) trong thành phố và thu được bảng số liệu sau: (kg/năm) 0 1 2 3 4 5 6 7 8 (số hộ) 48 16 22 33 24 25 15 10 7 a) Với độ tin cậy 99%, hãy ước lượng khoảng cho mức tiêu thụ sản phẩm trung bình của mỗi hộ. b) Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ hộ có sử dụng sản phẩm. Từ đó hãy ước lượng khoảng số hộ trong toàn thành phố có sử dụng sản phẩm nếu biết thành phố này có 2 triệu hộ. c) Theo một báo cáo của công ty, mức tiêu thụ sản phẩm trung bình của mỗi hộ là 3,3 kg/năm. Với mức ý nghĩa 5%, số liệu trong báo cáo có cao hơn so với thực tế hay không? d) Một cuộc khảo sát tương tự của công ty vào năm 2010 đối với 180 hộ thu được mức tiêu thụ trung bình của mỗi hộ là 2,68 kg/năm, độ lệch chuẩn là 2,29 kg/năm. Với mức ý nghĩa 5%, hãy cho biết mức tiêu thụ sản phẩm trung bình của mỗi hộ trong hai năm 2010 và 2011 có khác nhau hay không? Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2) = 0,4772; (2,33) = 0,49; (2,58) = 0,495. Bài 2 (A-ĐH-HK2-2012-2013): Năm 2012, người ta lấy mẫu về sản lượng sữa của một giống bò tại một nông trường trong một ngày và thu được bảng số liệu sau: (kg/ngày) 1,5 4,5 7,5 10,5 13,5 (số con bò) 10 24 42 16 8 a) Với độ tin cậy 95%, hãy ước lượng khoảng cho sản lượng sữa trung bình của một con bò trong một ngày. b) Nếu muốn bài toán ước lượng khoảng sản lượng sữa trung bình của một con bò trong một ngày đạt độ chính xác là 600g và độ tin cậy là 95% thì cần điều tra thêm bao nhiêu con bò nữa? c) Bò có sản lượng sữa trên 10 kg/ngày là bò đạt tiêu chuẩn. Một ý kiến cho rằng tỉ lệ bò đạt tiêu chuẩn là 34%. Với mức ý nghĩa 5%, tỉ lệ trong ý kiến trên có cao hơn so với thực tế hay không? d) Một cuộc điều tra tương tự vào năm 2011 đối với 80 con bò thì thấy có 20 con bò đạt tiêu chuẩn. Với mức ý nghĩa 5%, có thể coi tỉ lệ bò đạt tiêu chuẩn trong hai năm 2011 và 2012 là khác biệt nhau hay không? Cho biết: (0,56) = 0,2123; (1,96) = 0,475; (1,65) = 0,45. 27 Bài 3 (B-CĐ-HK1-2012-2013): Để đánh giá về chất lượng đóng gói tại một phân xưởng sản xuất đường, người ta kiểm tra ngẫu nhiên một số gói đường và thu được bảng số liệu như sau: (gam) 975 980 985 990 995 1000 1005 1010 (số gói) 2 10 12 20 28 16 8 4 a) Tính trung bình và phương sai của mẫu trên. b) Với độ tin cậy 99%, hãy ước lượng khoảng cho khối lượng trung bình của mỗi gói đường. c) Những gói được gọi là gói đóng thiếu nếu khối lượng của nó nhỏ hơn 1000 gam. Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ gói đóng thiếu. d) Theo một báo cáo, khối lượng trung bình của mỗi gói đường được đóng gói tại phân xưởng là 1000 gam. Với mức ý nghĩa là 5%, báo cáo này có đáng tin hay không? Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495. Bài 4 (B-CĐ-HK2-2013-2014): Để đánh giá mức độ tăng trưởng của heo (heo sau 3 tháng tuổi) tại một trang trại, người ta đã cân ngẫu nhiên một số con heo và thu được kết quả sau (trọng lượng: kg) 35 37 39 41 43 45 47 (số con) 2 6 10 11 8 5 3 a) Tính trung bình và phương sai của mẫu nói trên. b) Với độ tin cậy 95%, hãy ước lượng khoảng cho trọng lượng trung bình của mỗi con heo. c) Giả sử heo có trọng lượng trên 38kg là heo đạt tiêu chuẩn. Với độ tin cậy 99%, hãy ước lượng khoảng cho tỉ lệ heo đạt tiêu chuẩn. Từ đó, hãy ước lượng khoảng cho số heo đạt tiêu chuẩn nếu trang trại trên có 1000 con heo. d) Một cuộc thống kê tương tự được thực hiện tại một trang trại khác đối với 50 con heo thì thấy có 40 con đạt tiêu chuẩn. Với mức ý nghĩa 5%, tỉ lệ heo đạt tiêu chuẩn của hai trang trại có giống nhau hay không? Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495; t(19; 0,025) = 2,093. Bài 5 (A-ĐH-HK3-2013-2014): Người ta kiểm tra ngẫu nhiên về đường kính của một loại chi tiết tại phân xưởng A và thu được bảng số liệu như sau: (cm) 19,7 19,8 19,9 20 20,1 20,2 20,3 (số chi tiết) 15 16 26 33 24 25 11 a) Với độ tin cậy 99%, hãy ước lượng khoảng cho đường kính trung bình của một chi tiết. b) Nếu muốn bài toán ước lượng khoảng cho đường kính trung bình của một chi tiết đạt độ chính xác là 0,03 cm và có độ tin cậy 99% thì cần kiểm tra thêm bao nhiêu chi tiết nữa? 28 c) Những chi tiết có đường kính từ 19,8 cm đến 20,2 cm là chi tiết đạt tiêu chuẩn. Với mức ý nghĩa 5%, hãy đánh giá về nhận định: Tỉ lệ chi tiết đạt tiêu chuẩn của phân xưởng A là 80%. d) Một thống kê tương tự đối với 150 chi tiết tại phân xưởng B thu được 111 chi tiết đạt tiêu chuẩn. Với mức ý nghĩa 5%, tỉ lệ chi tiết đạt tiêu chuẩn của phân xưởng A có cao hơn tỉ lệ chi tiết đạt tiêu chuẩn của phân xưởng B hay không? Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495. Bài 6 (B-ĐH-HK3-2013-2014): Tại một địa phương, người ta lấy số liệu ngẫu nhiên về cân nặng của một số bé trai (khi mới sinh) và có kết quả như sau: (cân nặng: kg) 2,8 – 3 3 – 3,2 3,2 – 3,4 3,4 – 3,6 3,6 – 3,8 (số bé) 3 10 18 15 4 a) Với độ tin cậy 90%, hãy ước lượng khoảng cho cân nặng trung bình của mỗi bé trai. b) Với độ tin cậy 99%, hãy ước lượng khoảng cho tỉ lệ bé có cân nặng trên 3,4kg (đối với bé trai). c) Với mức ý nghĩa 5%, nêu đánh giá về nhận định: Tỉ lệ bé trai có cân nặng từ 3kg đến 3,6kg chiếm 90% số bé trai được sinh ra. d) Một cuộc thống kê tương tự được thực hiện đối với 50 bé gái thu được trung bình mẫu là 3,1kg và độ lệch chuẩn mẫu là 0,3kg. Với mức ý nghĩa 1%, khối lượng trung bình của bé trai và của bé gái có khác nhau hay không? Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495; t(19; 0,025) = 2,093. Bài 7 (A-ĐH-HK3-2014-2015): Gọi X (đơn vị: kg) là khối lượng của một loại sản phẩm thuộc xí nghiệp A. Điều tra một số sản phẩm của xí nghiệp này có kết quả sau 50 – 55 55 – 60 60 – 65 65 – 70 70 – 75 75 – 80 5 10 25 30 18 12 a) Hãy ước lượng khoảng cho giá trị trung bình của X với độ tin cậy 92%, b) Nếu muốn bài toán ước lượng khoảng cho giá trị trung bình của X có độ tin cậy là 95% và đạt độ chính xác không quá 1 kg thì cần điều tra thêm bao nhiêu sản phẩm nữa? c) Với mức ý nghĩa 5%, có thể kết luận khối lượng trung bình của loại sản phẩm trên là lớn hơn 65kg hay không? d) Giả thuyết cho rằng tỉ lệ sản phẩm có khối lượng lớn hơn 70kg là 40%. Hãy kiểm định giả thuyết trên với độ tin cậy 95%. Cho biết: (1,64) = 0,45; (1,96) = 0,475; (1,75) = 0,46; (2,182) = 0,4854; (2,2913) = 0,489; (2,4) = 0,4918. 29 Bài 8 (A-ĐH-HK1-2017-2018): Năm 2013, người ta thống kê về doanh số bán hàng của một siêu thị sau một số ngày và thu được bảng số liệu sau đây: (triệu đồng) 700 – 800 800 – 900 900 – 1000 1000 – 1100 1100 – 1200 1200 – 1300 (số ngày) 7 8 12 21 24 18 a) Với độ tin cậy 90%, hãy ước lượng khoảng cho doanh số bán hàng trung bình trong một ngày. b) Với độ tin cậy 95%, hãy ước lượng khoảng cho tỉ lệ ngày có doanh số bán hàng trên 1 tỉ đồng. c) Một báo cáo cho biết doanh số bán hàng trung bình trong một ngày là 1,1 tỉ đồng (1100 triệu đồng). Với mức ý nghĩa 1%, số liệu trong báo cáo này có cao hơn thực tế hay không? d) Một cuộc thống kê tương tự tại siêu thị này vào năm 2012 đối với 100 ngày thu được trung bình mẫu là 1105 triệu đồng và độ lệch chuẩn mẫu là 125 triệu đồng. Với mức ý nghĩa 1%, doanh số bán hàng trung bình trong một ngày của siêu thị trong năm 2012 và trong năm 2013 có giống nhau hay không? Cho biết: (1) = 0,3413; (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495.
File đính kèm:
- bai_giang_xac_suat_thong_ke_chuong_4_ly_thuyet_mau_va_uoc_lu.pdf