Bài giảng Xác suất thống kê A - Chương 5: Kiểm định giả tuyết thống kê

Định nghĩa 5.1. .

Giả thuyết thống kê là một phát biểu về những tham số của một hay nhiều tổng thể(/z, p, <72), hoặc="" về="" tính="" độc="" lập="" của="" các="" đặc="" điểm="" trong="" tổng="">

Kiêm định giả thuyết thống kê là việc dùng các phương pháp thống kê, dựa trên dữ liệu thu được từ mẫu điều tra cho kết luận về việc chấp nhận hay bác bỏ một giả thuyết thống kê nào đó.

Gọi

- H\ giả thuyết (giả thuyết không),

- H\ giả thuyết đối (đối thuyết)

Giả thuyết II là một phát biểu sẽ được kiểm tra thông qua một phép kiểm định có ý nghĩa, nghĩa là thông qua đó ta có bằng chứng đủ mạnh để bác bỏ H.

 

docx 10 trang kimcuc 9581
Bạn đang xem tài liệu "Bài giảng Xác suất thống kê A - Chương 5: Kiểm định giả tuyết thống kê", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê A - Chương 5: Kiểm định giả tuyết thống kê

Bài giảng Xác suất thống kê A - Chương 5: Kiểm định giả tuyết thống kê
Chương 5
Kiểm định giả tuyết thống kê
Khái nỉệm
Định nghĩa 5.1. .
Giả thuyết thống kê là một phát biểu về những tham số của một hay nhiều tổng thể(/z, p, <72), hoặc về tính độc lập của các đặc điểm trong tổng thể.
Kiêm định giả thuyết thống kê là việc dùng các phương pháp thống kê, dựa trên dữ liệu thu được từ mẫu điều tra cho kết luận về việc chấp nhận hay bác bỏ một giả thuyết thống kê nào đó.
Gọi
H\ giả thuyết (giả thuyết không),
H\ giả thuyết đối (đối thuyết)
Giả thuyết II là một phát biểu sẽ được kiểm tra thông qua một phép kiểm định có ý nghĩa, nghĩa là thông qua đó ta có bằng chứng đủ mạnh để bác bỏ H.
Ví dụ 5.1. Một nhà sản xuất cho rằng trọng lượng trung bình của 1 gói mì là 75g.
Để kiểm ưa điều này đúng hay sai, ta thực hiện các bước sau
Gọi /1 ưọng lượng trunh bình của gói mì.
Đặt giả thuyết
' H /1 = 75
77:/1^75
Lấy mẫu một số gói mì.
Kiểm định, tính toán.
Kết luận.
Các quyết định dựa vào mẫu quan sát nên có thể dẫn đến sai lầm. Có hai loại sai lầm
Định nghĩa 5.2. .
Sai lầm loại I: là sai lầm nếu bác bỏ giả thuyết H khi nó đúng. Xác suất của sai lầm loại I:
p {Sai lầm loại 1} = p {bác bỏ H\H đúng} = a.
Trong đó: a: mức ý nghĩa.
Sai lầm loại II: là sai lầm nếu chấp nhận giả thuyết H khi nó sai. Xác suất của sai lầm loại II:
p {Sai lầm loại 11} = p {chấp nhận HIHsai} = /3
Ta có:
Bác bỏ
Chấp nhận
H đúng
Sai lầm loại I p {bác bỏ H\H đúng} = a
p {chấp nhận H\H đúng} = 1 — a
H sai
p {bác bỏ H\H sai} = 1 — /3
Sai lầm loại II p {chấp nhận H1 -í/sai} = /3
Sai lầm loại I và loại II luôn tồn tại trong bài toán kiểm định, ta không thể đồng thời làm giảm 2 sai lầm này. Khi làm giảm sai lầm loại I ta sẽ làm tăng sai lầm loại II và ngược lại.
Ta sẽ ấn định p (sai lầm loại I) = Oí, khi đó xác suất sai lầm loại II sẽ nhỏ nhất.
Ví dụ 5.2. Một nhà kỉnh doanh sau khỉ áp dụng các biên pháp khuyến mãi muốn biết lợi nhuận có tăng hay không.
Giải. Giả thuyết
H: lợi nhuận tăng. (LN tăng); H : lợi nhuận không tăng.
Xét
Thực tế
Bác bỏ
Chấp nhận
lợi nhuận tăng
Sai lầm loại I p {bác bỏ H1 LN tăng} = a
kết luận đúng
p {chấp nhận H\ LN tăng} = 1 — a
lợi nhuận giảm
kết luận đúng
p {bác bỏ H\ LN giảm} = 1 — /3
Sai lầm loại II p {chấp nhận // LN giảm} = /3
Ta thấy, "lợi nhuận không tăng mà bảo tăng" là sai lầm nghiêm trọng hơn "lợi nhuận có tăng mà bảo không". Do đó, nên đặt giả thuyết: H: lợi nhuận không tăng.
Chú ý: nên đặt sai lầm nghiêm trọng hơn là sai lầm loại I.
Kiểm định giả thuyết về tham số
Gọi
ớ là tham số cần kiểm định (ớ = /z, P- ơ2).
ỠQ là giá trị cho trước.
Ta có
Kiểm định 2 phía
Kiểm định một phía
phía trái
phía phải
í H : e = 00
í H : e = ớo
H : 6t = 00
Ị H : ỡ í 00
Ị H : e < 00
ỉĩ : 0 > 00
X
> Các bước kiểm định
Bước 0: Xác định tham số mình quan tâm trong một bài toán cụ thể.
Bước 1: Phát biểu giả thuyết không H về tham số quan tâm.
Bước 2: Chỉ định đối thuyết H sẽ thay thế H
Bước 3: Xác định mức ý nghĩa.
Bước 4: Thu thập dữ liệu mẫu và tính giá trị thống kê kiểm định (x, s, f) .
Bước 5: Kiểm định giả thuyết thống kê.
Bước 6: Kết luận bác bỏ hay chấp nhận H.
Các phần sau chỉ trình bày bước 5, và 6.
So sánh trung bình với một số
Giả thuyết: cho
//: trung bình của tổng thể.
fio- giá trị cho trước
a: mức ý nghĩa.
Cách làm:
Bước 5:
Kiểm định 2 phía j H : /1 = /1O [ H : /1	/10
Kiểm định trái j H : /1 = /10 Ị H : /1 < /10
kiểm định phải j H : /1 = /10 [ H : /1 > /10
1
ơ biết
ơ chưa biết
n > 30.
ự>(C) = ^C
p (ơ) = 0.5 — a
p (C) = 0.5 — a
<
ơ chưa biết
n < 30.
c = t (n - 1,1)
c = t (n — 1, ơ)
c = t (n — 1, ữ)
xác định giá trị thống kê
_ (x - /lọ) ựn
□
Trong đó
- □ = ơ nếu ơ biết. - □ = s nếu ơ chưa biết.
Bước 6: Kết luận
Kiểm định 2 phía
Kiểm định trái í H : /1 = /10 [ H : /1 < /10
kiểm định phải í H : /1 = /10 ì H : /1 > /10
<
\ H
H
: /1 = /10
: /1 7^ /10
Chấp nhận H nếu
1 < c
-t<c
t<c
Chấp nhận H nếu
ỉ >c
-t>c
t>c
Ví dụ 5.3. Điểm trung bình môn XSTK năm học trước là 5,75. năm nay theo dõi 100 sinh viên được số liệu
Điểm 3 4 5 6 7 8 9
sốsv 3 5 27 43 12 6 4
Với mứ ý nghĩa 1%, phải chăng điểm trung bình môn XSTK năm nay cao hơn năm trước?
Giải.
Gọi p là điểm trung bình môn toán của năm nay.
Giả thuyết
' H : p = 5, 72
ĨT :/1 > 5, 72
Ta có a = 1% = 0,01, n = 100, X = 5,9 và s = 1,21.
=> ơ chưa biết, n > 30
<p (C) = 0.5 - a = 0,5 - 0, 01 = 0,49
=>c = 2,33
(5,9 - 5,72) ựĩõõ _ _
_t =	—V, v	~ i 4876.
1,21
Vì t = 1,4876 < c = 2,33, nên ta chấp nhận H.
Vậy điểm trung bình môn XSTK năm nay không cao hơn năm trưóc với mức ý nghĩa 1%.
Ví dụ 5.4. Trong năm 2001, Bộ Lao động Mỹ báo cáo rằng thu nhập trung bình giờ của công nhân sản xuất ỏ Mỹ là 14,32 USD/gỉờ. Một mẫu khảo sát 75 công nhân năm 2003 cho thấy trung bình mẫu là 14,68 USD/giờ. Giả sử độ lệch chuẩn tổng thể là ơ — 1,45 USD, có thể kết luận rằng thu nhập trung bình đã tăng lên so với năm 2001 được không? Biết a = 0,05.
Giải
Ví dụ 5.5. Một nhà nghiên cứu nhân chủng học muốn tìm hiểu xem chiều cao trung bình của thanh niên có thay đổi không so với mức 1,7Om cách đây 10 năm. Một mẫu gồm 121 thanh niên được chọn và từ mẫu đó tính được X = 1,72m với độ lệch chuẩn s = 0,02m. Vói mức ý nghĩa a = 0,05 ta có thể kết luận gì về sự thay đổi chiều cao trung bình của thanh niên.
Giải
So sánh tỉ lệ với một số
Giả thuyết: cho
p: tỉ lệ của tổng thể.
Po’. giá trị cho trước
f: tỉ lệ mẫu.
a: mức ý nghĩa. Cách làm:
Bước 5:
Kiểm định 2 phía
Kiểm định trái
kiểm định phải
í H :p = Pũ
H :p^p0
X. '
í H :p = Pũ H :p < Po X.
J H : p = Po
H : p > Po
v(C) = l^C
(p (Ợ) = 0.5 — a c
ip (Ợ) = 0.5 — a c
Xác định giá trị thống kê
t = (f-pữ^P^Ỵ
Bước 6: Kết luận
Kiểm định 2 phía í H :p = p0 1 H :p^Pũ
]
<
<iểm định trái
H :p = pữ
H : p < Pữ
1
<
liểm định phải
H :p = pữ
H :p>pữ
Chấp nhận H nếu
1
< c
-t<c
t <c
Chấp nhận H nếu
t >c
-t>c
t>c
Ví dụ 5.6. Theo thống kê của bộ y tế, 12% dân cư tỉnh A mắc bệnh đau mắt hột. Khi kiểm tra 200 người tại tỉnh A đã phát hiện 21 người đau mắt hột. số liệu này có khẳng định kết luận mà bộ y tế đưa ra không, với mức ý nghĩa 1%.
Giải
Gọi p là tỉ lệ người dân tỉnh A mắc bệnh đau mắt hột.
Giả thuyết
H : p = 0,12
Ỹ7:p%0,12
_	_	21
Ta có a = 1% = 0,01 => 7 = 0,99, n = 200, f = 7^- = 0,105.
^UU
(<?) = I =	= 0,495
=>G = 2,58
-i=(0’i05-°’i2)\O^)"-0’6528-
Vì |t| = 0,6528 < c = 2,58, nên ta chấp nhận H.
Vậy, báo cáo của bộ y tế được chấp nhận là đúng với mức ý nghĩa 1%.
Ví dụ 5.7. Tỉ lệ học sinh tốt nghiệp THPT năm ngoái của tỉnh A là 88%. Trong kĩ thỉ năm nay, trong 100 em được chọn ngẫu nhiên có 82 em thi đỗ. Với mức ý nghĩa 5%, có thể kết luận rằng tỉ lệ học sinh thỉ đỗ năm nay thấp hơn năm ngoái hay không?
Giải
So sánh hai trung bình
Giả thuyết:
- Tổng thể I: ị
xĩ, 51, cỡ mẫu m.
- Tổng thể II: <
ự2, ơ2,
X‘2, 52, CỠ mẫu n.
Cách làm:
Bước 5:
K
<
dểm định 2 phía
77 : /11 = /12 ' H : /11 ± /12
Kiểm định írái í 77 : /11 = /12 ( H : /11 < /12
kiểm định phải í 77 : /11 = /12 [ 77 : /11 > /12
(71, (72 biết (71, (72 chưa biết
và m, n > 30
II
(f> (C) = 0.5 — Oi
->c:
(p (Ợ) = 0.5 — a
(71, Ơ2 chưa biết
và m, n < 30
t
c =
m + n — 2, — 1
c =
t (m + n — 2, a)
c =
t (m + n — 2, cu)
Xác định giá trị thống kê
t _ X1 - x2
/□1 O2
V m n
Trong đó
Oi = (71, Ũ2 = ơỊ, nếu (71, Ơ2 biết.
Ũ1 = Sỵ, Ũ2 = 52, nếu (71, 30.
_	9 (m — l)s? + (n — l)sọ <	,	, , x
Oi = Ũ2 = 5 =	—	-	, nêu (71, <72 chưa biêt và m, n < 30.
m + n — 2
Bước 6: Kết luận
Kiểm định 2 phía
Kiểm định trái
kiểm định phải
í 77 : /11 = /12
í 77 : /11 = /12
í 77 : /11 = /12
77 : /11 ỹỂ /12
X.
Ị 77 : /11 < /12
1 77 : /11 > /12
Chấp nhận H nếu
t <c
-t<c
t<c
Chấp nhận 77 nếu
t > c
-t>c
t>c
ví dụ 5.8. Gọi X, Y là khối lượng trẻ sơ sinh trai và gái. Quan sát ngẫu nhiên 22 bé trai, ta được X = 3200<7; sx = 400/7 và quan sát 20 bé gái, ta được ỹ = 3000/7, Sy = 380//.
Với mức ý nghĩa 5%, hãy cho biết khối lượng của trẻ sơ sinh trai và gái có giống nhau không?
Giải. Ta có:
Trẻ sơ sinh nam: X = 3200/7; sx = 400/7,m = 22
Trẻ sơ sinh gái: ỹ = 3000/7, sy = 380/7,n = 20 => ơx, ơy chưa biết và m,7ỉ < 30.
Gọi
px khối lượng trung bình của tre sơ sinh trai.
Py khối lượng trung bình của tre sơ sinh gái. Giả thuyết
H : Pi= p2
H : /11	/12
Ta có
-C = t(m + n-2,^) = tự2 + 20-2,^yẼJ = í (40; 0,025) = 2,021. _ g2 = (m-lH + (n-lH = 21.4002 + 19 3802 = 152590
	TTt + n — 2	40
3200-3000
-1 = —V	~ 1; 6572.
/152590	152590
V 22 + 20
=> |t| = 1,6572 chấp nhận H.
Vậy, khối lượng trẻ sơ sinh trai và gái là như nhau với mức ý nghĩa 5%.
Ví dụ 5.9. Diêm trung bình học tập của 50 học sinh lóp 5 trường TH Quận 5 là 6, 72, phương sai mẫu là (0,72)2. Điểm trung bình học tập của 80 học sinh lớp 5 trường TH quận 1 là 6,46, phương sai mẫu là (0,91)2.
Với mức ý nghĩa 5%, hãy cho biết điểm trung bình học tập của học sinh trường TH quận 5 và trường TH quận 1 có khác nhau không.
Với mức ý nghĩa 5%, hãy cho biết điểm trung bình học tập của học sinh trường TH quận 5 có lớn hơn trường TH quận 1 không.
Giải
So sánh hai tỉ lệ
Giả thuyết:
- Tổng thể I: <
tỉ lệ tổng thể, tỉ lệ mẫu/1, cỡ mẫu m.
- Tổng thể II:
p2ứ lệ tổng thể,
tỉ lệ mẫu/2, cỡ mẫu n.
Cách làm:
Bước 5:
Kiểm định 2 phía
Kiểm định trái
kiểm định phải
í H : P1 = p2
( H :p1ỹ^p2
í H : P1 = p2
1 H :pi<p2
\
í H : P1 = p2 ( H : P1 > p2
v(ơ) = ị^c
(ơ) = 0.5 - a c
V (ờ) = 0.5 - a c
Xác định giá trị thống kê
J. = m./i + n.f2
m + n
Bước 6: Kết luận
Kiểm
định 2 phía
Kiểm định trái
kiểm định phải
H
: Pl = P2
í H : P1 = p2
í H : P1 = p2
H
X.
‘■P1^P2
1 H : P1 < p2
H : P1> p2
X
Chấp nhận H nếu
t < c
-t<c
t<c
Chấp nhận H nếu
> >c
-t>c
t>c
Ví dụ 5.10. Kiêm tra ỉ 00 sản phẩm ở kho I, thấy có sáu phế phẩm. Kiểm tra 200 sản phẩm ỏ kho II, thấy có 24 phế phẩm. Với mức ý nghĩa 5%, chất lượng hàng ở hai kho có khác nhau hay không?
Giải. Ta có
- Kho I: m = 100; /1 = -6-
J 100
Kho II: n = 200; Ỉ2 =
„ ' J \ 200
Q = 0,05 => 7 = 0,95
Gọi
- Pi tỉ lệ phế phẩm ở kho I.
- P2 tỉ lệ phế phẩm ỏ kho II.
Giả thuyết
H : Pl = P2
< f ,
k H :pi^P2
Ta có
^(C) =	= 0,475 => c = 1,96.
_ 100.0,06 + 200.0,12 _ i
-1,633
0,06 - 0,12
t 	 .	 '
=> |t| = 1,633 chấp nhận H.
Jo, 1.(1 - 0,1). I+ -*-) y ’ k J ựoo 200/
Vậy, Chất lượng hàng hóa tại hai kho là như nhau với mức ý nghĩa 5%.
Ví dụ 5.11. Trong năm 2018, tại xí nghiệp A có 200 công nhân thì có 30 công nhân xin nghỉ việc, tại xí nghiệp B có 350 công nhân thì có 65 công nhân xin nghỉ việc. Với múc ý nghĩa 5% có thể cho rằng tỉ lệ công nhân thôi việc tại xí nghiệp A thấp hơn xí nghiệp B hay không?
Giải

File đính kèm:

  • docxbai_giang_xac_suat_thong_ke_a_chuong_5_kiem_dinh_gia_tuyet_t.docx
  • pdfxstk_chuong_5_0838_569348.pdf