Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu

Tổng thể

- Là tập hợp tất cả các

phần tử cần khảo sát

một tính chất A nào

đó.

- Gọi N: số phần tử

của tổng thể.

Mẫu

- Là tập hợp gồm

các phần tử được

chọn từ tổng thể.

- Gọi n: số phần tử

của mẫu (cỡ mẫu).

Ví dụ 1: Tính chiều cao trung bình của người

Việt Nam ở độ tuổi 18.

Đo chiều cao của tất cả người Việt Nam ở

độ tuổi 18! Tốn thời gian, tiền bạc, công sức.

Không xác định được chính xác tổng thể.

Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong

kho gồm 1 triệu hộp.

Kiểm tra từng hộp! Phá vỡ tổng thể.

Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con

đường tiêm chích ma tuý trong số những người

nhiễm HIV ở Việt Nam.

Xác định tất cả những người nhiễm HIV!

pdf 29 trang kimcuc 18320
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu

Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số - Phan Trung Hiếu
11/24/2019
1
LOG
O
Chương 4:
LÝ THUYẾT MẪU 
& 
ƯỚC LƯỢNG THAM SỐ
Giảng viên: Phan Trung Hiếu
2
I. Tổng thể và mẫu: 
Tổng thể
- Là tập hợp tất cả các
phần tử cần khảo sát
một tính chất A nào
đó.
- Gọi N: số phần tử
của tổng thể.
Mẫu
- Là tập hợp gồm
các phần tử được
chọn từ tổng thể.
- Gọi n: số phần tử
của mẫu (cỡ mẫu).
3
Ví dụ 1: Tính chiều cao trung bình của người 
Việt Nam ở độ tuổi 18.
Đo chiều cao của tất cả người Việt Nam ở
độ tuổi 18! Tốn thời gian, tiền bạc, công sức.
Không xác định được chính xác tổng thể.
Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong
kho gồm 1 triệu hộp.
Kiểm tra từng hộp! Phá vỡ tổng thể.
Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con
đường tiêm chích ma tuý trong số những người
nhiễm HIV ở Việt Nam.
Xác định tất cả những người nhiễm HIV!
4
Tổng thể
(N)
Mẫu
(n)
Nghiên cứuKết quả
Hoàn lại
Không hoàn lại
5
II. Các đặc trưng của tổng thể: 
 Tỉ lệ (xác suất) phần tử có tính chất A:
 Trung bình của tổng thể: E(X) 
 Phương sai của tổng thể: 2 Var(X) 
, :mp m
N
 Số phần tử có tính chất A.
6
III. Các đặc trưng của mẫu: 
3.1. Bảng số liệu:
Gọi là những kết quả quan sát.1 2, ,..., kx x x
Dạng liệt kê: x1,x2,, xk trong đó mỗi xi có thể lặp lại.
Dạng bảng tần số:
(Bảng pp thực nghiệm) 
Dạng khoảng: 
xi x1 x2 ... xk
Tần số (ni) n1 n2 ... nk
xi a1-b1  ai-bi  ak-bk
ni n1  ni  nk
Sắp xếp lại số liệu
2
a bx i ii
11/24/2019
2
7
3.2. Các đặc trưng mẫu: Cho bảng tần số
xi x1 x2 ... xk
Tần số (ni) n1 n2 ... nk
n1+n2++ nk = n
Trung bình mẫu ( ):x
1
1 k
i i
i
x n x
n 
 
8
Phương sai mẫu (s2):
22 2 2 2
1
1 . . ( ( ) )
1 1
k
i i
i
ns n x n x x x
n n 

Độ lệch mẫu (s): 2s s 
Tỉ lệ mẫu ( f ): mf
n
m: số phần tử có tính chất A nào đó.
trong đó:
2 2
1
1 k
i i
i
x n x
n 
 
9
fx-570 ES
 Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT): 
MODE→3: STAT→1:1-VAR
 Nhập số liệu: dùng nút tròn và nút = 
 Khai báo cột tần số:
SHIFT→MODE→▼→4: STAT→1: ON
Nhập xong nhấn AC
10
 Đọc kết quả: 
Đại lượng
cần tìm Thao tác
n SHIFT→ 1 → 5:Var→1: n→ =
SHIFT→ 1 → 5:Var→ → =
s SHIFT→ 1 → 5:Var→ 
→ =
x : x2
: 1x n 4
11
fx-570 ES PLUS
 Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT): 
MODE→3: STAT→1:1-VAR
 Nhập số liệu: dùng nút tròn và nút = 
 Khai báo cột tần số:
SHIFT→MODE→▼→4: STAT→1: ON
Nhập xong nhấn AC
12
 Đọc kết quả: 
Đại lượng
cần tìm Thao tác
n SHIFT→ 1 → 4:Var→1: n→ =
SHIFT→ 1 → 4:Var→ → =
s SHIFT→ 1 → 4:Var→ → =
x : x2
:sx4
11/24/2019
3
13
fx-580 VNX
 Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT): 
MENU→6: STAT→1:1-VAR
 Nhập số liệu: dùng nút tròn và nút = 
 Khai báo cột tần số:
SHIFT→MENU→▼→3: STAT→1: ON
Nhập xong nhấn AC
14
 Đọc kết quả: 
Đại lượng 
cần tìm
Thao tác
n Nhấn ▼ Nhìn màn hình thấy n
Nhìn màn hình thấy 
s Nhấn ▼ Nhìn màn hình thấy sx
x
OPTN→2:1-VAR
x
IV. Lý thuyết ước lượng: 
15
Tổng thể
(N)
Mẫu
(n)

2
p
x
2s
f
Ước lượng (dự đoán)
V. Ước lượng điểm:
16
-Kết quả được cho bởi một con số cụ thể.
 2 p 
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam. Nếu kết luận
chiều cao trung bình của người Việt Nam là
170cm thì 170cm là một ước lượng điểm.
-Khi đó:
x 2s f
VI. Ước lượng khoảng:
17
-Kết quả cần ước lượng được cho bởi một
khoảng (a,b).
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam. Nếu kết luận
chiều cao trung bình của người Việt Nam
trong khoảng (158cm,172cm) thì
(158cm,172cm) là một ước lượng khoảng.
18
Giả sử là tham số cần ước lượng
2( , , )p   
(
a b
)
 ( , ) γP a b 
(a,b): Khoảng tin cậy (khoảng ước lượng) với
độ tin cậy .γ
1 γ, : Mức ý nghĩa.
11/24/2019
4
VII. Ước lượng trung bình của tổng thể:
19
: trung bình của tổng thể
-Giả thiết: Cho cỡ mẫu n. Biết 
Cho độ tin cậy 
,x s
γ
-Mục tiêu: Cần tìm (sai số ước lượng, độ 
chính xác) sao cho

( ; )x x   
-Phương pháp: Tùy vào n và 
: Khoảng tin cậy đối xứng.
( ; )x  : Khoảng tin cậy tối đa.
( ; )x  : Khoảng tin cậy tối thiểu.
20
KHOẢNG TIN CẬY ĐỐI XỨNG
(2 PHÍA)
(Xem Phương pháp dạng sơ đồ trang 18)
21
KHOẢNG TIN CẬY TỐI ĐA,
TỐI THIỂU (1 PHÍA)
(Xem Phương pháp dạng sơ đồ trang 18)
22
Ví dụ 1: Mẫu điều tra về chỉ tiêu X của một loại sản
phẩm được kết quả cho trong bảng:
xi (%) 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5
ni(số sp) 7 12 20 25 18 12 5 1
a) Hãy ước lượng khoảng cho trung bình chỉ tiêu X với độ
tin cậy 95%.
b) Hãy ước lượng khoảng cho trung bình tối đa của chỉ
tiêu X với độ tin cậy 95%.
c) Hãy ước lượng trung bình tối thiểu của chỉ tiêu X với
độ tin cậy 95%.
d) Những sản phẩm có chỉ tiêu X không quá 10% là sản
phẩm loại 2. Hãy ước lượng khoảng cho trung bình chỉ
tiêu X các sản phẩm loại 2 với độ tin cậy 95%, biết rằng
chỉ tiêu X các sản phẩm loại 2 có phân phối chuẩn.
23
Giải
a) n 
 chưa biết và 
x s 
γ 
( )
2
C C 
100.
17,3. 8,0691.
0,95.
0,95 0, 475
2
 1,96.
Gọi (%) là trung bình chỉ tiêu X.
30.n 
24
sC
n
  
 
(15,7185 ; 18,8815) (%) 
8,06911,96 1,5815.
100
 
( ; )x x  
b)
( ) 0,5C C 1,65.
γ 0,95 1 0,95 0, 05. 
0, 45
sC
n
  
8, 06911,65 1,3314.
100
 
11/24/2019
5
25
 
Vậy trung bình tối đa của chỉ tiêu X với độ tin
cậy 95% là 18,6314%.
( ; ) ( ; 18,6314).x  
c)  ( ; ) (15,9686 ; ).x  
Vậy trung bình tối thiểu của chỉ tiêu X với độ
tin cậy 95% là 15,9686%.
d) Bảng phân phối thực nghiệm các sản phẩm
loại 2:
xi (%) 2,5 7,5
ni(số sp) 7 12
26
Gọi (%) là trung bình chỉ tiêu X các sản
phẩm loại 2 .
 
n 
 chưa biết và 
x s 
γ 
7 12 19 
5,6579 2,4779.
0,95 1 0,95 0,05. 
 21,C t n 0,05219 1,t 
 18; 0,025 2,101.t 
sC
n
  
2, 47792,101 1,1944.
19
 
30.n 
VII. Ước lượng trung bình của tổng thể:
27
 ; (4,4635 ; 6,8523) (%).x x  
Ví dụ 2: Chủ một kho cung cấp sơn muốn ước
lượng lượng sơn chứa trong một thùng được sản
xuất từ một dây chuyền công nghệ quốc gia. Biết
rằng theo tiêu chuẩn của dây chuyền công nghệ đó,
độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng.
Điều tra một mẫu 50 thùng được lượng sơn trung
bình là 0,97 thùng. Với độ tin cậy 99%, hãy ước
lượng khoảng cho lượng sơn trung bình chứa trong
một thùng.
28
Giải
Gọi (thùng) là
n  x 
γ 
( )C C 

29
 
 
(thùng).
VIII. Ước lượng tỉ lệ của tổng thể:
30
:p tỉ lệ của tổng thể
-Giả thiết: Cho cỡ mẫu n.
Biết tỉ lệ mẫu , m: số phần tử có tính chất A nào đó. 
Cho độ tin cậy γ
-Mục tiêu: Cần tìm (sai số ước lượng, độ chính 
xác) sao cho
với độ tin cậy

 ;p f f  
γ
mf
n
: Khoảng tin cậy đối xứng.
 ;p f  : Khoảng tin cậy tối đa.
 ;p f  : Khoảng tin cậy tối thiểu.
11/24/2019
6
31
-Sai số ước lượng khoảng tin cậy đối xứng:
(Xem Phương pháp dạng sơ đồ trang 22)
32
-Sai số ước lượng khoảng tin cậy tối đa, tối 
thiểu:
(Xem Phương pháp dạng sơ đồ trang 22)
33
Ví dụ 1: Kiểm tra 100 sản phẩm trong một lô hàng lớn
gồm 50000 sản phẩm thấy có 20 phế phẩm. Hãy ước
lượng khoảng cho tỉ lệ phế phẩm với độ tin cậy 99%?
Số phế phẩm của lô hàng đó nằm trong khoảng nào?
Giải
Gọi p : tỉ lệ phế phẩm của lô hàng.
f : tỉ lệ phế phẩm trong 100 sản phẩm
được kiểm tra
γ 
( )C C 
f 20 0, 2.
100
0,99.
2,58γ 0,99 0,495
2 2
34
 
p 
Số phế phẩm của lô hàng đó nằm trong khoảng:
 0,0968 50000; 0,3032 50000 4840; 15160 
(sản phẩm).
(1 ) 0,2(1 0, 2)2,58
100
f fC
n
  0,1032
 ; (0,0968 ; 0,3032).f f  
35
Ví dụ 2: Cân ngẫu nhiên 45 con heo 3 tháng
tuổi trong một trại chăn nuôi, ta được kết quả
sau xi 35 37 39 41 43 45 47
ni 2 6 10 11 8 5 3
Heo có khối lượng trên 38kg là heo đạt tiêu
chuẩn. Giả sử khối lượng tuân theo quy luật
phân phối chuẩn.
a) Hãy tìm khoảng ước lượng cho tỉ lệ heo đạt
tiêu chuẩn trong trại trên với độ tin cậy 90%.
b) Hãy ước lượng tối đa cho tỉ lệ heo đạt tiêu
chuẩn trong trại trên với độ tin cậy 90%.
36
Gọi p :
f :
γ 
γ 0,9 0,45 1,64.
2 2
( )C C 
f 
a)
tỉ lệ heo đạt tiêu chuẩn.
tỉ lệ heo đạt tiêu chuẩn trong 45 con
heo được cân
Giải
11/24/2019
7
37
 
p 
với độ tin cậy 90%.
38
b) γ 
( )C C 
 
p 
Vậy, tỉ lệ tối đa cho heo đạt tiêu chuẩn trong 
trại trên với độ tin cậy 90% là 
IX. Ước lượng phương sai của tổng thể:
39
Sinh viên tự nghiên cứu.
  
X. Các bài toán liên quan đến ước lượng trung bình: 
40
Xem trang 19
XI. Các bài toán liên quan đến ước lượng tỉ lệ: 
41
Xem trang 23
42
Ví dụ 1: Một khách hàng nhận được lô hàng từ
một nhà máy sản xuất bút bi rẻ tiền. Để ước
lượng tỉ lệ bút hỏng, khách hàng lấy ngẫu
nhiên 300 bút từ lô hàng kiểm tra và thấy có 30
bút hỏng.
a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ
lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảm
bảo độ tin cậy là bao nhiêu?
b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt
độ tin cậy 96% và độ chính xác 3% thì cần
kiểm tra thêm bao nhiêu bút bi nữa?
11/24/2019
8
43
Giải
a)
200n 
.
(1 )
nC
f f
 
γ 2 ( )C 
3 .
30 0,1.
300
f 
0,025.
3000,025. 1,44.
0,1.(1 0,1)
2. (1,44) 2. 0, 4251
0,8502 85,02%.
Gọi f : tỉ lệ bút hỏng trong 300 bút được kiểm
tra.
 
44
b)
γ 0,95 0, 475 1,96.
2
)
2
(C C 
Gọi n là số bút bi cần kiểm tra. 
Vậy cần kiểm tra thêm
300 125m n (bút).
  
, 6 , 8 2,06.
 424,36 1n 425. 
0,96 0, 03
2 2
2 2
. .(1 ) (2,06) .0,1.(1 0,1) 424,36
(0,03)
C f fn

45
Ví dụ 2: Đo đường kính của 100 chi tiết do
một máy sản xuất được số liệu
xi(cm) 9,75 9,80 9,85 9,90
ni(số sản phẩm) 5 37 42 16
a) Nếu sử dụng mẫu này và muốn ước lượng
đường kính trung bình với độ chính xác 0,006
cm thì đảm bảo độ tin cậy bao nhiêu?
b) Nếu muốn ước lượng đường kính trung bình
với độ chính xác là 0,003 cm và độ tin cậy là
95% thì cần kiểm tra thêm bao nhiêu chi tiết?
46
Giải
a) 100 30. 0,04.n s 
γ 
C 
 
47
b) 0,003. 0 9γ , 5. 
γ 0,95 0, 475 1,96.
2
)
2
(C C 
Vậy cần kiểm tra thêm:
Gọi n là số chi tiết cần kiểm tra. 
n 
(chi tiết). LOG
O
Chương 5:
KIỂM ĐỊNH 
GIẢ THUYẾT THỐNG KÊ
Giảng viên: Phan Trung Hiếu
Việc kiểm tra lại thông tin mà ta nhận được
xem có đáng tin cậy không chính là bài toán
kiểm định.
11/24/2019
9
49
I. Các khái niệm: 
Giả thuyết thống kê: là các giả thuyết nói về -
Các tham số của tổng thể;
-Quy luật phân phối xác suất hoặc tính độc lập
của các biến ngẫu nhiên.
Kiểm định giả thuyết thống kê: là công việc
tìm ra kết luận để bác bỏ hay chấp nhận một
giả thuyết thống kê từ các thông tin thu được
trên mẫu điều tra.
Ký hiệu: H: giả thuyết không.
: giả thuyết đối (đối thuyết) của H.H
50
-Dựa vào mẫu lấy ra để đưa ra kết luận:
"chấp nhận H (bác bỏ ) 
hay chấp nhận (bác bỏ H)". 
H
H
Ví dụ 1: Một tổ chức cho rằng chiều cao trung
bình hiện nay của thanh niên Việt Nam là
1,65m. Hãy lập giả thuyết để kiểm chứng kết
quả này?
51
Giải
Gọi : chiều cao trung bình của thanh niên
hiện nay (theo thực tế).

Giả thuyết
: 1, 65
.
: 1,65
H
H


lấy một mẫu
để điều tra
kiểm định chấp nhận
H
bác bỏ
52
Ví dụ 2: Một ý kiến cho rằng tỉ lệ sinh viên thi
đạt môn XSTK là thấp hơn 50%. Hãy lập giả
thuyết để kiểm chứng điều này?
Giải
Gọi p: tỉ lệ sinh viên thi đạt môn XSTK (theo
thực tế).
Giả thuyết
: 0,5
.
H p 
 : 0,5H p 
53
Tiêu chuẩn kiểm định giả thuyết: là một thống kê
T=T(X1, X2,,Xn) có thể phụ thuộc vào tham số đã
biết trong giả thuyết H. Thống kê T được chọn sao
cho thỏa điều kiện: Khi H đúng thì luật phân phối
xác suất của T hoàn toàn được xác định.
Miền bác bỏ: Với số bé cho trước, ta có thể
tìm được tập hợp thỏa
0 
W 
P{T W H đúng} . 
:W Miền bác bỏ giả thuyết H.
:W Miền chấp nhận giả thuyết H.
: Mức ý nghĩa. ( 0,1; 0,05; 0,01...) 
54
Tiến hành quan trắc dựa trên mẫu ngẫu nhiên
(X1, X2,, Xn) ta thu được mẫu cụ thể (x1, x2,,
xn), ta tính được giá trị
t=T(x1, x2,, xn).
Từ đó:
■ Nếu thì ta bác bỏ H.
■ Nếu thì ta chấp nhận H (chưa đủ cơ sở
để bác bỏ H).
t W 
t W 
11/24/2019
10
55
II. Các loại sai lầm trong kiểm định: 
 : mức ý nghĩa. 
Thực tế
Kết luận
Sai lầm nào nghiêm trọng hơn?
Cách làm giảm khả năng mắc sai lầm?
56
Ví dụ: Tôi đi khám bệnh Ebola, có 2 giả thiết
H: Tôi thực sự bị bệnh Ebola.
H: Tôi thực sự không bệnh Ebola.
Kết luận của bác sĩ:
Có bệnh
Không bệnh
Sai lầm loại I: Bác sĩ cho tôi về trong khi tôi
thực sự có bệnh.
Sai lầm loại II: Bác sĩ cách ly tôi trong khi tôi
thực sự không có bệnh.
 Nghiêm trọng   
 cách ly (tạm giam)
 cho về
57
-Ta không thể làm giảm P(sai lầm I) và P(sai
lầm II) xuống cùng một lúc được vì khi P(sai
lầm I) giảm thì P(sai lầm II) sẽ tăng và ngược
lại.
-Ta sẽ ấn định trước P(Sai lầm I) = , và
trong điều kiện đó P(Sai lầm II) được hạn
chế ở mức thấp nhất.
III. Kiểm định tham số:
58
Giả sử là tham số cần kiểm định theo thực tế.
2( , , )p   
là giá trị đã biết theo 1 ý kiến nào đó.0 2
0 0 0 0( , , )p   
Kiểm định
2 phía
Kiểm định 
1 phía
Kiểm định
phía trái
Kiểm định
phía phải
0
0
:
:
H
H
 
 
0
0
:
:
H
H
 
 
 0
0
:
:
H
H
 
 
59
Các bước kiểm định tổng quát:
-Bước 1: Đặt cặp giả thuyết thống kê.
-Bước 2: Kiểm định giả thuyết thống kê.
-Bước 3: Kết luận (chấp nhận hay bác bỏ H).
IV. So sánh trung bình với một số:
60
 : trung bình của tổng thể (thực tế, chua biết)
0 : cho trước.
Cho trước mức ý nghĩa 
Nhắc lại: 1 . 
11/24/2019
11
61
Các bước làm: xem trang 20
62
Ví dụ 1: Mẫu điều tra về năng suất của một
giống lúa ở một vùng, kết quả cho trong bảng:
xi (tạ/ha) 25 26 27 28 29 30 31
ni (Số ha) 3 5 8 10 7 6 2
Với mức ý nghĩa 2%, có thể cho rằng năng
suất trung bình của giống lúa này là 29tạ/ha
được không?
63
Giải
Gọi (tạ) là năng suất lúa trung bình của
giống lúa.

41.n 
 chưa biết và 
27,9512.x 
Giả thuyết:
: 29,
: 29.
H
H


1, 6117.s 
30.n 
IV. So sánh trung bình với một số:
64
( 29 4, 66) 1 8x nt 
s
0,02 
( ) 0,49
2
C  2,33.C 
Vì nên ta chấp nhận .
Vậy, với mức ý nghĩa 2%, không thể cho
rằng năng suất trung bình của giống lúa
này là 29tạ/ha.
t C 
1 0,98. 
4,1668.t | |
H
65
Ví dụ 2: Trọng lượng của một gói chè do một
máy tự động đóng theo thiết kế là 500
gam/gói. Người ta lấy ngẫu nhiên 30 gói cân
thử được trọng lượng trung bình là 495 gam và
độ lệch tiêu chuẩn là 10 gam. Một ý kiến cho
rằng máy đóng gói chè làm việc không bình
thường làm cho trọng lượng trung bình của gói
chè giảm sút. Với mức ý nghĩa 5%, ý kiến này
có đáng tin hay không.
66
Giải
Gọi (gam) là trọng lượng trung bình của
gói chè được máy đóng gói.

n 
Giả thuyết:
:
:
H
H

x s 
n 
11/24/2019
12
IV. So sánh trung bình với một số:
67
t 
( )C C 
Vì nên ta
Vậy, với mức ý nghĩa 5%, ý kiến
t 
H
68
Ví dụ 3: Trong năm trước trọng lượng trung bình
khi xuất chuồng của một trại heo là 100 kg/con.
Năm nay, người ta cho heo ăn một loại thức ăn
mới với hy vọng sẽ làm tăng trọng nhiều hơn. Sau
thời gian thử nghiệm, người ta cân ngẫu nhiên 50
con và tính được trọng lượng trung bình là 110
kg/con. Giả thiết trọng lượng của heo trong trại là
biến ngẫu nhiên có độ lệch chuẩn là 50kg.
a) Với mức ý nghĩa 5%, hãy xét xem loại thức ăn
mới có làm tăng trọng lượng trung bình của heo
lên hay không?
b) Giải lại câu a) với mức ý nghĩa 10%.
69
Giải
Gọi là trọng lượng trung bình của heo
sau khi cho dùng loại thức ăn mới.
( )kg
n 
Giả thuyết:
:
:
H
H
 x 

IV. So sánh trung bình với một số:
70
t 
( )C C 
Vì nên ta H.
Vậy, với mức ý nghĩa 5%, loại thức ăn mới
a)
IV. So sánh trung bình với một số:
71
( )C C 
Vì nên ta
Vậy, với mức ý nghĩa 10%, loại thức ăn mới
H
b)
t 
V. So sánh tỉ lệ với một số:
72
p : tỉ lệ của tổng thể (thực tế, chua biết)
0p : cho trước.
Cho trước mức ý nghĩa 
mf
n
 : tỉ lệ mẫu.
11/24/2019
13
73
Các bước làm: xem trang 24
74
Ví dụ 1: Điều tra doanh số bán hàng của các
hộ kinh doanh một loại hàng năm nay cho số
liệu:
xi (triệu đồng/tháng) 11 11,5 12 12,5 13 13,5
ni (Số hộ) 10 15 20 30 15 10
Những hộ có doanh số trên 12,5 triệu
đồng/tháng là những hộ có doanh số cao. Theo
một báo cáo, tỉ lệ hộ có doanh số cao là 35%.
Với mức ý nghĩa 5%, số liệu trong báo cáo có
đáng tin hay không.
75
Giải
Gọi p: tỉ lệ hộ có doanh số cao.
f : tỉ lệ hộ có doanh số cao trong 100 hộ. 
: 0,35
: 0,35.
H p
H p
Giả thuyết: 
n = 100.
15 10 0, 25.
100
f 
76
( 0,35).
0,35(1 0,35
2 0966.
)
,nt 
f
0,05 1 0,95.  
( ) 0,475
2
C  1,96.C 
Vì chấp nhận .
Vậy, với mức ý nghĩa 5%, số liệu trong báo
cáo không đáng tin.
t C 
2, 0966.t | |
H
77
Ví dụ 2: Một công ty tuyên bố rằng 60%
khách hàng ưa thích sản phẩm của công ty.
Điều tra 400 khách hàng có 230 người ưa thích
sản phẩm của công ty này. Với mức ý nghĩa
5%, số liệu trong tuyên bố trên có cao hơn so
với thực tế hay không?
78
Giải
Gọi p: tỉ lệ khách hàng ưa thích sản phẩm của 
công ty theo thực tế.
f : tỉ lệ khách hàng ưa thích sản phẩm trong
400 khách hàng. 
:
:
H
H
Giả thuyết: 
n = 
f 
11/24/2019
14
79
t 
( )C C 
Vì nên ta H .
Vậy, với mức ý nghĩa 5%, số liệu trong tuyên
bố trên
t 
VI. So sánh hai trung bình:
80
i : trung bình của tổng thể thứ i (i=1,2)
m : cỡ mẫu lấy ra từ tổng thể thứ 1.
ix : trung bình mẫu thứ i.
is : độ lệch chuẩn của mẫu thứ i.
i : độ lệch chuẩn của tổng thể thứ i.
n : cỡ mẫu lấy ra từ tổng thể thứ 2.
81
Các bước làm: xem trang 21
82
Ví dụ: Người ta muốn so sánh chất lượng đào tạo
tại hai cơ sở A, B căn cứ trên điểm trung bình ở kì
thi quốc gia. Một mẫu 100 thí sinh được đào tạo
tại cơ sở A có điểm trung bình 9,25, độ lệch
chuẩn 0,8, và một mẫu 80 thí sinh được đào tạo
tại cơ sở B có điểm trung bình 9, độ lệch chuẩn 1.
a) Với mức ý nghĩa 5%, hãy cho biết chất lượng
đào tạo của cơ sở A và B có khác nhau hay
không?
b) Nếu biết cơ sở A có đội ngũ giáo viên tốt hơn
cơ sở B. Với mức ý nghĩa 5%, hãy cho biết chất
lượng đào tạo của cơ sở A có tốt hơn cơ sở B
không?
IV. So sánh trung bình với một số:
83
Giải
Gọi là điểm trung bình của các thí sinh
được đào tạo tại cơ sở A, B.
,A B 
100.m 
1 2,  chưa biết và 
1 9,25.x 
Giả thuyết:
:
.
:
A B
A B
H
H
 
 
1 0,8.s 
80.n 2 9.x 2 1.s 
a)
, 30.m n 
IV. So sánh trung bình với một số:
84
1 2 1,8185x xt
m n
2
1 2
2s s
0,05 
( ) 0,475
2
C  1,96.C 
Vì nên ta chấp nhận H.
Vậy, với mức ý nghĩa 5%, chất lượng đào tạo
của hai cơ sở là như nhau.
t C 
1 0,95. 
1,8185.t | |
11/24/2019
15
IV. So sánh trung bình với một số:
85
Giả thuyết:
:
:
H
H
b)
( )C C 
Vì nên ta
Vậy, với mức ý nghĩa 5%,
H
VII. So sánh hai tỉ lệ:
86
ip : tỉ lệ của tổng thể thứ i (i=1,2)
m : cỡ mẫu lấy ra từ tổng thể thứ 1.
if : tỉ lệ của mẫu thứ i.
n : cỡ mẫu lấy ra từ tổng thể thứ 2.
1 2. .m f n ff
m n
87
Các bước làm: xem trang 25
88
Ví dụ 1: Có 2 lô hạt giống. Từ lô thứ nhất gieo
thử ngẫu nhiên 850 hạt thấy có 680 hạt nảy
mầm. Từ lô thứ hai gieo thử 1200 hạt thấy có
1020 hạt nảy mầm. Với mức ý nghĩa 5%, có
thể coi tỉ lệ hạt giống nảy mầm của 2 lô là khác
biệt nhau hay không?
IV. So sánh trung bình với một số:
89
Giải
Gọi là tỉ lệ hạt nảy mầm của lô thứ nhất,
lô thứ hai.
1 2,p p
1f là tỉ lệ hạt nảy mầm trong 850 hạt
1
680 0,8.
850
f 
2f là tỉ lệ hạt nảy mầm trong 1200 hạt
2
1020 0,85.
1200
f 
850.m 1200.n 
90
1 2. . 0,8293.m f n ff
m n
Giả thuyết:
1 2
1 2
:
.
:
H p p
H p p
0,05 
( ) 0, 475
2
C  1,96.C 
1 0,95. 
11/24/2019
16
IV. So sánh trung bình với một số:
91
1 2
1 1(1 )
2,9643f ft
m n
f f
Vì nên ta chấp nhận .
Vậy, với mức ý nghĩa 5%, có thể coi tỉ lệ hạt
giống nảy mầm của 2 lô là khác biệt nhau.
t C 
2,9643.t | |
H
92
Ví dụ 2: Kiểm tra chất lượng sản phẩm cùng
loại do hai nhà máy A và B sản xuất, kết quả
cho trong bảng:
Nhà máy Số sản phẩm
được kiểm tra Số phế phẩm
A 1800 54
B 1200 30
Với mức ý nghĩa 5%, có thể cho rằng chất
lượng sản phẩm của nhà máy B hơn nhà máy A
không?
IV. So sánh trung bình với một số:
93
Giải
Gọi là tỉ lệ phế phẩm của nhà máy A, B.,A Bp p
Af là tỉ lệ phế phẩm trong 1800 sản phẩm
Af 
Bf là tỉ lệ phế phẩm trong 1200 sản phẩm
Bf 
m n 
94
f 
Giả thuyết:
:
:
H
H
( )C C 
IV. So sánh trung bình với một số:
95
t 
Vì nên ta H.
Vậy, với mức ý nghĩa 5%,
17
65
18
6619
6720
6821
6922
7123
7024
7225
26 
BÀI TẬP CHƯƠNG 4 VÀ CHƯƠNG 5 
Bài 1 (A-ĐH-HK1-2012-2013): Năm 2011, công ty A tiến hành khảo sát về mức 
tiêu thụ sản phẩm của công ty (sản phẩm) đối với một số hộ gia đình (hộ) trong 
thành phố và thu được bảng số liệu sau: 
 (kg/năm) 0 1 2 3 4 5 6 7 8 
 (số hộ) 48 16 22 33 24 25 15 10 7 
a) Với độ tin cậy 99%, hãy ước lượng khoảng cho mức tiêu thụ sản phẩm trung 
bình của mỗi hộ. 
b) Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ hộ có sử dụng sản phẩm. 
Từ đó hãy ước lượng khoảng số hộ trong toàn thành phố có sử dụng sản phẩm nếu 
biết thành phố này có 2 triệu hộ. 
c) Theo một báo cáo của công ty, mức tiêu thụ sản phẩm trung bình của mỗi hộ là 
3,3 kg/năm. Với mức ý nghĩa 5%, số liệu trong báo cáo có cao hơn so với thực tế 
hay không? 
d) Một cuộc khảo sát tương tự của công ty vào năm 2010 đối với 180 hộ thu được 
mức tiêu thụ trung bình của mỗi hộ là 2,68 kg/năm, độ lệch chuẩn là 2,29 kg/năm. 
Với mức ý nghĩa 5%, hãy cho biết mức tiêu thụ sản phẩm trung bình của mỗi hộ 
trong hai năm 2010 và 2011 có khác nhau hay không? 
Cho biết: 
 (1,64) = 0,45; (1,96) = 0,475; (2) = 0,4772; (2,33) = 0,49; (2,58) = 0,495. 
Bài 2 (A-ĐH-HK2-2012-2013): Năm 2012, người ta lấy mẫu về sản lượng sữa của 
một giống bò tại một nông trường trong một ngày và thu được bảng số liệu sau: 
 (kg/ngày) 1,5 4,5 7,5 10,5 13,5 
 (số con bò) 10 24 42 16 8 
a) Với độ tin cậy 95%, hãy ước lượng khoảng cho sản lượng sữa trung bình của 
một con bò trong một ngày. 
b) Nếu muốn bài toán ước lượng khoảng sản lượng sữa trung bình của một con bò 
trong một ngày đạt độ chính xác là 600g và độ tin cậy là 95% thì cần điều tra thêm 
bao nhiêu con bò nữa? 
c) Bò có sản lượng sữa trên 10 kg/ngày là bò đạt tiêu chuẩn. Một ý kiến cho rằng tỉ 
lệ bò đạt tiêu chuẩn là 34%. Với mức ý nghĩa 5%, tỉ lệ trong ý kiến trên có cao hơn 
so với thực tế hay không? 
d) Một cuộc điều tra tương tự vào năm 2011 đối với 80 con bò thì thấy có 20 con 
bò đạt tiêu chuẩn. Với mức ý nghĩa 5%, có thể coi tỉ lệ bò đạt tiêu chuẩn trong hai 
năm 2011 và 2012 là khác biệt nhau hay không? 
Cho biết: (0,56) = 0,2123; (1,96) = 0,475; (1,65) = 0,45. 
27 
Bài 3 (B-CĐ-HK1-2012-2013): Để đánh giá về chất lượng đóng gói tại một phân 
xưởng sản xuất đường, người ta kiểm tra ngẫu nhiên một số gói đường và thu được 
bảng số liệu như sau: 
 (gam) 975 980 985 990 995 1000 1005 1010 
 (số gói) 2 10 12 20 28 16 8 4 
a) Tính trung bình và phương sai của mẫu trên. 
b) Với độ tin cậy 99%, hãy ước lượng khoảng cho khối lượng trung bình của mỗi 
gói đường. 
c) Những gói được gọi là gói đóng thiếu nếu khối lượng của nó nhỏ hơn 1000 gam. 
Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ gói đóng thiếu. 
d) Theo một báo cáo, khối lượng trung bình của mỗi gói đường được đóng gói tại 
phân xưởng là 1000 gam. Với mức ý nghĩa là 5%, báo cáo này có đáng tin hay 
không? 
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495. 
Bài 4 (B-CĐ-HK2-2013-2014): Để đánh giá mức độ tăng trưởng của heo (heo sau 
3 tháng tuổi) tại một trang trại, người ta đã cân ngẫu nhiên một số con heo và thu 
được kết quả sau 
 (trọng lượng: kg) 35 37 39 41 43 45 47 
 (số con) 2 6 10 11 8 5 3 
a) Tính trung bình và phương sai của mẫu nói trên. 
b) Với độ tin cậy 95%, hãy ước lượng khoảng cho trọng lượng trung bình của mỗi 
con heo. 
c) Giả sử heo có trọng lượng trên 38kg là heo đạt tiêu chuẩn. Với độ tin cậy 99%, 
hãy ước lượng khoảng cho tỉ lệ heo đạt tiêu chuẩn. Từ đó, hãy ước lượng khoảng 
cho số heo đạt tiêu chuẩn nếu trang trại trên có 1000 con heo. 
d) Một cuộc thống kê tương tự được thực hiện tại một trang trại khác đối với 50 
con heo thì thấy có 40 con đạt tiêu chuẩn. Với mức ý nghĩa 5%, tỉ lệ heo đạt tiêu 
chuẩn của hai trang trại có giống nhau hay không? 
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495; 
t(19; 0,025) = 2,093. 
Bài 5 (A-ĐH-HK3-2013-2014): Người ta kiểm tra ngẫu nhiên về đường kính của 
một loại chi tiết tại phân xưởng A và thu được bảng số liệu như sau: 
 (cm) 19,7 19,8 19,9 20 20,1 20,2 20,3 
 (số chi tiết) 15 16 26 33 24 25 11 
a) Với độ tin cậy 99%, hãy ước lượng khoảng cho đường kính trung bình của một 
chi tiết. 
b) Nếu muốn bài toán ước lượng khoảng cho đường kính trung bình của một chi 
tiết đạt độ chính xác là 0,03 cm và có độ tin cậy 99% thì cần kiểm tra thêm bao 
nhiêu chi tiết nữa? 
28 
c) Những chi tiết có đường kính từ 19,8 cm đến 20,2 cm là chi tiết đạt tiêu chuẩn. 
Với mức ý nghĩa 5%, hãy đánh giá về nhận định: Tỉ lệ chi tiết đạt tiêu chuẩn của 
phân xưởng A là 80%. 
d) Một thống kê tương tự đối với 150 chi tiết tại phân xưởng B thu được 111 chi 
tiết đạt tiêu chuẩn. Với mức ý nghĩa 5%, tỉ lệ chi tiết đạt tiêu chuẩn của phân 
xưởng A có cao hơn tỉ lệ chi tiết đạt tiêu chuẩn của phân xưởng B hay không? 
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495. 
Bài 6 (B-ĐH-HK3-2013-2014): Tại một địa phương, người ta lấy số liệu ngẫu 
nhiên về cân nặng của một số bé trai (khi mới sinh) và có kết quả như sau: 
 (cân nặng: kg) 2,8 – 3 3 – 3,2 3,2 – 3,4 3,4 – 3,6 3,6 – 3,8 
 (số bé) 3 10 18 15 4 
a) Với độ tin cậy 90%, hãy ước lượng khoảng cho cân nặng trung bình của mỗi bé 
trai. 
b) Với độ tin cậy 99%, hãy ước lượng khoảng cho tỉ lệ bé có cân nặng trên 3,4kg 
(đối với bé trai). 
c) Với mức ý nghĩa 5%, nêu đánh giá về nhận định: Tỉ lệ bé trai có cân nặng từ 3kg 
đến 3,6kg chiếm 90% số bé trai được sinh ra. 
d) Một cuộc thống kê tương tự được thực hiện đối với 50 bé gái thu được trung 
bình mẫu là 3,1kg và độ lệch chuẩn mẫu là 0,3kg. Với mức ý nghĩa 1%, khối lượng 
trung bình của bé trai và của bé gái có khác nhau hay không? 
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495; 
t(19; 0,025) = 2,093. 
Bài 7 (A-ĐH-HK3-2014-2015): Gọi X (đơn vị: kg) là khối lượng của một loại sản 
phẩm thuộc xí nghiệp A. Điều tra một số sản phẩm của xí nghiệp này có kết quả 
sau 
 50 – 55 55 – 60 60 – 65 65 – 70 70 – 75 75 – 80 
 5 10 25 30 18 12 
a) Hãy ước lượng khoảng cho giá trị trung bình của X với độ tin cậy 92%, 
b) Nếu muốn bài toán ước lượng khoảng cho giá trị trung bình của X có độ tin cậy 
là 95% và đạt độ chính xác không quá 1 kg thì cần điều tra thêm bao nhiêu sản 
phẩm nữa? 
c) Với mức ý nghĩa 5%, có thể kết luận khối lượng trung bình của loại sản phẩm 
trên là lớn hơn 65kg hay không? 
d) Giả thuyết cho rằng tỉ lệ sản phẩm có khối lượng lớn hơn 70kg là 40%. Hãy 
kiểm định giả thuyết trên với độ tin cậy 95%. 
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (1,75) = 0,46; (2,182) = 0,4854; 
 (2,2913) = 0,489; (2,4) = 0,4918. 
29 
Bài 8 (A-ĐH-HK1-2017-2018): Năm 2013, người ta thống kê về doanh số bán 
hàng của một siêu thị sau một số ngày và thu được bảng số liệu sau đây: 
 (triệu đồng) 700 – 800 800 – 900 900 – 1000 1000 – 1100 1100 – 1200 1200 – 1300 
 (số ngày) 7 8 12 21 24 18 
a) Với độ tin cậy 90%, hãy ước lượng khoảng cho doanh số bán hàng trung bình 
trong một ngày. 
b) Với độ tin cậy 95%, hãy ước lượng khoảng cho tỉ lệ ngày có doanh số bán hàng 
trên 1 tỉ đồng. 
c) Một báo cáo cho biết doanh số bán hàng trung bình trong một ngày là 1,1 tỉ 
đồng (1100 triệu đồng). Với mức ý nghĩa 1%, số liệu trong báo cáo này có cao hơn 
thực tế hay không? 
d) Một cuộc thống kê tương tự tại siêu thị này vào năm 2012 đối với 100 ngày thu 
được trung bình mẫu là 1105 triệu đồng và độ lệch chuẩn mẫu là 125 triệu đồng. 
Với mức ý nghĩa 1%, doanh số bán hàng trung bình trong một ngày của siêu thị 
trong năm 2012 và trong năm 2013 có giống nhau hay không? 
Cho biết: (1) = 0,3413; (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; 
 (2,58) = 0,495. 

File đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_4_ly_thuyet_mau_va_uoc_lu.pdf