Giáo trình Xác suất thống kê (Phần 2)

Các phương pháp xây dựng mẫu
Mẫu lặp
Lấy mẫu có lặp là lấy mẫu mà phần tử lấy ra, sau khi đã ghi giá trị đặc trưng, được trả trở lại tổng
thể trộn đều rồi lấy tiếp phần tử khác.(phân phối nhị thức).
Mẫu không lặp
Lấy mẫu không lặp là lấy mẫu mà phần tử lấy ra, sau khi đã ghi giá trị đặc trưng, không trả trở
lại tổng thể mà lấy tiếp phần tử khác.(phân phối siêu bội).
Ta biết rằng, phân phối siêu bội hội tụ về phân phối nhị thức nên khi số phần tử của tổng thể là
N rất lớn so với kích thước mẫu n(N > 100n) thì việc lấy mẫu không lặp lại xem như mẫu có lặp.
Do đó, trong lý thuyết, ta thường nghiên cứu mẫu lặp.
Xây dựng mẫu theo lối điển hình
Ví dụ 4.1.48 Để ước lượng chiều cao trung bình của học sinh lớp 4 tại địa phương A có 20000 học
sinh lớp 4. Trong đó, ở thành phố 7000, ở nông thôn 8000 và ở miền núi 5000 học sinh. Lấy mẫu
2000 học sinh như sau: lấy 700 học sinh ở thành phố, 800 học sinh ở nông thôn và 500 học sinh ở
miền núi. Khi đó mẫu được chọn như trên được xây dựng theo lối điển hình.
20 trang kimcuc 23960
Download
Bạn đang xem tài liệu "Giáo trình Xác suất thống kê (Phần 2)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Giáo trình Xác suất thống kê (Phần 2)

Chương 4
MẪU VÀ CÁC THAM SỐMẪU
4.1. MẪU VÀ CÁC PHƯƠNG PHÁP XÂY DỰNGMẪU
4.1.1. Tổng thể và mẫu
Định nghĩa 4.1.24 Tập hợp toàn bộ các đối tượng cần nghiên cứu, khảo sát "đặc tính" nào đó của
chúng gọi là tổng thể(hay tập hợp tổng quát hay tập sinh). Ký hiệu tập tổng thể là Ω.
Số phần tử(lực lượng) của Ω gọi là kích thước của tổng thể Ω.
Định nghĩa 4.1.25 Từ tổng thể, ta chọn ngẫu nhiên(theo một cách chọn đã quy định trước) n phần
tử(đối tượng), tập n phần tử được chọn gọi là một mẫu. Khi đó, n gọi là kích thước mẫu
4.1.2. Các phương pháp xây dựng mẫu
Mẫu lặp
Lấy mẫu có lặp là lấy mẫu mà phần tử lấy ra, sau khi đã ghi giá trị đặc trưng, được trả trở lại tổng
thể trộn đều rồi lấy tiếp phần tử khác.(phân phối nhị thức).
Mẫu không lặp
Lấy mẫu không lặp là lấy mẫu mà phần tử lấy ra, sau khi đã ghi giá trị đặc trưng, không trả trở
lại tổng thể mà lấy tiếp phần tử khác.(phân phối siêu bội).
Ta biết rằng, phân phối siêu bội hội tụ về phân phối nhị thức nên khi số phần tử của tổng thể là
N rất lớn so với kích thước mẫu n(N > 100n) thì việc lấy mẫu không lặp lại xem như mẫu có lặp.
Do đó, trong lý thuyết, ta thường nghiên cứu mẫu lặp.
Xây dựng mẫu theo lối điển hình
Ví dụ 4.1.48 Để ước lượng chiều cao trung bình của học sinh lớp 4 tại địa phương A có 20000 học
sinh lớp 4. Trong đó, ở thành phố 7000, ở nông thôn 8000 và ở miền núi 5000 học sinh. Lấy mẫu
2000 học sinh như sau: lấy 700 học sinh ở thành phố, 800 học sinh ở nông thôn và 500 học sinh ở
miền núi. Khi đó mẫu được chọn như trên được xây dựng theo lối điển hình.
Xây dựng mẫu theo lối máy móc
Ví dụ 4.1.49 Để kiểm tra một đoạn đường AB dài 3000m. Bắt đầu từ A cứ cách 30m ta lấy một
mẫu. Khi đó, ta được một mẫu có kích thước n = 100 xây dựng theo lối máy móc.
31
32 Chương 4. MẪU VÀ CÁC THAM SỐMẪU
4.2. Các phương pháp trình bày số liệu
4.2.1. Mẫu ngẫu nhiên và mẫu thực nghiệm
Ta chọn ngẫu nhiên một phần tử từ tập Ω. Khi đó Ω được xem như là không gian các sự kiện sơ
cấp. GọiX là biến ngẫu nhiên biểu thị đặc trưng nghiên cứu trên tập Ω(X liên kết với phép thử lấy
ra một phần tử). Ký hiệu ϵ là phép thử lấy ra một phần tử.
Lặp lại phép thử ϵ n lần. Gọi Xi là giá trị đặc trưng của phần tử được lấy ra lần thứ i(i =
1, n. Khi đó các biến X1, X2, . . . , Xn độc lập có cùng quy luật phân phối vớiX , n biến ngẫu nhiên
(X1, X2, . . . , Xn) gọi là mẫu ngẫu nhiên củaX .
Sau khi lấy mẫu, ta có X1 = x1, X2 = x2, . . . , Xn = xn. Bộ n số (x1, x2, . . . , xn) được gọi là
mẫu cụ thể(mẫu thực nghiệm) củaX .
Định nghĩa 4.2.26 Ta gọi mẫu ngẫu nhiên kích thức n của biến ngẫu nhiên X là một bộ n thứ tự
(X1, X2, . . . , Xn), trong đóX1, X2, . . . , Xn là n biến ngẫu nhiên độc lập có cùng phân phối xác suất
vớiX .
Sau khi đã lấy mẫu, ta cóX1 = x1, X2 = x2, . . . , Xn = xn. Bộ n số (x1, x2, . . . , xn) được gọi là
mẫu cụ thể(mẫu thực nghiệm) củaX .
4.2.2. Các phương pháp trình bày mẫu
Trình bày một mẫu có ít giá trị khác nhau
Giả sử khi lấy mẫu kích thức n của biến ngẫu nhiên X có mẫu cụ thể với số liệu ban đầu
(x1, x2, . . . , xn) nhưng trong đó chỉ có k giá trị khác nhau: a1 < a2 < . . . < ak
Gọi ni là số lần ai(i = 1, n có trong mẫu thực nghiệm. ni gọi là tần số.
Gọi fi =
ni
n
là tần suất của giá trị ai trong mẫu thực nghiệm.
Khi đó, ta có bảng thống kê(Bảng phân phối tần số không chia lớp) sau:
ai a1 a2 . . . ak
ni n1 n2 . . . nk
Ví dụ 4.2.50 Ta lấy mẫu kích thước n = 20, ta có 1, 3, 2, 1, 5, 3, 4, 1, 4, 3, 2, 5, 4, 3, 12, 1, 4, 3, 3
Ta có bảng thống kê
ai 1 2 3 4 5
ni 5 3 6 4 2
Trình bày một mẫu có nhiều giá trị khác nhau
Trong trường hợp lấy mẫu kích thước n có nhiều giá trị khác nhau hoặc do ý nghĩa thực tế mà ta
chia mẫu thành nhiều lớp.
Không có quy tắc chia lớp. Tuy nhiên, theo một số nhà thống kê đề nghị chia lớp như sau:
1) Xác định số lượng lớp k {
1 + log2n 6 k 6 5lgn
6 6 k 6 20
2) Bề rộng của lớp
b =
amax − amin
k
3) Tần số ni của lớp ai−1 − ai là số lần giá trị của mẫu mà ai−1 6 x < ai
fi =
ni
n
là tần suất của lớp ai−1 − ai
32
4.2. Các phương pháp trình bày số liệu 33
4) Giá trị chính giữa(trung tâm) của lớp ai−1 − ai là: a∗i = ai−1+ai2
Ta có bảng thống kê(Bảng phân phối tần số chia lớp) như sau:
Lớp[ai, ai) a0 − a1 a1 − a2 . . . ak−1 − ak
ni n1 n2 . . . nk
Chú ý, nếu trong các bảng phân phối tần số thực nghiệm trên ta thay tần số ni bỡi tần suất tương
ứng fi ta được bảng gọi là bảng phân phối tần suất(chia lớp hoặc không chia lớp) thực nghiệm.
Hàm phân phối thực nghiệm
Định nghĩa 4.2.27 Cho X là một biến ngẫu nhiên và lấy mẫu kích thức n của X . Hàm phân phối
thực nghiệm ứng với mẫu được chọn, ký hiệu Fn(x), và được xác định như sau:
+ Nếu mẫu thực nghiệm cho theo bảng không chia lớp (4.2.2.) thì
Fn(x) =
∑
ai<x
ni
n
=

0 Nếu x 6 a1
n1
n
Nếu a1 < x 6 a1
n1+n2
n
Nếu a2 < x 6 a3
. . . . . .
Pk−1
i=1 ni
n
Nếu ak−1 < x 6 ak
1 Nếu x > ak
+ Nếu mẫu thực nghiệm cho theo bảng chia lớp (??) thì
Fn(x) =
∑
ai−1<x
ni
n
=

0 Nếu x 6 a0
n1
n
Nếu a0 < x 6 a1
n1+n2
n
Nếu a1 < x 6 a2
. . . . . .
Pk−1
i=1 ni
n
Nếu ak−2 < x 6 ak−1
1 Nếu x > ak−1
Định lý 4.2.19 Giả sửF (x) là hàm phân phối xác suất củaX vàFn(x) là hàm phân phối thực nghiệm
củaX . Khi đó, với n khá lớn Fn(x) ≈ F (x).
Ví dụ 4.2.51 Tìm hàm phân phối thực nghiệm củaX biết
a)
ai 1 3 7
ni 2 5 3
; b)
Lớp[ai, ai) 0− 4 4− 8 8− 12
ni 1 5 3
Giải
a) Ta có
F10(x) =
1
10
∑
ni<x
ni =

0 Nếu x 6 1
2
10
Nếu 1 < x 6 3
7
10
Nếu 3 < x 6 5
1 Nếu x > 5
b) Ta có
F9(x) =

0 Nếu x 6 0
1
9
Nếu 0 < x 6 4
2
3
Nếu 4 < x 6 8
1 Nếu x > 8
33
34 Chương 4. MẪU VÀ CÁC THAM SỐMẪU
4.3. CÁC THAM SỐĐẶC TRƯNG CỦAMẪU
Giả sử (X1, X2, . . . , Xn) là mẫu ngẫu nhiên của X và sau khi lấy mẫu ta có mẫu thực nghiệm
(x1, x2, . . . , xn)
4.3.1. Các tham số của mẫu ngẫu nhiên
1. Biến ngẫu nhiênX = 1
n
∑n
i=1Xi được gọi là trung bình của mẫu ngẫu nhiên
2. Biến ngẫu nhiên δ2n =
1
n
∑n
i=1(Xi −X)2 được gọi là phương sai của mẫu ngẫu nhiên
δ2n−1 =
n
n−1δ
2
n =
1
n−1
∑n
i=1(Xi−X)2 được gọi là phương sai điều chỉnh củamẫu ngẫu nhiên
δn =
√
δ2n : Độ lệch chuẩn của mẫu ngẫu nhiên.
δn−1 =
√
δ2n−1 : Độ lệch chuẩn điều chỉnh của mẫu ngẫu nhiên.
4.3.2. Các tham số của mẫu thực nghiệm
1. Số trung bình của mẫu thực nghiệm:
x =
1
n
n∑
i=1
xi
2. Số phương sai của mẫu thực nghiệm:
δ2n =
1
n
n∑
i=1
(xi − x)2
3. Số phương sai điều chỉnh mẫu thực nghiệm:
δ2n−1 =
n
n− 1δ
2
n =
1
n− 1
n∑
i=1
(xi − x)2
δn =
√
δ2n : Độ lệch chuẩn của mẫu thực nghiệm.
δn−1 =
√
δ2n−1 : Độ lệch chuẩn điều chỉnh của mẫu thực nghiệm.
Từ các công thức trên, ta suy ra công thức tính đối với mẫu thực nghiệm có bảng phân phối
không chia lớp và chia lớp như sau:
+ Nếu mẫu thực nghiệm có bảng phân phối tần số không chia lớp dạng
ai a1 a2 . . . ak
ni n1 n2 . . . nk
(
k∑
i=1
ni = n)
thì
x =
1
n
k∑
i=1
niai
δ2n =
1
n
k∑
i=1
ni(ai − x)2 = 1
n
k∑
i=1
nia
2
i − x2
34
4.3. CÁC THAM SỐ ĐẶC TRƯNG CỦAMẪU 35
+ Nếu mẫu thực nghiệm có bảng phân phối tần số chia lớp
Lớp[ai, ai) a0 − a1 a1 − a2 . . . ak−1 − ak
ni n1 n2 . . . nk
(
k∑
i=1
ni = n)
Đặt a∗i =
ai−1+ai
2
, ta có bảng
a∗i a
∗
1 a
∗
2 . . . a
∗
k
ni n1 n2 . . . nk
Khi đó
x =
1
n
k∑
i=1
nia
∗
i
δ2n =
1
n
k∑
i=1
ni(a
∗
i − x)2 =
1
n
k∑
i=1
nia
∗2
i − x2
Ví dụ 4.3.52 Tính x, δ2n của mẫu trong các trường hợp sau:
a)
ai 1 3 5
ni 3 5 2
; b)
[ai, ai) 0− 2 2− 4 4− 6 6− 8 8− 10 10− 12
ni 5 10 10 5 10 20
Giải
a) Lập bảng tính
ai ni ai.ni nia
2
i
1 3 3 3
3 5 15 45
5 2 10 50∑
n = 10 28 98
Số trung bình mẫu là x = 1
n
∑k
i=1 niai =
1
10
.28 = 2, 8
Số phương sai mẫu δ2n =
1
n
∑k
i=1 nix
2
i − x2 = 11098− (2, 8)2 = 1, 96
b) Đặt x∗i =
xi−1+xi
2
, ta có
x∗i 1 3 5 7 9 11
ni 5 10 10 5 10 20
Lập bảng tính
x∗i ni x
∗
i .ni nix
∗
i
2
1 5 5 5
3 10 30 90
5 10 50 250
7 5 35 245
9 10 90 810
11 20 220 2420∑
n = 60 430 3820
Số trung bình mẫu là x = 1
n
∑k
i=1 nix
∗
i =
1
60
.430 = 43
6
Số phương sai mẫu δ2n =
1
n
∑k
i=1 nix
∗
i
2 − x2 = 1
60
3820− (43
6
)2 = 12, 31
35
36 Chương 4. MẪU VÀ CÁC THAM SỐMẪU
Công thức tính toán Khi tính toán các tham số đặc trương của mẫu thực nghiệm để tránh việc
tính toán các số có giá trị lớn phức tạp, người ta thường sử dụng các tính chất sau
∀x0 ∈ R,∀d ̸= 0,
k∑
i=1
ni = n ta có
x =
1
n
k∑
i=1
niai =
d
n
k∑
i=1
ni
ai − x0
d
+ x0
δ2n =
1
n
k∑
i=1
ni(ai − x)2 = d
2
n
k∑
i=1
ni(
ai − x0
d
)− (x− x0)2
Thông thường ta chọn x0 là gia trị tại đó tần số lớn nhất, d là khoảng cách đều(nếu có).
Ví dụ 4.3.53 Tìm x, δ2n, δn−1 với
xi 3, 94 3, 97 4, 00 4, 03 4, 06
ni 1 7 10 5 2
GiảiTa chọn x0 = 4, 00 = 4, d = 0, 03. Ta có bảng tính:
xi ni
xi−4
0,03
ni
xi−4
0,03
ni(
xi−4
0,03
)2
3, 94 1 −2 −2 4
3, 97 7 −1 −7 7
4, 00 10 0 0 0
4, 03 5 1 5 5
4, 06 2 2 4 8∑
n = 25 0 0 24
Số trung bình mẫu là
x =
d
n
k∑
i=1
ni
ai − x0
d
+ x0 =
0, 03
25
.0 + 4 = 4
Số phương sai mẫu và phương sai điều chỉnh
δ2n =
d2
n
k∑
i=1
ni(
ai − x0
d
)− (x− x0)2 = 0, 03
2
25
.24− (4− 4)2 = 0, 000864
δn−1 =
√
n
n− 1δ
2
n =
√
25
24
.0, 000864 = 0, 03
Ví dụ 4.3.54 Tìm x, δ2n, δn−1 với
[ai−1, ai) 10500− 10550 10550− 10600 1060− 10650 10650− 10700
ni 15 55 20 10
36
4.3. CÁC THAM SỐ ĐẶC TRƯNG CỦAMẪU 37
Giải
Đặt x∗i =
xi−1+xi
2
, ta có
x∗i 10525 10575 10625 10675
ni 15 55 20 10
Ta chọn x0 = 10575, d = 50. Ta có bảng tính:
x∗i ni
x∗i−10575
50
ni.
x∗i−10575
50
ni(
x∗i−10575
50
)2
10525 15 −1 −15 15
10575 55 0 0 0
10625 20 1 20 20
10675 10 2 20 40∑
n = 100 2 25 75
Số trung bình mẫu là
x =
50
100
.25 + 10575 = 10587, 5
Số phương sai mẫu và phương sai điều chỉnh
δ2n =
502
100
.75− (10587, 5− 10575)2 = 1618, 75
δn−1 =
√
n
n− 1δ
2
n =
√
100
99
.1618, 75 ≈ 40, 44
37
38 Chương 4. MẪU VÀ CÁC THAM SỐMẪU
38
Chương 5
ƯỚC LƯỢNG THAM SỐ
5.1. PHƯƠNGPHÁPƯỚCLƯỢNGĐIỂM -HÀMƯỚCLƯỢNG
5.1.1. Phương pháp ước lượng điểm
Giả sửX là biến ngẫu nhiên biểu thị đặc trưng nghiên cứu trên tập Ω, có phân phối xác suất đã
biết nhưng còn phụ thuộc vào tham số θ chưa biết.
Để ước lượng θ, ta lấy mẫu kích thước n. Khi đó, ta có mẫu ngẫu nhiên (X1, X2, . . . , Xn). Sau
khi lấy mẫu, ta được mẫu thực nghiệm (x1, x2, . . . , xn) vớiXi = xi(i = 1, n).
Ứng vớimỗimẫu thực nghiệm (x1, x2, . . . , xn) ta cómột số θˆn(x1, x2, . . . , xn)dùng để ước lượng
cho θ. Phương pháp ước lượng đó gọi là phương pháp ước lượng điểm. Vì số θˆn(x1, x2, . . . , xn) ứng
với một điểm trên đường thẳng số.
Ta gọiU là tập hợp các mẫu thực nghiệm (x1, x2, . . . , xn) hay nói cách khác U là miền giá trị của
mẫu ngẫu nhiên (X1, X2, . . . , Xn). Khi đó ta có một hàm
θˆn : U →R, (x1, x2, . . . , xn) 7→ θˆn(x1, x2, . . . , xn)
Biến ngẫu nhiên θˆn(x1, x2, . . . , xn) gọi là hàm ước lượng của tham số θ.
Vấn đề là phải tìm hàm θˆn(x1, x2, . . . , xn) sao cho ước lượng được tốt, tức là ước lượng không
mắc sai số hệ thống và hiệu quả.
5.1.2. Các tiêu chuẩn ước lượng tham số đặc trưng củaX
Ước lượng không chệch
Định nghĩa 5.1.28 Hàm ước lượng θˆn(x1, x2, . . . , xn) của tham số θ được gọi là ước lượng không
chệch của tham số θ nếu E(θˆn(x1, x2, . . . , xn)) = θ.
Ngược lại nếuE(θˆn(x1, x2, . . . , xn)) ̸= θ thì ta nói hàm ước lượngθˆn(x1, x2, . . . , xn) là hàm ước
lượng chệch của θ.
Ước lượng bền vững
Định nghĩa 5.1.29 Hàmước lượng θˆn(x1, x2, . . . , xn) của tham số θ được gọi là ước lượng bền vững
của tham số θ nếu
∀ϵ > 0 ta có lim
n→+∞
P (| θˆn − θ |< ϵ) = 1
Định lý 5.1.20 Nếu hàm ước lượng θˆn(x1, x2, . . . , xn) thỏa mãn
39
40 Chương 5. ƯỚC LƯỢNG THAM SỐ
i) E(θˆn(x1, x2, . . . , xn)) = θ hay limn→∞E(θˆn(x1, x2, . . . , xn)) = θ
ii) limn→∞D(θˆn(x1, x2, . . . , xn)) = 0 thì θˆn(x1, x2, . . . , xn) là ước lượng bền vững của θ.
Ước lượng hiệu quả
Định nghĩa 5.1.30 Ước lượng không chệch θˆn(x1, x2, . . . , xn) của θ được gọi là ước lượng hiệu
quả nếu với mọi ước lượng không chệch θˆ
′
n(x1, x2, . . . , xn) của θ thì D(θˆn(x1, x2, . . . , xn)) 6
D(θˆ
′
n(x1, x2, . . . , xn)).
Định nghĩa 5.1.31 Hàm ước lượng θˆn(x1, x2, . . . , xn) của tham số θ được gọi là ước lượng tốt của
tham số θ nếu nó là ước lượng không chệch, bền vững và hiệu quả của θ
∀ϵ > 0 ta có lim
n→+∞
P (| θˆn − θ |< ϵ) = 1
5.1.3. Ước lượng của kỳ vọng và phương sai của biến ngẫu nhiênX
Định lý 5.1.21 ChoX là một biến ngẫu nhiên và (x1, x2, . . . , xn) là mẫu ngẫu nhiên củaX . Khi đó
a) X = 1
n
∑n
i=1Xi là ước lượng không chệch, bền vững và hiệu quả của kỳ vọng E(X) của biến
ngẫu nhiênX .
b) Phương sai điều chỉnh δ2n−1 =
1
n−1
∑n
i=1(Xi − X)2 của mẫu ngẫu nhiên là ước lượng không
chệch, bền vững của phương saiD(X) đối với biến ngẫu nhiênX .
Ý nghĩa: - Muốn ước lượng kỳ vọng E(X) ta lấy trung bình mẫu ước lượng cho nó.
- Muốn ước lượng phương saiD(X) ta lấy phương sai mẫu điều chỉnh ước lượng cho nó.
40
5.2. ƯỚC LƯỢNG KHOẢNG 41
5.2. ƯỚC LƯỢNG KHOẢNG
5.2.1. Nguyên lý xác suất nhỏ và lớn
Nguyên lý xác suất nhỏ
Với một số α > 0 khá bé và P (A) = α(thông thường 0 < α 6 0, 05) thì trong thực tế ta thừa
nhận sự kiện A không xảy ra trong một lần thực hiện phép thử.
Nguyên lý xác suất lớn
Với một số α > 0 khá bé và P (B) = 1 − α(thông thường 0 < α 6 0, 05) thì trong thực tế ta
thừa nhận sự kiện B luôn xảy ra trong một lần thực hiện phép thử.
5.2.2. Khoảng tin cậy và độ tin cậy
Định nghĩa
Giả sửX là biến ngẫu nhiên biểu thị đặc trưng nghiên cứu trên tập Ω, có phân phối xác suất đã
biết nhưng còn phụ thuộc vào tham số θ chưa biết. Để ước lượng θ ta lấy mẫu kích thức n. Giả sử
(x1, x2, . . . , xn) là mẫu thực nghiệm ứng với mẫu ngẫu nhiên (X1, X2, . . . , Xn) củaX . Nếu ta tìm
được hai biến ngẫu nhiên f1(X1, X2, . . . , Xn), f2(X1, X2, . . . , Xn) sao cho
P [f1(X1, X2, . . . , Xn) < θ < f2(X1, X2, . . . , Xn)] = γ
,trong đó γ = 1 − α cho trước và gần bằng 1(thông thường 0 < α 6 0, 05), thì khoảng số thực
(f1(X1, X2, . . . , Xn), f2(X1, X2, . . . , Xn)) hay f1(X1, X2, . . . , Xn) < θ < f2(X1, X2, . . . , Xn) gọi
là khoảng tin cậy của tham số θ với độ tin cậy γ.
Trong trường hợp khoảng tin cậy đối xứng có dạng
(g(X1, X2, . . . , Xn)− ϵ, g(X1, X2, . . . , Xn) + ϵ)
Khi đó ϵ được gọi là độ chính xác hay sai số ước lượng.
Cần chú ý rằng, cùng một độ tin cậy γ ta có thể tìm được nhiều khoảng tin cậy khác nhau của
tham số θ. Khoảng tin cậy nào có độ dài ngắn nhất thì xem khoảng tin cậy đó là tốt nhất. Trong thực
hành, ta chỉ tìm khoảng tin cậy tốt nhất.
Nhận xét
Từ định nghĩa trên, nếu ta chọn α = 1%⇒ γ = 99% và
P [f1(X1, X2, . . . , Xn) < θ < f2(X1, X2, . . . , Xn)] = γ
Điều này nói lên rằng xác suất để lấy ra một mẫu thực nghiệm (x1, x2, . . . , xn) mà
f1(x1, x2, . . . , xn) < θ < f2(x1, x2, . . . , xn) là 99%
Như vậy nếu ta lấy ra một mẫu thực nghiệm (x1, x2, . . . , xn). Ta có khoảng tin cậy cụ thể
f1(x1, x2, . . . , xn) < θ < f2(x1, x2, . . . , xn)
và theo nguyên lý xác suất lớn, ta luôn thừa nhận tham số θ thỏa mãn
f1(x1, x2, . . . , xn) < θ < f2(x1, x2, . . . , xn)
41
42 Chương 5. ƯỚC LƯỢNG THAM SỐ
5.2.3. Khoảng tin cậy cho kỳ vọng E(X) = µ vớiX v N(µ, δ)
X là đại lượng ngẫu nhiên biểu thị đặc trưng nghiên cứu trên tập Ω cơ phân phối chuẩn với kỳ
vọng E(X) = µ chưa biết. Để ước lượng µ, ta lấy mẫu ngẫu nhiên kích thước n. Ta có mẫu ngẫu
nhiên (X1, X2, . . . , Xn) và mẫu thực nghiệm tương ứng (x1, x2, . . . , xn). Ta tính số trung bình mẫu
x. Tùy theo độ lệch chuẩn δ đã biết hay chưa mà tính độ lệch chuẩn mẫu điều chỉnh δ2n−1. Với độ tin
cậy γ = 1− α, ta có
Khoảng tin cậy đối xứng E(X) = µ là (x− ϵ, x+ ϵ) hay x− ϵ < µ < x+ ϵ.
Để ước lượng E(X) = µ ta lấy số trung bình mẫu x ước lượng cho nó. Khi đó
P (x− ϵ < µ < x+ ϵ) = γ ⇔ P (| X − µ |< ϵ) = γ
Trường hợp độ lệch chuẩn δ đã biết Khi đó ϵ =
δ√
n
Φ−1
(γ
2
)
Trường hợp độ lệch chuẩn δ chưa biết Tính số δ2n−1. Ta có
P (| X − µ |< ϵ) = 1− α⇔ P
(
| X − µ
δn−1
√
n |< ϵ
√
n
δn−1
)
= γ
⇔ ϵ = δn−1√
n
.t(n− 1; 1− γ)
Vì
X − µ
δn−1
√
n có phân phối Student với n− 1 bậc tự do.
Chú ý rằng, khi n > 30:
X − µ
δn−1
√
n có phân phối xấp xỉ phân phối chuẩn N(0, 1) nên t(n −
1; 1− γ) ≈ Φ−1
(γ
2
)
.
Ví dụ 5.2.55 Để ước lượng độ cứng trung bình của một loại bi bằng thép, người ta lấy ra 25 bi để
kiểm tra. Tính được độ cứng trung bình x = 10, với độ tin cậy 99%. Hãy tìm khoảng tin cậy đối
xứng của độ cứng trung bình của viên bi thép đó. Biết rằng độ cứng của viên bi có phân phối chuẩn
N(µ, δ2) trong hai trường hợp:
a) Độ lệch chuẩn δ = 1
b) Độ lệch chuẩn chưa biết và từ mẫu thực nghiệm tính được δn−1 = 1, 2
Giải
GọiX là độ cứng của viên bi bằng thép thì X là đại lượng ngẫu nhiên có phân phối chuẩn. Khi
đó kỳ vọng E(X) = µ là độ cứng trung bình của một viên bi.
a) Ta có n = 25, x = 10, δ = 1, độ tin cậy γ = 99%
Tra bảng phân vị chuẩn, ta có Φ−1
(γ
2
)
= 2, 567.
Từ đó, ta có ϵ =
δ√
n
Φ−1
(γ
2
)
=
1√
25
2, 567 ≈ 0, 515
Vậy khoảng tin cậy đối xứng của độ cứng trung bình µ là
(x− ϵ, x+ ϵ) = (9, 485; 10, 515) hay 9, 485 < µ < 10, 515
b) Ta có n = 25, x = 10, δn−1 = 1, 2, độ tin cậy γ = 99%
42
5.2. ƯỚC LƯỢNG KHOẢNG 43
Tra bảng phân vị Student vớin−1 = 24 bậc tự do, mức phân vị 1−γ = 0, 05, ta có t(24; 0, 05) =
2, 797 nên
ϵ =
δn−1√
n
t(n− 1; 1− γ) = 1, 2
5
2, 797 ≈ 0, 67
Vậy khoảng tin cậy đối xứng của độ cứng trung bình µ là
(x− ϵ, x+ ϵ) = (9, 33; 10, 67) hay 9, 33 < µ < 10, 67
Ví dụ 5.2.56 Để ước lượng hao phí xăng của một loại ôtô chạy trên đoạn đường AB, người ta theo
dõi 100 chuyến xe và tính được x = 10 lít, δn−1 = 0, 5 lít, với độ tin cậy 95%. Giả sử xằng biến ngẫu
nhiên X chỉ lượng xăng hao phí của một loại ôtô trên trên đoạn AB có phân phối chuẩn. Hãy ước
lượng khoảng tin cậy đối xứng của của mức hao phí xăng trung bình µ?
Giải
a) Ta có n = 100, x = 10, độ tin cậy γ = 95%. Tra bảng phân vị chuẩn, ta có Φ−1
(
γ
2
)
=
Φ−1
(
95%
2
)
= 1, 96.
Từ đó, ta có ϵ =
δ√
n
Φ−1
(γ
2
)
=
0, 05√
100
1, 96 ≈ 0, 1
Vậy khoảng tin cậy đối xứng của độ cứng trung bình µ là
(x− ϵ, x+ ϵ) = (9, 9; 10, 1) hay 9, 9 < µ < 10, 1
5.2.4. Ước lượng tỉ lệ phần trăm hay xác suất
Giả sử A là một sự kiện liên kết với một phép thử. Muốn biết xác suất xảy ra biến cố A hay
p = P (A), ta lặp lại phép thử n lần(lấy mẫu có lặp kích thước n).
GọiXi là số lần xảy ra sự kiện A ở phép thử thứ i(i = 1, n) thìX1, X2, . . . , Xn là các đại lượng
ngẫu nhiên độc lập có cùng phân phối
Xi 0 1
P 1− p p (i = 1, n)
Khi đóX = 1
n
∑n
i=1Xi = Fn(A)
Ta có E(X) = p
Bài toán ước lượng xác suất chính là bài toán ước lượng kỳ vọng E(X) = p.
Khi n khá lớn:X = 1
n
∑n
i=1Xi = Fn(A) có phân phối xấp xỉ phân phối chuẩnN(p, p(1− p)).
Ước lượng tỉ lệ
Giả sử tổng thể Ω có N phần tử, trong đó có M phần tử mang đặc tính A. Do không điều tra
toàn bộ nên ta không biết tỉ lệ p = M
N
. Phép thử lấy ra một phần tử. Gọi C là sự kiện phần tử lấy ra
mang đạc tính A. Khi đó P (C) = M
N
= p.
Suy ra bài toán ước lượng tỉ lệ chính là bài toán ước lượng xác suất.
Để ước lượng tỉ lệ p, ta lấy mẫu kích thước n, ta tính được tỉ lệ fn và với độ tin cậy γ = 1− α, ta
có:
Khoảng tin cậy cho tỉ lệ p là (fn − ϵ, fn + ϵ) ϵ được xác định như sau:
Với n > 50 : nfn > 5 và n(1− fn) > 5. Ta có
ϵ =
√
fn(1− fn)√
n
.Φ−1
(γ
2
)
43
44 Chương 5. ƯỚC LƯỢNG THAM SỐ
Ví dụ 5.2.57 Để ước lượng tỉ lệ gạch loại 2 của một nhà máy, người ta lấy ra 10000 viên và thấy có
300 viên gạch loại 2. Với độ tin cậy 99%
a) Hãy ước lượng tỉ lệ gạch loại 2?
b) Cần lấy thêm ít nhất bao nhiêu gạch nữa để tỉ lệ gạch loại 2 toàn bộ so với tỉ lệ mẫu có sai số
không vượt quá 0, 001. Giả thiết lấy tỉ lệ mẫu fn thay cho tỉ lệ mẫu của mẫu cần thêm.
Giải
Gọi p là tỉ lệ gạch loại 2 của nhà máy.
Ta có n = 10000, tỉ lệ mẫu fn = 30010000 = 0, 03
Độ tin cậy γ = 1− α = 99%
a)
ϵ =
√
fn(1− fn)√
n
.Φ−1
(γ
2
)
=
√
0, 03.0, 07√
10000
.2, 576 ≈ 0, 0044
Vậy khoảng ước lượng đối xứng của tỉ lệ là
fn − ϵ < p < fn + ϵ⇔ 0, 03− 0, 0044 < p < 0, 03 + 0, 0044
hay 0, 0256 < p < 0, 0344
b) GọiN là số gạch cần lấy thêm n = N + 10000
Tỉ lệ mẫu fn = 0, 03 và độ tin cậy γ = 0, 99, ta có Φ−1
(
γ
2
)
= 2, 576
Theo giả thiết ϵ 6 0, 001⇒
ϵ =
√
fn(1− fn)√
n
Φ−1
(γ
2
)
=
√
0, 03.0, 07√
n
.2, 576 6 0, 001⇒ n > 193101, 18
suy ra nmin = 193102. Số gạch cần lấy thêm ít nhất là N = 193102− 10000 = 193102
Ví dụ 5.2.58 Để ước lượng cá trong hồ, người ta bắt 1000 con làm dấu rồi thả lại. Sau đó lại bắt 900
con thấy có 90 con làm dấu. Hãy ước lượng số lượng cá trong hồ với độ tin cậy 95%
Giải
GọiN là số cá trong hồ.
Gọi p là tỉ lệ cá làm dấu trong hồ, ta có p = 1000
N
Ta ước lượng p. Ta có n = 900, tỉ lệ mẫu fn = 90900 = 0, 1
Độ tin cậy γ = 1− α = 95%
Tra bảng phân vị chuẩn, ta có Φ−1
(
γ
2
)
= 1, 96
ϵ =
√
fn(1− fn)√
n
Φ−1
(γ
2
)
=
√
0, 1.0, 9√
900
.1, 96 ≈ 0, 0196
Suy ra fn − ϵ < p < fn + ϵ⇒ 0, 0804 < 1000N < 0, 1196
Vậy số cá trong hồ là 8362 6 N 6 12437
5.2.5. Ước lượng phương saiD(X) vớiX v N(µ, δ)
Giả sửX là biến ngẫu nhiên biểu thị đặc trưng nghiên cứu trên tậpΩ có phân phối chuẩnD(X) =
δ2 chưa biết. Để ước lượngD(X) ta lấymẫu kích thước n, ta đượcmẫu ngẫu nhiên (X1, X2, . . . , Xn)
và mẫu thực nghiệm (x1, x2, . . . , xn).
Ta cóXi v N(µ, δ2)⇒ Xi−µδ v N(0, 1). Do đó:∑n
i=1 (
Xi−µ
δ
)2 =
ns20
δ2
có phân phối khi bình phương với (n− 1) bậc tự do.
44
5.2. ƯỚC LƯỢNG KHOẢNG 45
Trong đó
δ2n =
1
n
n∑
i=1
(xi − x)2; x = 1
n
n∑
i=1
xi
Ta xét các trường hợp sau:
Với kỳ vọng E(X) = µ đã biết
Tính sn = 1n
∑n
i=1(xi − µ)2
Tra bảng phân vị khi bình phương với n bậc tự do ứng với các mức phân vị α
2
, 1 − α
2
ta có
χ2α
2
(n), χ21−α
2
(n)
Khi đó, khoảng tin cậy của phương sai
ns2n
χ21−α
2
(n)
< δ2 <
ns2n
χ2α
2
(n)
Với kỳ vọng E(X) = µ chưa biết
Tính
x =
1
n
n∑
i=1
xi; δ
2
n =
1
n
n∑
i=1
(xi − x)2
Tra bảng phân vị khi bình phương với (n− 1) bậc tự do ứng với các mức phân vị α
2
, 1− α
2
ta có
χ2α
2
(n− 1), χ21−α
2
(n− 1)
Khi đó, khoảng tin cậy của phương saiD(X) = δ2
nδ2n
χ21−α
2
(n− 1) < δ
2 <
nδ2n
χ2α
2
(n− 1)
Chú ý: Khi n > 30 ta có
χ2α
2
(n) ≈ 1
2
(
√
2n− 1− U1−α
2
)2
χ21−α
2
(n) ≈ 1
2
(
√
2n− 1 + U1−α
2
)2
với U1+α
2
là phân vị chuẩn mức 1−α
2
củaN(0, 1).
Ví dụ 5.2.59 Tuổi thọ X của một van điện có phân phối chuẩn. Ta lấy ra 10 van điện tính được
phương sai mẫu δ21 = 0, 8. Với độ tin cậy 95% hãy ước lượng phương saiD(X)?
GiảiTa có n = 10 và kỳ vọng chưa biết. Độ tin cậy γ = 1− α = 95%⇒ α = 0, 05
Tra bảng phân vị khi bình phương với n − 1 = 10 − 1 = 9 bậc tự do ứng với các mức phân vị
α
2
= 0, 025, 1− α
2
= 0, 975 ta có χ20,025(9) = 2, 7, χ
2
0,975(9) = 19
nδ2n
χ2α
2
(n−1) =
10.0,8
2,7
= 2, 96
nδ2n
χ2
1−α2
(n−1) =
10.0,8
19
= 0, 42
Vậy khoảng tin cậy của phương saiD(X) = δ2
0, 42 < δ2 < 2, 96
45
PHỤ LỤC
1. Hàm Laplace: Φ(x) = 1√
2π
∫ x
0
e−
t2
2 dt (x > 0)
Chú ý: Với x < 0 thì Φ(x) = −Φ(−x)
4. Bảng phân vị Student: P (X < tn,α) = α
Bµi tËp
C©u 1. Tung 3 con xóc x¾c. TÝnh x¸c suÊt ®Ó
1. cã duy nhÊt mét mÆt chia hÕt cho 3.
2. Tæng sè chÊm 3 mÆt b»ng 15.
3. Cã Ýt nhÊt mét mÆt mét chÊm xuÊt hiÖn.
C©u 2. Cã 3 ngêi lªn 6 toa tµu trong ®ã cã hai ngêi tªn A vµ B. TÝnh x¸c suÊt ®Ó
1. mçi ngêi ngåi mét toa kh¸c nhau?
2. Hai ngêi A, B ngåi cïng mét toa?
3. cã ®óng mét ngêi ngåi ë toa thø 2?
C©u 3. Mét hép cã 5 bi ®á, 4 bi xanh vµ 6 bi tr¾ng. LÊy ngÉu nhiªn lÇn lît ra 2 bi. TÝnh
x¸c suÊt c¸c sù kiÖn sau trong hai trêng hîp cã hoµn l¹i vµ kh«ng hoµn l¹i.
1. C¶ hai bi lÊy ra ®Òu mµu ®á.
2. Hai bi lÊy ra cïng mµu.
3. Hai bi lÊy ra kh¸c mµu.
C©u 4. Mét hép cã m bi ®á vµ 5 bi xanh. LÇn 1 lÊy ngÉu nhiªn 2 bi (kh«ng hoµn l¹i). Sau
®ã, lÇn 2 lÊy ngÉu nhiªn 3 bi. TÝnh x¸c suÊt
a) LÇn 1 lÊy ®îc hai bi cïng mµu ?
b) C¶ hai lÇn ®Òu lÊy ®îc toµn bi xanh ?
c) LÇn 2 lÊy ®îc hai bi xanh ?
d) Gi¶ sö lÇn 2 lÊy ®îc 2 bi xanh. TÝnh x¸c suÊt ®Ó lÇn 1 lÊy ®îc hai bi xanh ?
C©u 5. Chon ngÉu nhiªn hai ®iÓm x, y ∈ (0, 1). TÝnh x¸c suÊt ®Ó chän ®îc hai ®iÓm cã
tæng x + y 6 1 vµ xy 6
2
9
.
C©u 6. Trªn ®o¹n th¼ng OM cã ®é dµi m > 0, ta lÊy ngÉu nhiªn hai ®iÓm B vµ C víi
OB = x, OC = y. TÝnh x¸c suÊt ®Ó lÊy ®îc hai ®iÓm B,C sao cho BC <
m
2
?
C©u 7. Trong 20 s¶n phÈm cã 5 phÕ phÈm. Ta bá vµo 3 c¸i hép mçi hép 5 s¶n phÈm. TÝnh
x¸c suÊt ®Ó
1. ë hép 1 chØ cã mét phÕ phÈm?
2. C¸c hép ®Òu cã phÕ phÈm?
3. C¸c phÕ phÈm ®Òu ë hép 1.
C©u 8. §Ò c¬ng «n thi cã 12 c©u lý thuyÕt vµ 30 c©u bµi tËp. Mét ®Ò thi gåm 2 c©u lý
thuyÕt vµ 4 c©u bµi tËp. Mét häc sinh chØ häc 6 c©u lý thuyÕt vµ 10 c©u bµi tËp. TÝnh x¸c
suÊt ®Ó häc sinh ®ã
1. kh«ng lµm ®îc 2 c©u lý thuyÕt?
2. chØ lµm ®îc mét c©u lý thuyÕt vµ 2 c©u bµi tËp hoÆc lµm ®îc 2 c©u lý thuyÕt vµ mét
bµi tËp?
3. Häc sinh kh«ng ph¶i thi l¹i? BiÕt häc sinh kh«ng thi l¹i nÕu lµm ®îc Ýt nhÊt mét c©u
lý thuyÕt vµ 2 c©u bµi tËp hoÆc lµm ®îc 2 c©u lý thuyÕt vµ mét bµi tËp.
C©u 9. Trong thµnh phè A, tØ lÖ ngêi tèt nghiÖp ®¹i häc lµ 0.3 vµ tØ lÖ ngêi tèt nghiÖp phæ
th«ng lµ 0.35. Trong sè ngêi ®· tèt nghiÖp ®¹i häc cã 60% ngêi cã xe m¸y; trong sè ngêi
tèt nghiÖp phæ th«ng cã 40% ngêi cã xe m¸y; trong sè ngêi cha tèt nghiÖp phæ th«ng cã
10% ngêi cã xe m¸y. Chän ngÉu nhiªn mét ngêi d©n thµnh phè A. TÝnh x¸c suÊt ®Ó
1. ngêi chän ra cã xe m¸y?
2. BiÕt ngêi chän ra cã xe m¸y. Hái kh¶ n¨ng ngêi nµy thuéc nhãm ngêi nµo nhiÒu
nhÊt?
C©u 10. Cã hai thïng hµng, thïng I chøa 4 chÝnh phÈm vµ 5 phÕ phÈm; thïng II chøa 6
chÝnh phÈm vµ 1 phÕ phÈm. LÊy ngÉu nhiªn 3 s¶n phÈm ë thïng I råi bá vµo thïng 2. Sau
®ã lÊy ngÉu nhiªn 2 s¶n phÈm tõ thïng II. TÝnh x¸c suÊt ®Ó hai s¶n phÈm lÊy ra cuèi cïng
1. ®Òu tèt?
2. §Òu tèt vµ ®Òu lµ cña thïng I?
C©u 11. B¾n 3 viªn ®¹n ®éc lËp nhau vµo mét môc tiªu. X¸c suÊt tróng môc tiªu cña tõng
viªn ®¹n lÇn lît lµ 0.7, 0.8 vµ 0.9. BiÕt r»ng nÕu chØ 1 viªn ®¹n tróng hoÆc 2 viªn tróng
th× môc tiªu bÞ ph¸ hñy víi x¸c suÊt t¬ng tøng lµ 0.4 vµ 0.6; cßn nÕu tróng c¶ 3 viªn th×
môc tiªu bÞ ph¸ hñy. TÝnh x¸c suÊt ®Ó môc tiªu bÞ ph¸ hñy?
C©u 12. Mét ngêi trong tói cã hai bao diªm, mçi bao cã 30 que. Mçi lÇn hót thuèc ngêi
®ã lÊy ngÉu nhiªn mét bao vµ dïng mÊt mét que ë bao ®ã. TÝnh x¸c suÊt ®Ó
1. Mçi bao cßn l¹i ®óng 10 que?
2. Mét bao hÕt diªm cßn bao kia cßn l¹i 10 que?
C©u 13. X¸c suÊt b¾n tróng môc tiªu cña mét x¹ thñ lµ kh«ng ®æi vµ b»ng 0.6. X¹ thñ b¾n
3 viªn vµo môc tiªu. Gäi X lµ sè viªn ®¹n b¾n tróng.
1. LËp b¶ng ph©n phèi x¸c suÊt vµ hµm ph©n phèi x¸c suÊt cña X?
2. TÝnh c¸c tham sè ®Æc trng cña X?
3. TÝnh x¸c suÊt ®Ó x¹ thñ ph¸ hñy ®îc môc tiªu. BiÕt r»ng môc tiªu bÞ ph¸ hñy nÕu
b¾n tróng Ýt nhÊt 2 viªn.
C©u 14. Cã hai hép, hép I cã 4 bi ®á, 6 bi xanh; hép II cã 3 bi ®á 5 bi xanh. LÊy ngÉu nhiªn
2 bi ë hép I råi bá vµo hép II. Sau ®ã tõ hép II lÊy ngÉu nhiªn 2 bi. GäiX,Y lÇn lît lµ sè
bi ®á lÊy ra ë hép I vµ hép II.
1. LËp b¶ng ph©n phèi x¸c suÊt cña X vµ Y ?
2. LËp b¶ng ph©n phèi x¸c suÊt cña X ± Y,X.Y ?
C©u 15. Cho biÕn ngÉu nhiªn X cã hµm ph©n phèi x¸c suÊt
F (x) =


0, x 6 0
a. sin 2x, x ∈ (0, pi
4
)
0, x > pi
4
1. X¸c ®inh a vµ hµm mËt ®é x¸c suÊt f(x)?
2. TÝnh c¸c tham sè ®Æc trng cña X?
3. TÝnh x¸c suÊt ®Ó trong ba lÇn thùc hiÖn phÐp thö vÒX cã 2 lÇn X nhËn gi¸ trÞ trong
kho¶ng (0,pi
8
)?
C©u 16. Cho biÕn ngÉu nhiªn X cã hµm mËt ®é x¸c suÊt
f(x) =


ax2, x ∈ (0, 2]
0, x /∈ (0, 2]
a) X¸c ®Þnh a vµ hµm ph©n phèi F (x) ?
b) TÝnh E(X),D(X) ?
c) TÝnh P (1 < X < 9) ?
C©u 17. §é dµi X cña chi tiÕt m¸y lµ N(5cm, 0.81cm). TÜnh x¸c suÊt ®Ó lÊy ®îc mét
chi tiÕt m¸y cã chiÒu dµi trong kho¶ng (4cm, 7cm)?
C©u 18. ChiÒu cao Y cña nam giíi trëng thµnh lµ N(160cm, δcm). BiÕt r»ng P (|X −
160| < 2) = 0.2569, t×m δ vµ tÝnh x¸c suÊt ®Ó lÊy ngÉu nhiªn 4 nam th× cã Ýt nhÊt mét
ngêi cã chiÒu cao trong kho¶ng 158 cm ®Õn 162 cm?
File đính kèm:
giao_trinh_xac_suat_thong_ke_phan_2.pdf