Bài giảng môn Lý thuyết xác suất và thống kê toán - Chương 6: Mẫu ngẫu nhiên

Khi nghiên cứu các vấn đề kinh tế

- xã hội, cũng như nhiều vấn đề

thuộc các lĩnh vực khác, người ta

thường phải khảo sát một hay một

số dấu hiệu nào đó. Những thông

tin về các dấu hiệu này được thu

thập trên nhiều phần tử khác

nhau.Tập hợp tất cả các phần tử mà

từ các phần tử từ đó ta có thể

khảo sát, thu thập những thông

tin về các dấu hiệu ta cần nghiên

cứu được gọi là tổng thể.

(Population)Các thí dụ:

 Nghiên cứu về năng suất lúa ở

vùng đồng bằng sông Cửu Long,

tổng thể là số héc ta trồng lúa ở

vùng này.

pdf 78 trang kimcuc 14500
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng môn Lý thuyết xác suất và thống kê toán - Chương 6: Mẫu ngẫu nhiên", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng môn Lý thuyết xác suất và thống kê toán - Chương 6: Mẫu ngẫu nhiên

Bài giảng môn Lý thuyết xác suất và thống kê toán - Chương 6: Mẫu ngẫu nhiên
Phần 2
1- Khái niệm:
I- TỔNG THỂ:
MẪU NGẪU NHIÊN
Khi nghiên cứu các vấn đề kinh tế
- xã hội, cũng như nhiều vấn đề
thuộc các lĩnh vực khác, người ta
thường phải khảo sát một hay một
số dấu hiệu nào đó. Những thông
tin về các dấu hiệu này được thu
thập trên nhiều phần tử khác
nhau.
Tập hợp tất cả các phần tử mà
từ các phần tử từ đó ta có thể
khảo sát, thu thập những thông
tin về các dấu hiệu ta cần nghiên
cứu được gọi là tổng thể.
(Population)
Các thí dụ:
 Nghiên cứu về năng suất lúa ở
vùng đồng bằng sông Cửu Long,
tổng thể là số héc ta trồng lúa ở
vùng này.
 Khảo sát thu nhập của những
người làm việc ở một công ty, tổng
thể là những người làm việc ở
công ty này.
 Khảo sát doanh số bán của một
siêu thị trong một năm (365 ngày),
tổng thể là 365 ngày trong năm.
Đối với tổng thể, ta sử dụng một
số khái niệm và ký hiệu sau đây:
 N: Số phần tử của tổng thể và
được gọi là kích thước của tổng
thể.
 X*: Dấu hiệu ta cần khảo sát,
nghiên cứu (trong kinh tế thường
gọi là chỉ tiêu).
Khi nói nghiên cứu một tổng thể có
nghĩa là nghiên cứu dấu hiệu X*
mà những thông tin về X* được
khảo sát, thu thập trên các phần tử
của tổng thể.
 xi (i = 1, 2, ..., k) là các giá trị
của dấu hiệu X* đo được trên các
phần tử của tổng thể.
xi là những thông tin cần thiết để
ta nghiên cứu về dấu hiệu X*, còn
các phần tử của tổng thể là những
đối tượng mang thông tin.
 Ni (i = 1, 2, . . . , k): Tần số của
xi - là số phần tử nhận giá trị xi.

k
1i
iN
 pi (i = 1, 2, . . . , k): Tần suất
của xi
N
Ni
= N
pi =
Bảng cơ cấu của tổng thể theo dấu
hiệu X* thể hiện sự tương ứng
giữa xi, Ni, pi.
Giaù trò cuûa X* x1 x2 . . . xk
Taàn soá (Ni) N1 N2 . . . Nk
Taàn suaát (pi) p1 p2 . . . pk
* Chú ý: Có thể lập bảng cơ cấu
của tổng thể dưới dạng cột.
2- Các số đặc trưng của tổng
thể:
1- Trung bình của tổng thể
Trung bình của tổng thể (ký hiệu
là ), được xác định theo công
thức:
 =
k
1i
ii p.x
2- Phương sai của tổng thể
Phương sai của tổng thể (ký hiệu
là 2) được xác định theo công
thức:
2 = 
 
k
1i
i
2
i px
3- Độ lệch chuẩn của tổng thể
Độ lệch chuẩn của tổng thể (ký
hiệu là ) được xác định theo công
thức:
 = 2
Giả sử tổng thể gồm N phần tử,
trong đó có M phần tử có tính chất
A .
Gọi p = là tỷ lệ các phần tử có
tính chất A của tổng thể (gọi tắt là
tỷ lệ tổng thể).
N
M
4- Tỷ lệ tổng thể
Thí dụ: Ngành cao su có 500.000
công nhân. Để nghiên cứu mức
sống của họ, người ta khảo sát chỉ
tiêu X*:”Thu nhập thực tế của công
nhân ngành cao su” và giả sử thu
được các số liệu cho ở bảng sau:
Để lập bảng cơ cấu của tổng thể từ
đó ta tính được trung bình,
phương sai của tổng thể . . . thì ta
cần khảo sát toàn bộ N phần tử
của tổng thể. Cách làm này trong
thực tế sẽ gặp phải những khó
khăn sau đây:
II- KHÁI NIỆM MẪU:
 Phải chịu chi phí lớn về tiền
của, thời gian, nhân lực, phương
tiện, . . .
 Có nhiều trường hợp khi điều tra
sẽ phá hủy đi các phần tử được
điều tra. Do vậy về phương diện
kinh tế thì không thể điều tra toàn
bộ được.
 Có những trường hợp ta không
thể xác định được toàn bộ N phần
tử của tổng thể. Trường hợp này
thường xảy ra trong việc điều tra
các vấn đề thuộc về lĩnh vực xã hội
học.
Vì vậy, từ thế kỷ 17, phương pháp
nghiên cứu mẫu đã ra đời, ngày
càng phát triển và được sử dụng
rộng rãi trong nhiều lĩnh vực.
Tư tưởng cơ bản của phương
pháp mẫu như sau:
Từ tổng thể ta lấy ra n phần tử và
đo lường giá trị của dấu hiệu X*
trên chúng, n phần tử này lập nên
một mẫu. Số phần tử của mẫu (n)
được gọi là kích thước mẫu.
Thông thường kích thước của
mẫu nhỏ hơn nhiều so với kích
thước của tổng thể.
Vì vậy ta có khả năng thực tế để
thu thập, xử lý và khai thác thông
tin mẫu một cách nhanh chóng,
toàn diện hơn.
Sử dụng các phương pháp toán học
người ta tiến hành suy rộng kết
quả nghiên cứu trên mẫu cho toàn
bộ tổng thể, đó là mục đích cuối
cùng của phương pháp mẫu.
Để đạt được mục đích trên thì
mẫu phải đại diện cho tổng thể.
Muốn vậy, khi lấy mẫu phải đảm
bảo tính ngẫu nhiên, không chọn
mẫu theo một tiêu chuẩn chủ
quan đã định trước.
 Lấy mẫu ngẫu nhiên:
 Chọn mẫu cơ giới
 Chọn mẫu bằng cách phân lớp
 Lấy mẫu có hoàn lại (có lặp)
 Laáy maãu khoâng hoaøn
laïi
(khoâng laëp)
Trong thực tế có nhiều cách lấy
mẫu:
Có thể mô hình hoá dấu hiệu X*
bằng một đại lượng ngẫu nhiên.
III- MÔ HÌNH XÁC SUẤT CỦA 
TỔNG THỂ VÀ MẪU
1- Đại lượng ngẫu nhiên gốc 
vàø phân phối gốc 
Lấy ngẫu nhiên từ tổng thể ra một
phần tử và gọi X là giá trị của dấu
hiệu X* đo được trên phần tử lấy
ra thì X là ĐLNN có phân phối
xác suất như sau:
X x1 x2 . . . xk
P p1 p2 . . . pk
Như vậy dấu hiệu mà ta nghiên
cứu (X*) được mô hình hóa bởi đại
lượng ngẫu nhiên X. Phân phối
xác suất của X được gọi là phân
phối gốc.
a- Kỳ vọng toán:

k
1i
iipx)X(E
Trung bình của tổng thể chính là
kỳ vọng toán của đ.l.n.n X.
b- Phương sai:
 
k
1i
i
2
i p)X(Ex)X(Var
Nhưng E(X) = , Do đó:

 
k
1i
i
2
i p)x()X(Var
Phương sai của đại lượng ngẫu
nhiên X chính là phương sai của
tổng thể: Var(X) = 2
3- Mẫu ngẫu nhiên
Cho đ.l.n.n X với phân phối xác
suất nào đó. Một mẫu ng.nhiên
kích thước n được thành lập từ X
là n đ.l.n.n độc lập, có cùng phân
phối xác suất với X.
Ký hiệu mẫu ng.n kích thước n
được xây dựng từ X là:
WX = (X1, X2, . . . . , Xn)
Thực hiện một phép thử đối với
mẫu ngẫu nhiên WX, tức là thực
hiện một phép thử đối với mỗi
thành phần (Xi) của mẫu.
Giả sử Xi nhận giá trị xi ( i = 1, 2, .
. . , n)
Các giá trị x1, x2, . . . ., xn tạo
thành một giá trị của mẫu ngẫu
nhiên, hay còn được gọi là một
mẫu cụ thể.
Ký hiệu là Wx = (x1, x2, . . . , xn)
Thí dụ:
Kết quả thi môn toán của một lớp
gồm 50 sinh viên như sau:
Gọi X là điểm thi môn toán của
một sinh viên chọn ng.n trong danh
sách của lớp thì X là đ.l.n.n có
phân phối xác suất như sau:
Ñieåm thi 4 5 6 7 9
Soá s/v 8 15 13 9 5
X 4 5 6 7 9
P 0,16 0,3 0,26 0,18 0,1
Từ lớp này ta lấy một mẫu gồm 5
s/v. Gọi Xi ( i =1, 2, 3, 4, 5) là điểm
thi môn toán của s/v thứ i được lấy
vào mẫu. Vậy ta có mẫu ngẫu
nhiên kích thước n = 5 được xây
dựng từ X:
15,
WX = (X1, X2, X3, X4, X5)
Thực hiện một phép thử đối với
mẫu ng.n này, tức chọn ngẫu
nhiên 5 s/v của lớp. Giả sử điểm
thi của s/v thứ nhất, thứ hai, thứ
ba, thứ tư, thứ năm tương ứng là
5, 9, 5, 7, 4, thì ta có một mẫu cụ
thể là:
Wx = (5, 9, 5, 7, 4)
Thực hiện một phép thử khác đối
với WX (tức chọn 5 s/v khác của
lớp) ta lại được một mẫu cụ thể
khác, chẳng hạn:
Wx = (4, 7, 9, 9, 5)
Thí dụ 2: (Đọc giáo trình)
IV- CÁC THAM SỐ 
ĐẶC TRƯNG CỦA MẪU
1- Trung bình mẫu:
a- Định nghĩa: 
Cho mẫu ng.n kích thước n, được
xây dựng từ đ.l.n.n X:
WX = (X1, X2, . . . , Xn)
Trung bình mẫu ngẫu nhiên (ký 
hiệu là ) được định nghĩa:X

n
1i
iX
n
1
X
Nếu có mẫu cụ thể:
Wx = (x1, x2, . . . , xn)
thì ta sẽ tính được giá trị của
(ký hiệu là x )
X
x = 
 xi
n
i = 1
n
b- Tính chất: 
Nếu đại lượng ngẫu nhiên gốc X
có kỳ vọng toán: E(X) = 
và phương sai: Var(X) = 2
thì:
E( ) =  và Var( ) =XX
2
n
Như vậy, bất kể phân phối xác
suất của đ.l.n.n gốc như thế nào, X
cũng có kỳ vọng toán bằng kỳ
vọng của đ.l.n.n gốc E(X) = E(X),
và phương sai của X nhỏ hơn
phương sai của đ.l.n.n gốc n lần.
Chú ý:
Nếu lấy mẫu không hoàn lại thì:
Var(X) =
N - n
N - 1

n
2
Thí dụ: Tổng thể là tập hợp gồm 5
công ty A, B, C, D, E với lợi nhuận (tỷ
đồng/năm) lần lượt là: 29, 31, 32, 33,
36. Lấy mẫu ng.n kích thước n = 4 từ
tổng thể này. Tính kỳ vọng toán và
phương sai của trung bình mẫu ng.n
trong hai trường hợp:
a- Chọn mẫu có lặp;
b- Chọn mẫu không lặp.
c- Phân phối xác suất của X 
Phân phối xác suất của X phụ
thuộc vào phân phối xác suất của
đ.l.n.n gốc. Nếu X có phân phối
chuẩn N(; 2) thì X có phân phối
chuẩn N( ; 2/n).
2- Phương sai mẫu
a- Định nghĩa:
Cho mẫu ngẫu nhiên
WX = (X1, X2,...., Xn)
Phương sai mẫu ngẫu nhiên (ký
hiệu là S2) được định nghĩa:
S2 = 
n
1i
2
i )XX(
1n
1
Nếu có mẫu cụ thể:
Wx = (x1, x2, . . . , xn)
thì S2 sẽ nhận giá trị:
s2 =
s2 gọi là phương sai của mẫu cụ
thể.
(xi- x)2
1
n-1 i=1
n
b- Tính chất của S2
Nếu E(X) =  ; Var(X) = 2
E(S2) = 2
Kỳ vọng toán của phương sai mẫu
bằng phương sai của đại lượng
ngẫu nhiên gốc X.
c- Định lý 1:
Giả sử X ~ N(; 2) và
WX = (X1, X2, . . . , Xn)
là mẫu ngẫu nhiên kích thước n
được thành lập từ X. Khi đó:
  ~ 2(n)
(Xi - )
2
2i = 1
n
 ~ 2(n-1)(n -1)S
2
2
c- Định lý 2:
X ~ N(; 2) thì:
X - 
S/n
 T(n-1)
3- Độ lệch chuẩn mẫu
Độ lệch chuẩn của mẫu ngẫu
nhiên (ký hiệu S) là căn bậc hai
của phương sai mẫu:
S =
2S
Nếu có mẫu cụ thể thì độ lệch
chuẩn của mẫu cụ thể là một giá
trị của S (ký hiệu là s)
s = 2s
4- Tỷ lệ mẫu
Tỷ lệ mẫu ngẫu nhiên (ký hiệu F) 
được định nghĩa như sau:
F = 
n
1i
iX
n
1
Xi (i = 1, 2, ..., n) là số phần tử có
tính chất A có trong lần lấy phần
tử thứ i vào mẫu.
Xi nhận giá trị 0 nếu phần tử thứ i
lấy vào mẫu không có tính chất A;
Xi nhận giá trị 1 nếu phần tử thứ i
lấy vào mẫu có tính chất A.
Nếu có mẫu cụ thể, ta sẽ tính được
giá trị của Fn (ký hiệu là f)
f =
n
nA
Trong đó nA là số phần tử có tính
chất A có trong mẫu cụ thể; n là
kích thước mẫu.
s2 =X =
xii=1
n
n xi - n(x)
2
n-1
1
2
i=1
n
V- PHƯƠNG PHÁP TÍNH CÁC SỐ
ĐẶC TRƯNG CỦA MẪU
1- Trường hợp số liệu của mẫu cho
dưới dạng gồm n giá trị quan sát
2- Trường hợp số liệu của mẫu cho
dưới dạng có tần số ni (nói chung
ni > 1):
s2 =
X =
nixi
n
i=1
k
n-1
1 nixi - n(x)2i=1
k
2
Thí dụ:
Quan sát điểm thi môn Toán cao
cấp của 10 sinh viên được chọn
ngẫu nhiên từ một lớp ta thu được
các số liệu sau:
5; 6; 7; 4; 6; 9; 4; 5; 5;
7.
Tính x và s của mẫu này.
Giải:

10
1i
i 58x

10
1i
2
i 358x
  4,2)8,5(10358
9
1
s 22 
5492,14,2s 
; X = = 5,8
58
10
* Với các số liệu cho ở thí dụ trên,
ta có thể trình bày số liệu quan sát
của mẫu này dưới dạng có tần số
như sau:
xi 4 5 6 7 9
ni 2 3 2 2 1
* Chú ý: Nếu số liệu của mẫu được
chia thành từng khoảng, thì khi
tính ta thay mỗi khoảng bằng giá
trị trung tâm của khoảng đó.''
i
'
i x;x
2
xx
x
''
i
'
i
i
( i = 1, 2, . . . , k)
* Thí dụ: Bảng dưới đây là số liệu
quan sát về thu nhập của một số
người làm việc ở một công ty (đơn
vị: ngàn đồng/tháng). Hãy tính
trung bình mẫu và phương sai
mẫu.
Thu nhaäp Soá
ngöôøi
xi
5 – 7
7 – 9
9 – 11
11 – 13
13 – 15
15 – 17
17 – 19
19 – 23
14
26
38
25
20
16
12
9
6
8
10
12
14
16
18
21
x = 11,95625
S = 4,019366
Tổng kết chương 6
Tổng thể Mẫu
k/niệmk/niệm
Tham số
đ/trưng
Tham số
đ/trưng
 TB tổng thể ()
 Psai tổng thể (2)
 Tỷ lệ tổng thể (p)
 TB mẫu (x)
 Psai mẫu (s2)
 Tỷ lệ mẫu (f)
 Độ lệch chuẩn TT() Độ l.ch mẫu (s)
Cách
tính
X; s2;
s; f
Bài tập:
6.7; 6.8; 6.9;
6.10; 6.11; 6.12;
Hết chương 6

File đính kèm:

  • pdfbai_giang_mon_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_6_m.pdf