Bài giảng môn Lý thuyết thông kê

Thống kê học là khoa học nghiên cứu hệ thống

phương pháp (thu thập, xử lý, phân tích) con số (mặt

lượng) của các hiện tượng số lớn tìm bản chất và tính

quy luật (mặt chất) trong những điều kiện nhất định.

Tổng thể thống kê và đơn vị tổng thể

Tổng thể thống kê là hiện tượng số lớn gồm các đơn

vị (phần tử) cần quan sát và phân tích mặt lượng.

Các đơn vị (phần tử) - đơn vị tổng thể.

Tiêu thức thuộc tính

- Biểu hiện không trực tiếp qua con số

- Biểu hiện qua đặc điểm, tính chất

-> Tiêu thức có biểu hiện gián tiếp được gọi là

chỉ báo thống kê

Tiêu thức số lượng

- Biểu hiện trực tiếp qua con số

- Con số - lượng biến

pdf 118 trang kimcuc 7860
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng môn Lý thuyết thông kê", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng môn Lý thuyết thông kê

Bài giảng môn Lý thuyết thông kê
1HỌC PHẦN
LÝ THUYẾT THỐNG KÊ
(Phần I)
NỘI DUNG
GIỚI THIỆU CHUNG VỀ THỐNG KÊ HỌC1
ĐIỀU TRA THỐNG KÊ2
TỔNG HỢP THỐNG KÊ3
ĐIỀU TRA CHỌN MẪU5
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ6
NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KTXH4
2I
ĐỐI TƯỢNG 
NGHIÊN CỨU 
CỦA 
THỐNG KÊ 
HỌC
II
MỘT SỐ KHÁI 
NIỆM THƯỜNG 
DÙNG TRONG 
THỐNG KÊ
III
THANG ĐO 
TRONG 
THỐNG KÊ
CHƯƠNG I: GIỚI THIỆU CHUNG 
VỀ THỐNG KÊ HỌC
IV
QUÁ TRÌNH 
NGHIÊN CỨU 
THỐNG KÊ
3Thống kê học là gì?
Sơ lược lịch sử phát triển thống kê học
Đối tượng nghiên cứu của thống kê học và
các phương pháp trong thống kê
I. Đối tượng nghiên cứu của thống kê học
1. Thống kê học:
Thống kê học là khoa học nghiên cứu hệ thống
phương pháp (thu thập, xử lý, phân tích) con số (mặt
lượng) của các hiện tượng số lớn tìm bản chất và tính
quy luật (mặt chất) trong những điều kiện nhất định.
4Là một trong những
công cụ quản lý vĩ mô
quan trọng, có vai trò
cung cấp các thông tin 
phục vụ quản lý
Thời kỳ
chiếm hữu
nô lệ
Thời kỳ
Phong kiến
Thời kỳ
sản xuất
hàng hóa
Giai đoạn
hiện nay
Phân tích, đánh giá theo
thời gian và không gian
Thể hiện mối quan hệ
lượng chất
Ghi chép các con số
2. Sơ lược về sự ra đời và phát triển của thống kê học
3. Đối tượng nghiên cứu của thống kê học
Thời gian
Không gian
Hiện tượng
quá trình KTXH
Số lớn
Mặt lượng
Mặt chất
5Thống kê
suy luận
Thống
kê mô tả
Phương pháp 
thống kê
Các phương pháp thống kê
Tổng thể thống kê
Tiêu thức thống kê
Chỉ tiêu thống kê
II. Một số khái niệm thường dùng 
trong thống kê
61. Tổng thể thống kê và đơn vị tổng thể
Tổng thể thống kê là hiện tượng số lớn gồm các đơn
vị (phần tử) cần quan sát và phân tích mặt lượng.
Các đơn vị (phần tử) - đơn vị tổng thể.
Các loại tổng thể thống kê
Tæng thÓ 
tiÒm Èn 
Tæng thÓ
béc lé
Theo sự nhận
biết các đơn vị
7Các loại tổng thể thống kê
Tæng thÓ
kh«ng
®ång chÊt
Tæng thÓ
®ång chÊt
Theo mục đích
nghiên cứu
Các loại tổng thể thống kê
Tæng thÓ 
bộ phận 
Tæng thÓ 
chung 
Theo phạm vi 
nghiên cứu 
82. Tiêu thức thống kê
Tiêu thức thống kê - đặc điểm của đơn vị tổng thể
được chọn để nghiên cứu
Tiêu thức thực thể
Tiêu thức thời gian
Tiêu thức không gian
Các loại tiêu thức thống kê
9Tiêu thức thuộc tính
- Biểu hiện không trực tiếp qua con số
- Biểu hiện qua đặc điểm, tính chất
-> Tiêu thức có biểu hiện gián tiếp được gọi là
chỉ báo thống kê
Tiêu thức số lượng
- Biểu hiện trực tiếp qua con số
- Con số - lượng biến
10
Tiêu thức thay phiên
Là tiêu thức chỉ có 2 biểu hiện không trùng
nhau trên một đơn vị tổng thể
Tiêu thức thời gian
Phản ánh thời gian của hiện tượng nghiên cứu
11
Tiêu thức không gian
Phản ánh phạm vi (lãnh thổ) của hiện tượng
3. Chỉ tiêu thống kê
Chỉ tiêu thống kê phản ánh mặt lượng gắn với chất
của các hiện tượng và quá trình KTXH số lớn trong
điều kiện thời gian và địa điểm cụ thể. 
12
Các loại chỉ tiêu thống kê
ChØ tiªu 
gi¸ trÞ 
ChØ tiªu 
hiÖn vËt
Theo hình thức
biểu hiện
Các loại chỉ tiêu thống kê
ChØ tiªu
tư¬ng ®èi
ChØ tiªu 
tuyÖt ®èi
Theo tính chất
biểu hiện
13
Các loại chỉ tiêu thống kê
ChØ tiªu 
thêi kú 
ChØ tiªu
thêi ®iÓm
Theo đặc điểm
về thời gian
Các loại chỉ tiêu thống kê
Chỉ tiêu 
Số lượng
(khối lượng)
Chỉ tiêu 
chất lượng
Theo nội dung 
phản ánh
14
Thang đo định danh
Thang đo thứ bậc
Thang đo khoảng
Thang đo tỷ lệ
III. THANG ĐO TRONG THỐNG KÊ
THANG ĐO TỶ LỆ
(Ratio Scale)
THANG ĐO KHOẢNG
(Interval Scale)
THANG ĐO THỨ BẬC
(Ordinal Scale)
THANG ĐO ĐỊNH DANH
(Nominal Scale)
Có gốc 0
Có khoảng cách
bằng nhau
Biểu hiệu có 
thứ tự hơn kém
MÔ HÌNH MÔ TẢ CÁC THANG ĐO
Đánh số các biểu hiện 
cùng loại của tiêu thức
Tiêu thức
thuộc tính
Tiêu thức
Số lượng
15
PHÂN TÍCH VÀ DỰ ĐOÁN 
THỐNG KÊ
(Phân tích dữ liệu)
TỔNG HỢP THỐNG KÊ
(Xử lý tài liệu)
ĐIỀU TRA THỐNG KÊ
(Thu thập thông tin)
IV. Quá trình nghiên cứu thống kê
Trình bày kết quả nghiên cứu
Xây dựng hệ thống 
chỉ tiêu thống kê 
(Xác định nhu cầu thông tin)
- Xác định mục đích nghiên cứu 
- Phân tích đặc điểm hiện tượng
Xác định mục đích nghiên cứu và phân tích đặc 
điểm hiện tượng
• Mục đích nghiên cứu
- Các số liệu thống kê phản ánh vấn đề gì?
- Các thông tin thu thập phục vụ cho đối tượng nào?
• Phân tích đặc điểm của hiện tượng
- Đối tượng nghiên cứu có đặc điểm đặc thù gì
- Xem đối tượng nằm trong hoàn cảnh không gian và thời
gian nào?
16
Xây dựng hệ thống chỉ tiêu thống kê
• Khái niệm:
Hệ thống chỉ tiêu thống kê là một tập hợp các
chỉ tiêu có thể phản ánh các mặt, các tính chất
quan trọng nhất, các mối liên hệ cơ bản giữa
các mặt trong tổng thể và giữa các hiện tượng
nghiên cứu với các hiện tượng có liên quan
Căn cứ xây dựng
• Căn cứ vào mục đích nghiên cứu.
• Căn cứ vào tính chất và đặc điểm của đối tượng
nghiên cứu. 
• Căn cứ vào khả năng nhân lực và tài chính.
17
Yêu cầu 
• Phải có khả năng nêu được đặc điểm và mối liên hệ cơ
bản của hiện tượng nghiên cứu
• Phải có các chỉ tiêu mang tính chất chung, các chỉ tiêu
mang tính chất bộ phận và các chỉ tiêu nhân tố.
• Phải đảm bảo tính thống nhất về nội dung, phương
pháp và phạm vi tính toán của các chỉ tiêu cùng loại.
ĐIỀU TRA THỐNG KÊ
(Trình bày cụ thể chương II)
18
TỔNG HỢP THỐNG KÊ
(Trình bày cụ thể chương III)
Phân tích và dự đoán thống kê
Khái niệm:
Phân tích và dự đoán thống kê là nêu lên một
cách tổng hợp bản chất cụ thể và tính quy luật
của các hiện tượng số lớn trong điều kiện nhất
định qua biểu hiện bằng số lượng và tính toán các
mức độ của hiện tượng trong tương lai.
19
Ý nghĩa:
- Là giai đoạn cuối cùng của qúa trình nghiên cứu
thống kê và nó biểu hiện tập trung nhất kết quả
toàn bộ quá trình đó.
- Phân tích và dự đoán thống kê không chỉ có ý
nghĩa nhận thức mà còn góp phần cải tạo hiện
tượng.
Phân tích và dự đoán thống kê
Yêu cầu:
- Phân tích và dự đoán thống kê phải tiến hành
trên cơ sở phân tích lý luận KTXH
- Phân tích và dự đoán thống kê phải căn cứ vào
toàn bộ sự kiện và đặt chúng trong mối liên hệ
với nhau.
- Đối với những hiện tượng có tính chất khác
nhau phải áp dụng các phương pháp khác nhau.
Phân tích và dự đoán thống kê
20
CHƯƠNG II: ĐIỀU TRA THỐNG KÊ
Khái niệm chung về điều tra thống kê1
Phân loại2
Phương án điều tra thống kê4
Sai số trong điều tra thống kê 5
Các hình thức thu thập thông tin3
I. Khái niệm chung về điều tra thống kê
Khái niệm:
Điều tra thống kê là tổ chức một cách khoa học và
theo một kế hoạch thống nhất việc thu thập tài liệu về
các hiện tượng và quá trình kinh tế xã hội.
21
I. Khái niệm chung về điều tra thống kê
Ý nghĩa:
- Là giai đoạn đầu của quá trình nghiên cứu thống kê
- Cung cấp thông tin cho cả quá trình nghiên cứu
+ Là căn cứ để kiểm tra, đánh giá thực trạng
+ Cung cấp luận cứ cho việc phân tích
+ Là căn cứ cho việc phát hiện quy luật
I. Khái niệm chung về điều tra thống kê
Yêu cầu:
- Chính xác
- Kịp thời
- Đầy đủ (nội dung, phạm vi)
22
II. Các loại điều tra thống kê
Điều tra không
thường xuyên: 
thu thập thông tin 
khi có nhu cầu
Điều tra thường
xuyên: tiến hành
thu thập thông tin 
theo sát với quá
trình phát triển
của hiện tượng
Theo tính chất liên tục 
của việc ghi chép
Điều tra
không toàn bộ:
Điều tra toàn bộ
Theo phạm vi đối 
tượng được điều tra 
II. Các loại điều tra thống kê
23
Điều tra không toàn bộ
Tiến hành thu 
thập thông tin 
trên một số ít 
các đơn vị 
(thậm chí 1 đơn 
vị) nhưng đi 
sâu nghiên cứu 
trên nhiều 
phương diện
Tiến hành thu 
thập thông tin ở 
bộ phận chiếm 
tỷ trọng lớn nhất 
trong tổng thể
Điều tra 
trọng điểm
Điều tra 
chuyên đề
Điều tra 
chọn mẫu
Tiến hành thu 
thập thông tin 
trên các đơn vị 
đại diện, kết quả 
thường để suy 
rộng cho tổng 
thể
III. Các hình thức thu thập thông tin
Báo cáo thống kê định kỳ: Là hình thức điều tra
thường xuyên có định kỳ theo nội dung, phương pháp và
chế độ báo cáo chính thức do cơ quan có thẩm quyền
quy định
 Các loại
- Báo cáo thống kê cơ sở
- Báo cáo thống kê tổng hợp
 Đặc điểm: Tổ chức thu thập thông tin có tính chất
hành chính
24
III. Các hình thức thu thập thông tin
 Điều tra chuyên môn: là hình thức tổ chức điều tra
không thường xuyên được tiến hành theo một kế hoạch
và phương pháp quy định riêng cho mỗi lần điều tra
 Đặc điểm: Không mang tính hành chính
IV. Phương án điều tra thống kê
Phương án điều tra là văn bản được xây dựng trước
khi tiến hành điều tra, quy định rõ về những vấn đề
cần giải quyết và hiểu thống nhất trước, trong và sau
khi tiến hành điều tra.
25
NỘI DUNG PHƯƠNG ÁN ĐIỀU TRA THỐNG KÊ
Nội dung 4
Nội dung 3
Nội dung 2
Nội dung 1
Chọn phương pháp thu thập thông tin 
Xác định phạm vi, 
đối tượng và đơn vị điều tra
Xác định nội dung điều tra
Xác định mục 
đích điều tra
Nội dung 7
Nội dung 6
Nội dung 5
Chọn mẫu điều tra
Soạn thảo bảng hỏi
Xác định thời điểm điều tra, thời kỳ điều tra
Nội dung 8
Lập kế hoạch tổ chức và tiến hành điều tra
V. Sai số trong điều tra thống kê
 Là chênh lệch giữa trị số thu được qua điều tra so
với trị số thực tế của hiện tượng
 Phân loại:
- Sai số do đăng ký ghi chép
- Sai số do tính chất đại biểu
26
SAI SỐ DO ĐĂNG KÝ GHI CHÉP
Xảy ra trong tất cả các cuộc điều tra thống kê
- Vô ý khai báo, đăng ký, ghi chép sai
- Cố tình khai báo, đăng ký, ghi chép sai
- Đo lường
- Hiểu sai nội dung câu hỏi
- Ý thức xã hội,
SAI SỐ DO TÍNH CHẤT ĐẠI BIỂU
Chỉ xảy ra trong điều tra chọn mẫu
- Số lượng đơn vị mẫu không đủ lớn
- Vi phạm nguyên tắc chọn mẫu ngẫu nhiên
- Kết cấu tổng thể mẫu khác tổng thể chung,
27
CÁCH KHẮC PHỤC SAI SỐ
- Đối với sai số do đăng ký, ghi chép
+ Làm tốt công tác chuẩn bị điều tra (soạn thảo bảng hỏi,)
+ Làm tốt công tác kiểm tra, giám sát,
- Đối với sai số do tính chất đại biểu
+ Lựa chọn phương pháp tổ chức chọn mẫu phù hợp
+ Tăng số đơn vị điều tra
+ Đảm bảo nguyên tắc ngẫu nhiên,
I
NHỮNG VẤN ĐỀ 
CHUNG VỀ 
TỔNG HỢP 
THỐNG KÊ
II
PHƯƠNG PHÁP 
TỔNG HỢP 
THỐNG KÊ
CHƯƠNG III: TỔNG HỢP THỐNG KÊ
28
I. Những vấn đề chung về tổng hợp thống kê
 Khái niệm:
Tổng hợp thống kê là tiến hành tập trung chỉnh lý
và hệ thống hoá một cách khoa học các tài liệu
thu thập được trong điều tra thống kê.
I. Những vấn đề chung về tổng hợp thống kê
 Ý nghĩa:
- Là giai đoạn trung gian của quá trình nghiên cứu
thống kê
- Giúp nhận xét, phân tích đặc trưng cơ bản hiện
tượng nghiên cứu
- Là cơ sở để vận dụng các phương pháp phân tích
thống kê
29
I. Những vấn đề chung về tổng hợp thống kê
 Nhiệm vụ:
Bước đầu làm cho các đặc trưng riêng của từng
đơn vị tổng thể chuyển thành đặc trưng chung của
toàn bộ tổng thể.
1 Sắp xếp dữ liệu và phân tổ
thống kê
2 Bảng thống kê 
3 Đồ thị thống kê
II. Phương pháp tổng hợp thống kê
30
1. Sắp xếp và phân tổ thống kê
Sắp xếp dữ liệua
Phân tổ thống kêb
a. Sắp xếp dữ liệu
- Tiêu thức thuộc tính: theo ABC hoặc trật tự logic
- Tiêu thức số lượng: Từ nhỏ đến lớn hoặc ngược lại
31
a. Sắp xếp dữ liệu bằng sơ đồ “thân lá”
Sơ đồ thân lá (stem-and-leaf) nhằm cung cấp
một hình ảnh nhanh về hình dáng phân bố bao
gồm các giá trị dạng số thực trong sơ đồ
a. Sắp xếp dữ liệu bằng sơ đồ “thân lá”
Cách thực hiện:
- Sắp xếp dữ liệu theo thứ tự tăng dần
- Thường chia mỗi quan sát vào một thân gồm tất 
cả các con số ngoại trừ con số cuối cùng và một lá –
con số cuối cùng.
- Viết các thân vào một cột với trị số tăng dần
- Viết từng lá vào hàng bên phải thân theo trật tự 
tăng dần
32
a. Sắp xếp dữ liệu bằng sơ đồ “thân lá”
Kỹ thuật “cắt tỉa” sơ đồ “thân lá”
- Tách mỗi số ở thân (khi thân nhỏ hơn 5) thành 2 
hoặc nhiều số (một với các lá từ 0 đến 4 và một từ 5 
đến 9 hoặc nhỏ hơn).
- Mỗi lá có thể đại diện cho nhiều quan sát
- Khi trị số quan sát có nhiều con số, nên “cắt tỉa”
các con số bằng cách bỏ bớt một vài con số cuối 
cùng.
b. Phân tổ thống kê
Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê 
Các loại phân tổ thống kê
Các bước tiến hành phân tổ thống kê
33
 Khái niệm phân tổ thống kê
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu
thức nào đó để tiến hành phân chia các đơn vị của
hiện tượng nghiên cứu thành các tổ (và các tiểu tổ) có
tính chất khác nhau
 Ý nghĩa phân tổ thống kê
Có ý nghĩa trong cả quá trình nghiên cứu thống kê
• Giai đoạn điều tra thống kê: Cơ sở cho việc lựa chọn các đơn vị
điều tra thực tế
• Giai đoạn tổng hợp thống kê: Phương pháp cơ bản của tổng
hợp thống kê
• Giai đoạn phân tích thống kê: Cơ sở để vận dụng các phương
pháp phân tích thống kê
34
Nhiệm vụ phân tổ thống kê
• Phân chia các loại hình KTXH.
• Biểu hiện kết cấu của hiện tượng nghiên cứu.
• Nghiên cứu mối liên hệ giữa các tiêu thức.
Các loại phân tổ thống kê
Phân tổ thống kê 
Nhiệm vụ phân tổ 
thống kê 
Số lượng tiêu thức 
phân tổ
Phân tổ 
phân 
loại
Phân tổ 
kết cấu
Phân tổ 
liên hệ
Phân tổ theo 
một tiêu thức
Phân tổ theo nhiều
tiêu thức
Phân tổ 
kết hợp
Phân tổ 
nhiều chiều
35
* Các bước phân tổ thống kê (phân tổ đơn) 
Phân phối các đơn vị vào từng tổ
Xác định số tổ và khoảng cách tổ
Lựa chọn tiêu thức phân tổ
Bước 4
Bước 3
Bước 2
Bước 1
Xác định mục đích phân tổ
B1: Xác định mục đích phân tổ
Trả lời câu hỏi: phân tổ để làm gì?
Phân tổ 
???!!!
36
B1: Lựa chọn tiêu thức phân tổ
 Tiêu thức phân tổ là tiêu thức được chọn làm
căn cứ để tiến hành phân tổ thống kê.
 Lựa chọn tiêu thức phân tổ
Căn cứ chọn tiêu thức phân tổ:
 Dựa vào mục đích nghiên cứu.
 Căn cứ vào đặc điểm, tính chất và điều
kiện lịch sử cụ thể.
37
B3: Xác định số tổ và khoảng cách tổ
Phân tổ theo tiêu thức thuộc tính
 Các loại hình tương đối ít: mỗi loại hình có thể
hình thành nên 1 tổ
Số loại hình thực tế nhiều: ghép những loại hình
giống nhau hoặc gần giống nhau vào một tổ
 Xác định số tổ và khoảng cách tổ 
Phân tổ theo tiêu thức số lượng
 Tiêu thức có ít lượng biến: thường cứ mỗi lượng
biến là cơ sở để hình thành một tổ, gọi là phân tổ không
có khoảng cách tổ
38
 Xác định số tổ và khoảng cách tổ 
Phân tổ theo tiêu thức số lượng
Tiêu thức có nhiều lượng biến: mỗi tổ sẽ bao gồm
một phạm vi lượng biến, với hai giới hạn (giới hạn trên
và giới hạn dưới), gọi là phân tổ có khoảng cách tổ.
Khoảng cách tổ (h) = giới hạn trên – giới hạn dưới
Phân tổ có khoảng cách tổ
n
xxh minmax 
+ Khoảng cách tổ bằng nhau
39
Phân tổ có khoảng cách tổ
+ Khoảng cách tổ không bằng nhau: Tuỳ đặc điểm
của hiện tượng và mục đích nghiên cứu để xác định số
tổ và khoảng cách tổ phù hợp
B4: Phân phối các đơn vị vào từng tổ
Sắp xếp các đơn vị vào từng tổ tương ứng với biểu
hiện của từng tổ
40
Dãy số phân phối
Dãy số phân phối là kết quả của phân tổ
thống kê
Các loại
 Dãy số phân phối thuộc tính
 Dãy số phân phối số lượng (dãy số lượng biến)
Thành phần của dãy số lượng biến
Lượng biến
(xi)
Tần số
(fi)
Tần suất
(di =fi/fi)
Tần số tích luỹ
( Si =fi)
x1 f1 d1 f1
x2 f2 d2 f1 + f2
... ...  .
xn fn fn f1 + f2 +  + fn-1 + fn
Cộng fi
di = 1
(100)
Khi phân tổ có khoảng cách tổ không bằng nhau, để đánh
giá mức độ tập trung từng tổ, sử dụng mật độ phân phối
(mi = fi/hi)
41
* Phân tổ lại
Phân tổ lại là tiến hành lập ra một số tổ mới trên
cơ sở các tổ cũ đã có sẵn từ trước, nhằm đáp ứng
mục đích nghiên cứu nào đó.
* Phân tổ lại
Các trường hợp sử dụng phân tổ lại
- Các tài liệu trước phân tổ không thống nhấ ...  = 5
2. Độ lệch tuyệt đối bình quân
• Công thức tính
n
x - x
 d i



i
ii
f
f x - x
 d (cã quyÒn sè)
80
3. Phương sai
Công thức tính:
1
2
 
n
S
2
i )x - (x 

1
2
i
2
i
f
)x - (x
 i
fS (có quyền số)
Công thức thực hành:




 

 

 

2222
2
111
i
ii
i
ii
i
i
ii
ii
i
ii
f
fx
f
fx
f
f
ff
fx
f
fxS
 222
1
 xx
f
fS
i
i 
 

4. Độ lệch tiêu chuẩn
• Công thức tính: 2SS 
81
5. Hệ số biến thiên
• Công thức tính: 100 
x
SV
* Các tham số phản ánh phân phối
- Hệ số bất đối xứng:
)2)(1(
1
3

nn
S
xxn
Skewness
n
i
i
Hệ số này có giá trị càng gần 0 thì phân phối của dãy số lại 
càng đối xứng qua giá trị μ. Khi hệ số này nhỏ hơn 0, dãy số 
phân phối chuẩn lệch trái. Khi hệ số này lớn hơn 0, dãy số 
phân phối chuẩn lệch phải.
162
82
* Các tham số phản ánh phân phối
- Hệ số độ nhọn:
Đối với phân phối chuẩn thì giá trị của hệ số Kurtosis bằng 3. 
)n)(n)(n(
S
xx)n(n
Kurtosis
n
i
i
321
1
1
4

)n)(n(
)n(
)n)(n)(n(
S
xx
)n(n
K
n
i
i
32
13
321
1 2
1
4

Khi giá trị này bằng 0 thì đó là phân phối chuẩn, nếu giá trị 
mang dấu dương thì phân phối nhọn hơn so với phân phối 
chuẩn và ngược 163
I
NHỮNG VẤN 
ĐỀ CHUNG VỀ 
ĐIỀU TRA 
CHỌN MẪU
II
ĐIỀU TRA 
CHỌN MẪU 
NGẪU NHIÊN
IV
ĐIỀU TRA 
CHỌN MẪU PHI 
NGẪU NHIÊN
CHƯƠNG V: ĐIỀU TRA CHỌN MẪU
83
Khái niệm
Ưu điểm
Hạn chế
Trường hợp vận dụng
I. Những vấn đề chung về ĐTCM
Khái niệm
ĐTCM là loại điều tra không toàn bộ trong đó
người ta chọn ra một số đơn vị đủ lớn để tiến
hành điều tra thực tế. Các đơn vị được chọn
theo những quy tắc nhất định để đảm bảo tính
đại biểu, kết quả ĐTCM thường dùng để suy
rộng cho tổng thể chung
84
Ưu điểm
+ Tiết kiệm (chi phí, nhân lực, thời gian)
+ Mở rộng nội dung điều tra
+ Tài liệu thu được có độ chính xác cao
+ Tổ chức đơn giản
Hạn chế
+ Không cho biết thông tin đầy đủ về tổng thể chung
+ Sai số khi suy rộng
+ Kết quả điều tra không thể tiến hành phân tổ theo
mọi phạm vi nghiên cứu
85
Trường hợp vận dụng
• Thay thế cho điều tra toàn bộ
• Kết hợp với điều tra toàn bộ
• Kiểm định giả thuyết thống kê
Lý luận chung về điều tra chọn mẫu 
ngẫu nhiên
Chọn mẫu thời điểm
Một số phương pháp tổ chức chọn mẫu 
ngẫu nhiên
II. Điều tra chọn mẫu ngẫu nhiên
86
1. Lý luận chung về điều tra 
chọn mẫu ngẫu nhiên
Tổng thể chung và tổng thể mẫua
Cách chọnb
Ước lượng (suy rộng) kết quả điều trac
Xác định kích thước (quy mô) mẫud
a. Tổng thể chung và tổng thể mẫu
Chỉ tiêu Tổng thể chung Tổng thể mẫu
Quy mô
Số bình quân
Tỷ lệ theo một 
tiêu thức
Phương sai
N
xi 
n
xx i 
)1( ff 
2S
)1( pp 
p f
N n
2
87
Chọn hoàn lại (Chọn nhiều lần, chọn lặp)
nn
N NAk 
b. Cách chọn mẫu
Chọn không hoàn lại, (Chọn 1 lần, chọn không lặp)
 !nN!n
!NCk nN 
b. Cách chọn mẫu
88
c. Ước lượng kết quả điều tra
• Với mức ý nghĩa α (độ tin cậy/xác suất P=1-α)
• Ước lượng trung bình
xx zxzx  .. 2/2/ 
Khi biết phương sai tổng thể chung (hoặc n lớn)
Khi chưa biết phương sai tổng thể chung (mẫu nhỏ)
  xzx .
xzx  . 
x
n
x
n txtx  .. 11 2/2/ 
  x
ntx .1
x
ntx  .1 
Hai phía
Vế phải
Vế trái
Hai phía
Vế phải
Vế trái
c. Ước lượng kết quả điều tra
• Với mức ý nghĩa α (độ tin cậy/xác suất P=1-α)
• Ước lượng tỷ lệ
ff zfpzf  .. 2/2/ 
 pzf f .
fzxp  . 
Hai phía
Vế phải
Vế trái
89
Ước lượng kết quả điều tra
 Trong đó được gọi là hệ số tin cậy (giá trị tới hạn mức α
của phân phối chuẩn hoá và phân phối Student)
 tz ,
• α – mức ý nghĩa, P=(1-α) là xác suất hay trình độ tin cậy
Ước lượng kết quả điều tra
Một số giá trị đặc biệt của phân phối chuẩn hoá
Z /2 Xác suất tin cậy
1 0,6826
2 0,9544
3 0,9974
Xác suất tin cậy Mức ý nghĩa Z /2
0,900 0,100 1,645 
0,950 0,050 1,960 
0,975 0,025 2,326
0,990 0,010 2,576
 được gọi là sai số bình quân chọn mẫufx  ,
90
Sai số bình quân chọn mẫu
Cách chọn
Suy rộng
Hoàn lại
(chọn nhiều lần)
Không hoàn lại
(chọn một lần)
Số bình quân
Tỷ lệ
nx
2
 
n
S
x
2
 
)1(
2
N
n
nx


)1(
2
N
n
n
S
x 
n
ff
f
)1( 
  )1(
)1(
N
n
n
ff
f 
 
Các nguyên nhân sai số trong ĐTCM
- Vi phạm nguyên tắc chọn mẫu ngẫu nhiên
- Số lượng đơn vị mẫu không đủ lớn
- Kết cấu tổng thể mẫu khác với kết cấu tổng thể
chung
- Sai số do đăng ký, ghi chép
91
d. Xác định số đơn vị mẫu điều tra
• Yêu cầu:
+ Sai số nhỏ nhất
+ Chi phí thấp nhất
Công thức xác định
Cách chọn
Suy rộng
Chọn hoàn lại
(chọn nhiều lần)
Chọn không hoàn lại
(chọn một lần)
Bình quân
Tỷ lệ
2
22
2/
x
zn

 22
2/
2
22
2/
..
..


zN
zNn
x 
2
2
2/ )1(.
f
ppzn

)1(..
)1(..
2
2/
2
2
2/
ppzN
ppzNn
f 

Phạm vi sai số chọn mẫuffxx zz  2/2/ , 
92
+ Cách chọn mẫu
+ Hệ số tin cậy /Trình độ tin cậy
+ Phương sai (độ đồng đều) của tổng thể chung (2)
+ Phạm vi sai số chọn mẫu ()
Các nhân tố ảnh hưởng tới kích thước mẫu
+ Lấy phương sai (2) lớn nhất hoặc tỷ lệ (p) gần 0,5 nhất
trong các lần điều tra trước (nếu có)
+ Lấy phương sai hoặc tỷ lệ của các cuộc điều tra khác có
tính chất tương tự.
+ Điều tra thí điểm để xác định phương sai hoặc tỷ lệ.
+ Ước lượng phương sai dựa vào khoảng biến thiên
66
minmax xxR 
Một số phương pháp xác định 
phương sai tổng thể chung
93
2. Chọn mẫu thời điểm
Là phương pháp chọn mẫu đặc biệt, trong đó mẫu được
xét theo phạm vi thời gian.
Chú ý:
- Khái niệm tổng thể chung và mẫu theo yếu tố thời gian
- Số đơn vị tổng thể chung coi là vô hạn nếu thời gian điều
tra ngắn
- Chỉ có thể áp dụng phương pháp chọn không hoàn lại
3. Một số phương pháp tổ chức 
chọn mẫu ngẫu nhiên
a. Chọn mẫu ngẫu nhiên đơn giản
b. Chọn mẫu hệ thống (máy móc)
c. Chọn mẫu phân loại (phân tổ)
d. Chọn mẫu cả khối (mẫu chùm)
e. Chọn mẫu phân tầng (nhiều cấp)
94
III. Điều tra chọn mẫu
phi ngẫu nhiên
 Một số phương pháp chọn mẫu phi ngẫu nhiên:
- Chọn mẫu tiện lợi (thuận tiện)
- Chọn mẫu phán đoán
- Chọn mẫu hạn ngạch
- Chọn mẫu tích lũy
“Điểm yếu của tất cả các phương pháp phi ngẫu nhiên là
không có sự phát triển về lý thuyết, chọn mẫu phi ngẫu nhiên
chỉ có thể được đánh giá bằng chủ quan” Graham Kalton
I
NHỮNG VẤN 
ĐỀ CHUNG VỀ 
KIỂM ĐỊNH
II
KIỂM ĐINH 
TRUNG BÌNH
IV
KIỂM ĐỊNH
TỶ LỆ
CHƯƠNG VI: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
95
I. Những vấn đề chung về kiểm định
Giả thuyết thống kê1
Sai lầm và mức ý nghĩa trong kiểm định2
Tiêu chuẩn kiểm định3
Các bước tiến hành một kiểm định giả thuyết thống kê4
1. Giả thuyết thống kê
Là giả thuyết về một vấn đề nào đó của tổng
thể chung (về các tham số như trung bình, tỷ
lệ, phương sai, dạng phân phối,) 
96
1. Giả thuyết thống kê
Giả thuyết mà ta muốn kiểm định (H0)
Giả thuyết đối lập (Ha, H1, H)
2. Sai lầm và mức ý nghĩa trong kiểm định
- Sai lầm loại I là bác bỏ H0 khi H0 đúng
- Sai lầm loại II là chấp nhận H0 khi H0 sai
97
2. Sai lầm và mức ý nghĩa trong kiểm định
Kết luận
Thực tế Chấp nhận H0 Bác bỏ H0
H0 đúng Kết luận đúng Sai lầm loại I
H0 sai Sai lầm loại II Kết luận đúng
2. Sai lầm và mức ý nghĩa trong kiểm định
Mức ý nghĩa của kiểm định ( ) là xác suất mắc sai
lầm loại I
 = P(Bác bỏ H0/H0 đúng)
98
3. Tiêu chuẩn kiểm định
Tiêu chuẩn kiểm định là quy luật phân phối xác 
suất nào đó dùng để kiểm định.
Trong tập hợp các kiểm định thống kê có cùng 
mức ý nghĩa , kiểm định nào có xác suất mắc sai 
lầm loại 2 nhỏ nhất được xem là “tốt nhất”.
4. Các bước tiến hành kiểm định
- Xây dựng giả thuyết H0 và giả thuyết đối H1
- Xác định mức ý nghĩa 
- Chọn tiêu chuẩn kiểm định
- Tính giá trị của tiêu chuẩn kiểm định từ mẫu 
quan sát
- Kết luận
99
Kết luận
Quy tắc kiểm định giả thuyết thống kê
- Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ
(W ), kết luận H0 sai, có cơ sở để bác bỏ H0
- Nếu giá trị của tiêu chuẩn kiểm định thuộc miền
không bác bỏ, chưa khẳng định H0 đúng mà kết luận
chưa đủ cơ sở để bác bỏ H0
II. Kiểm định trung bình
Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung1
Kiểm định hai giá trị trung bình của hai tổng thể2
Kiểm định trung bình thuộc nhiều tổng thể chung3
100
1. Kiểm định giả thuyết về giá trị 
trung bình của một tổng thể chung
- Giả sử nghiên cứu X  N(, 2)
- Chưa biết  song có cơ sở để giả định nó bằng 0
(H0:  = 0)
- Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ
đó tính trung bình mẫu
- Tiêu chuẩn kiểm định
x
a. Trường hợp đã biết 2
Tiêu chuẩn kiểm định
)1,0(~
/
)( 0 N
n
xZ

 
101
a. Trường hợp đã biết 2
Miền bác bỏ W 
- Hai phía: Zqs > z /2
- Vế phải: Zqs > z 
- Vế trái: Zqs < -z 
b. Trường hợp chưa biết 2 
Tiêu chuẩn kiểm định
Trong đó
)1(
0 ~
/
)(
 ntnS
xT 
 2222 )(
11
)( xx
f
f
f
fxxS
i
i
i
ii 
 

 
 
102
b. Trường hợp chưa biết 2
Miền bác bỏ W 
- Hai phía: Tqs > t /2(n-1)
- Vế phải: Tqs > t (n-1)
- Vế trái: Tqs < -t (n-1)
b. Trường hợp chưa biết 2
Trong trường hợp số quan sát (n) lớn, thống kê t 
có phân phối xấp xỉ chuẩn, nên có thể viết tiêu 
chuẩn kiểm định là:
)1,0(~
/
)( 0 N
nS
xZ  
103
b. Trường hợp chưa biết 2
Miền bác bỏ W 
- Hai phía: Zqs > z /2
- Vế phải: Zqs > z 
- Vế trái: Zqs < -z 
2. Kiểm định hai giá trị trung bình của 
hai tổng thể
a. Hai mẫu độc lập
b. Hai mẫu phụ thuộc
104
a. Hai mẫu độc lập
-Giả sử nghiên cứu 2 tổng thể X1  N(1, 12) và
X2  N(2, 22)
- Chưa biết 1 và 2 song có cơ sở để giả định nó bằng
nhau (H0: 1 = 2)
- Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên
độc lập, với kích thước n1 và n2 từ đó tính được và
- Tiêu chuẩn kiểm định
1x 2x
Trường hợp đã biết 12 và 22
Tiêu chuẩn kiểm định
)1,0(~)(
2
2
2
1
2
1
21 N
nn
xxZ

105
Trường hợp đã biết 12 và 22
Miền bác bỏ W 
- Hai phía: Zqs > z /2
- Vế phải: Zqs > z 
- Vế trái: Zqs < -z 
Trường hợp chưa biết 12 và 22
Phương sai bằng nhau
Phương sai không bằng nhau
106
Kiểm định phương sai
-Tiêu chuẩn kiểm định )12;11(2
2
2
1 ~ nnfS
SF 
Miền bác bỏ giả thuyết H0: Fqs < f1- /2, (n1-1)(n2-1)
hoặc Fqs > f /2, (n1-1)(n2-1)
Trường hợp chưa biết 12 và 22 và 
phương sai bằng nhau
Tiêu chuẩn kiểm định
)2(,
2
2
1
2
21
21
~)( 
 nnt
n
S
n
S
xxT 
)1()1(
)1()1(
21
2
22
2
112
nn
SnSnSTrong đó
107
Trường hợp chưa biết 12 và 22 và 
phương sai bằng nhau
Miền bác bỏ W 
- Hai phía: Tqs > t /2 ,(n1+n2-2)
- Vế phải: Tqs > t (n1+n2-2)
- Vế trái: Tqs < -t (n1+n2-2)
Trường hợp chưa biết 12 và 22 và 
phương sai không bằng nhau
Tiêu chuẩn kiểm định
vt
n
S
n
S
xxT ,
2
2
2
1
2
1
21 ~)( 
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1
1
1
1
1
n
S
nn
S
n
n
S
n
S
v Nếu v lẻ thì làm tròn xuống
108
Trường hợp chưa biết 12 và 22 và 
phương sai không bằng nhau
Miền bác bỏ W 
- Hai phía: Tqs > t /2(v)
- Vế phải: Tqs > t (v)
- Vế trái: Tqs < -t (v)
b. Hai mẫu phụ thuộc
-Giả sử nghiên cứu 2 tổng thể phụ thuộc
X1  N(1, 12) và X2  N(2, 22)
Muốn so sánh 1 và 2 ta xét độ lệch trung bình d (chưa biết) 
có cơ sở để giả định độ lệch trung bình bằng 0 (H0: d = 0)
- Để kiểm định giả thuyết trên, lấy mẫu ngẫu nhiên phụ thuộc
được hình thành bởi n cặp quan sát của 2 mẫu, tính độ lệch
giữa 2 mẫu (di), từ đó tính trung bình của các độ lệch giữa các
cặp của 2 mẫu ( )
- Tiêu chuẩn kiểm định
d
109
b. Hai mẫu phụ thuộc
Tiêu chuẩn kiểm định
)1(
0 ~
/
)(
 n
d
t
nS
dT 

b. Hai mẫu phụ thuộc
Miền bác bỏ W 
- Hai phía: Tqs > t /2(n-1)
- Vế phải: Tqs > t (n-1)
- Vế trái: Tqs < -t (n-1)
110
b. Hai mẫu phụ thuộc
Ưu điểm: Thường cho kết quả chính xác hơn vì đã
bỏ được các nhân tố ngoại lai
Hạn chế: Tiến hành thực hiện thu thập thông tin 
phức tạp hơn
3. Kiểm định trung bình thuộc nhiều 
tổng thể chung (one-way ANOVA)
- Giả sử có k tổng thể đều có có phân phối Xj N(j,j2)
- Chưa biết i song có cơ sở để giả định nó bằng nhau
(H0: 1 = 2 = . = k)
- Để kiểm định giả thuyết trên, lấy k mẫu với cỡ mẫu
tương ứng n1, n2,  nk
- Tiêu chuẩn kiểm định
111
3. Kiểm định trung bình thuộc nhiều 
tổng thể chung (one-way ANOVA)
- Tiêu chuẩn kiểm định ),1(~ knkfMSE
MSFF 
1 
k
SSFMSF kn
SSEMSE
3. Kiểm định trung bình thuộc nhiều 
tổng thể chung (one-way ANOVA)
 
k
j
n
i
ij
j
xxSST
1 1
2
 j
k
j
j nxxSSF .
1
2
 
k
j
n
i
jij
j
xxSSE
1 1
2
SSESSFSST 
Total Sum of Squares)
(Sum of Squares for Factor)
(Sum of Squares for Error)
112
3. Kiểm định trung bình thuộc nhiều 
tổng thể chung (one-way ANOVA)
Miền bác bỏ W : Fqs > f (k-1; n-k)
3. Kiểm định trung bình thuộc nhiều 
tổng thể chung (one-way ANOVA)
ANOVA
Source of Variation SS df MS F
Between Groups SSF k-1 MSF ***
Within Groups SSE n-k MSE
Total SST n-1
Kết quả (chạy bằng phần mềm) được thể hiện trong bảng sau 
(ANOVA – Analysis of Variance):
113
III. Kiểm định tỷ lệ
Kiểm định giả thuyết về tỷ lệ của tổng thể chung1
Kiểm định tỷ lệ của hai tổng thể chung2
Kiểm định tỷ lệ của nhiều tổng thể chung3
1. Kiểm định giả thuyết về tỷ lệ của 
tổng thể chung
- Giả sử nghiên cứu tiêu thức A nào đó của một tổng
thể chung
- Chưa biết p song có cơ sở để giả định nó bằng p0 
(H0: p = p0)
- Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đó
tính tỷ lệ mẫu f
- Tiêu chuẩn kiểm định
114
1. Kiểm định giả thuyết về tỷ lệ của 
tổng thể chung
Khi n đủ lớn (n.f 5 hoặc n(1-f) 5)
Tiêu chuẩn kiểm định
)1,0(~
/)1(
)(
00
0 N
npp
pfZ
Miền bác bỏ W 
- Hai phía: Zqs > z /2
- Vế phải: Zqs > z 
- Vế trái: Zqs < -z 
1. Kiểm định giả thuyết về tỷ lệ của 
tổng thể chung
115
2. Kiểm định tỷ lệ của 
hai tổng thể chung
-Giả sử nghiên cứu 2 tổng thể , tỷ lệ chung theo tiêu
thức A lần lượt là p1 và p2
- Chưa biết p1 và p1 song có cơ sở để giả định nó bằng
nhau (H0: p1 = p2)
- Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên
với kích thước n1 và n2 từ đó tính được f1 và f2
- Tiêu chuẩn kiểm định
2. Kiểm định tỷ lệ của hai tổng thể chung
Khi n1 và n2 đủ lớn, tức là n1.f1 5 hoặc n1(1-f1) 5 
Và n2.f2 5 hoặc n2(1-f2) 5 
Tiêu chuẩn kiểm định
)1,0(~
11)1(
21
21 N
nn
ff
ffZ
21
2211
nn
fnfnf
 Trong đó
116
2. Kiểm định tỷ lệ của hai tổng thể chung
Miền bác bỏ W 
- Hai phía: Zqs > z /2
- Vế phải: Zqs > z 
- Vế trái: Zqs < -z 
3. Kiểm định tỷ lệ của nhiều tổng thể chung
Có ý kiến cho rằng tỷ lệ nghèo ở 3 địa phương (A, B 
và C) là khác nhau? Từ mỗi địa phương chọn ngẫu
nhiên 1 số hộ gia đình và có kết quả như sau:
117
3. Kiểm định tỷ lệ của nhiều tổng thể chung
ĐP
Loại hộ A B C
Hộ nghèo 20 50 25
Hộ không nghèo 180 350 95
-Hãy đưa ra kết luận với mức ý nghĩa 5%
-Bảng trên được gọi là bảng ngẫu nhiên 2 dòng
(i=1,2) và 3 cột (j=1,3)
3. Kiểm định tỷ lệ của nhiều tổng thể chung
Gọi tỷ lệ hộ nghèo của địa phương A, B và C lần
lượt là p1, p2 và p3
Cặp giả thuyết cần kiểm định là
H0: p1 = p2 = p3
H1:  pi pj (i j)
118
3. Kiểm định tỷ lệ của nhiều tổng thể chung
Gọi nij là tần số thực nghiệm (số quan sát ở dòng
thứ i và cột thứ j)
Tính tần số lý thuyết ( )ijn
n
nij
jcét tængi dßng tæng 
 
i j
ijnn Tổng số đơn vị điều tra
3. Kiểm định tỷ lệ của nhiều tổng thể chung
Tiêu chuẩn kiểm định
 2
,
2
2 ~ df
i j ij
ijij
n
nn
  
1)cét 1).(sèdßng (sè df

File đính kèm:

  • pdfbai_giang_mon_ly_thuyet_thong_ke.pdf