Bài giảng Xử lý và trình bày số liệu

- Kết quả thí nghiệm cần phải được xử lý thống kê

- Với thí nghiệm thăm dò cổ điển (phân tích sự biến động) - kết quả thí nghiệm

được thể hiện qua giá trị trung bình và độ lệch chuẩn. Kết quả trình bày dưới

dạng bảng hoặc biểu đồ - Cần chỉ rõ các giá trị trung bình có khác biệt (thường

p<0,05) thống="" kê="" hay="">

- Với thí nghiệm tối ưu hóa (thăm dò và khai thác mặt đáp ứng) – kết quả thí

nghiệm được thể hiện qua giá trị trung bình và độ lệch chuẩn – Kết quả trình bày

dưới dạng phương trình (hàm số), mặt đáp ứng và đường đồng mức. – Cần chỉ

rõ các yếu tố có ảnh hưởng đến hàm mục tiêu hay không, mặt đáp ứng đã thăm

dò có phù hợp hay không, Nếu câu trả lời là có thì tiến hành bước tối ưu hóa

như thế nào?

pdf 26 trang kimcuc 9620
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xử lý và trình bày số liệu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xử lý và trình bày số liệu

Bài giảng Xử lý và trình bày số liệu
XỬ LÝ VÀ TRÌNH BÀY 
SỐ LIỆU
ĐẶNG THỊ THU HƯƠNG 1
ĐẶNG THỊ THU HƯƠNG – BM CNSTH- K CNTP
THỦ TỤC THỐNG KÊ CƠ BẢN
- Kết quả thí nghiệm cần phải được xử lý thống kê
- Với thí nghiệm thăm dò cổ điển (phân tích sự biến động) - kết quả thí nghiệm
được thể hiện qua giá trị trung bình và độ lệch chuẩn. Kết quả trình bày dưới
dạng bảng hoặc biểu đồ - Cần chỉ rõ các giá trị trung bình có khác biệt (thường
p<0,05) thống kê hay không?
- Với thí nghiệm tối ưu hóa (thăm dò và khai thác mặt đáp ứng) – kết quả thí
nghiệm được thể hiện qua giá trị trung bình và độ lệch chuẩn – Kết quả trình bày
dưới dạng phương trình (hàm số), mặt đáp ứng và đường đồng mức. – Cần chỉ
rõ các yếu tố có ảnh hưởng đến hàm mục tiêu hay không, mặt đáp ứng đã thăm
dò có phù hợp hay không, Nếu câu trả lời là có thì tiến hành bước tối ưu hóa
như thế nào?
ĐẶNG THỊ THU HƯƠNG 2
THỦ TỤC THỐNG KÊ CƠ BẢN
- Nếu số liệu có phân phối chuẩn (thường số liệu thu được trong phòng thí
nghiệm có phân phối chuẩn):
- Khi cần so sánh 2 giá trị trung bình, áp dụng t-test
- Khi cần so sánh từ 3 giá trị trung bình trở lên, áp dụng ANOVA và Post hoc test
(phân tích sâu ANOVA)
Nếu số liệu không có phân phối chuẩn (thường số liệu điều tra, khảo sát, thu
được từ thực địa không có phân phối chuẩn):
- Sử dụng các kiểm định phi tham số
ĐẶNG THỊ THU HƯƠNG 3
LỰA CHỌN PHẦN MỀM XỬ LÝ SỐ LIỆU
- Người nghiên cứu cần có kiến thức thống kê cơ bản, biết cách thiết kế thí
nghiệm hợp lý và lựa chọn thủ tục thống kê phù hợp để xử lý số liệu.
- Biết cách sử dụng các phần mềm xử lý thống kê để hỗ trợ
Tiêu chí lựa chọn phần mềm:
Giao diện thân thiện, dễ sử dụng, nhanh, đơn giản (Excel, SPSS, SAS,
STATITICA, STATGRAPHICS, MINITAB, R, SIGMASTAT, DX,) – Có những phần
mềm miễn phí, phần mềm bản quyền (bản dùng thử, bản crack) – Tất cả các
phần mềm đều xử lý được số liệu với những thủ tục thống kê cơ bản, và có
điểm mạnh về một mảng nào đó.
Người nghiên cứu tự chọn cho mình một phần mềm phù hợp và khi trình bày
báo cáo, bài báo khoa học cần chỉ rõ: số liệu đã được xử lý và biểu đồ, đồ thị
đã được vẽ bằng phần mềm nào (nêu nguồn gốc (tác giả bản quyền của phần
mềm đó), phiên bản, thủ tục thống kê nào đã được áp dụng,..)
ĐẶNG THỊ THU HƯƠNG 4
THU THẬP SỐ LIỆU
• Khi thu thập số liệu, người nghiên cứu cần xác định trước phần mềm
xử lý số liệu mà mình sẽ sử dụng, thủ tục thống kê mà mình sẽ áp
dụng để có cách nhập số liệu cho hợp lý.
• Các số liệu nên nhập trước trong file Excel (thường nhập theo cột) –
Xem file excel đính kèm
ĐẶNG THỊ THU HƯƠNG 5
Theo mục tiêu của tình huống nghiên cứu, tác giả chọn MS-
Excel 2013, STATISTICA để vẽ biểu đồ và xử lý số liệu
Thủ tục thống kê cần áp dụng:
- Tính giá trị trung bình và độ lệch chuẩn (thống kê mô tả
(Descriptive Statistic trong Excel hoặc STATISTICA hay đơn
giản là dùng hàm AVERAGE và STDEV trong excel).
- So sánh các giá trị trung bình để chỉ ra sự khác biệt có ý
nghĩa thống kê: Do có 3 nhóm mẫu (A, B, C) nên chọn ONE
WAY ANOVA – VÀ TEST POST HOC để kiểm tra sự khác biệt
giữa các gía trị trung bình
- Để đánh giá mối tương quan giữa chỉ tiêu đánh giá và thời
gian bảo quản đồng thời biết được xu hướng tăng (giảm)
của chỉ tiêu đánh giá theo thời gian – sử dụng Linear
Regression
ĐẶNG THỊ THU HƯƠNG 6
Bảng số liệu nhập trong excel để xử lý thống kê
HƯỚNG DẪN SỬ DỤNG STATISTICA
ĐẶNG THỊ THU HƯƠNG 7
Tác giả sử dụng STATISTICA software (Version 
10.0, StatSoft, Inc. 2300 East 14th Street Tulsa, 
OK 74104 USA); 
Tình huống áp dụng (file EXCEL đính kèm)
GIAO DIỆN CỦA STATISTICA
ĐẶNG THỊ THU HƯƠNG 8
BƯỚC 1: KHAI BÁO BIẾN
Nhấp chuột phải vào vị trí
biến cần khai báo - nếu
khai báo mới thường bắt
đầu từ Var1- chọn
Variable Spec
ĐẶNG THỊ THU HƯƠNG 9
BƯỚC 2
Tại cửa sổ khai báo thông tin biến
– Nhấp chuột vào vị trí All Specs để
khai báo nhiều biến cùng một lúc- Tên
biến có thể chọn general hoặc number
Chỉ tiêu đánh giá chọn dữ liệu number
ĐẶNG THỊ THU HƯƠNG 10
BƯỚC 3
Khai báo cùng lúc tất cả các biến
ĐẶNG THỊ THU HƯƠNG 11
Nhập số liệu vào STATISTICA
ĐẶNG THỊ THU HƯƠNG 12
• Về mặt lý thuyết, cần phân tích one way ANOVA để biết có sự khác
biệt có ý nghĩa giữa các giá trị trung bình hay không, nếu có sẽ tiếp
tục phân tích Post Hoc để chỉ cụ thể sự khác biệt. 
• Với STATISTICA - Sự khác biệt giữa các giá trị trung bình được thể hiện
trong bảng kết quả (màu đỏ)
• Khi phân tích phương sai một yếu tố:
• Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
• Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn
để được xem như tiệm cận phân phối chuẩn.
• Phương sai của các nhóm so sánh phải đồng nhất
ĐẶNG THỊ THU HƯƠNG 13
Để biết được có sự khác biệt về chỉ
tiêu đánh giá giữa các mẫu trong
cùng một thời gian bảo quản hay 
không, lần lượt từ tuần 0,1,2,3,4 
thực hiện như sau:
- Chọn statistics- basic statistics-
breakdown &one-way ANOVA-OK.
ĐẶNG THỊ THU HƯƠNG 14
- Trong hộp breakdown – chọn
Variables – phần biến phụ thuộc
(dependent) chọn Y0, nhóm
biến cần so sánh chọn MẪU- OK-
OK
ĐẶNG THỊ THU HƯƠNG 15
Trong hộp STATISTICS by Groups chọn Analysis of Variance. Kết quả cho thấy có
sự khác biệt thống kê giữa các giá trị trung bình (chữ màu đỏ), p=0,03
ĐẶNG THỊ THU HƯƠNG 16
ĐẶNG THỊ THU HƯƠNG 17
Trong hộp STATISTICS by Groups chọn Levene tests để kiểm tra xem phương sai của 3 nhóm mẫu là
đồng nhất hay không?
Kết quả cho thấy có sự đồng nhất giữa các phương sai, p=0,07
- Trong hôp Post Hoc test chọn Test TUKEY HD TEST. Sử dụng kiểm định nào là tuỳ thuộc vào mục đích
của nhà nghiên cứu và tình hình thực tế nghiên cứu. Khi trình bày kết quả cần nói rõ kết quả đưa ra
được thực hiện bởi kiểm định nào
- Thực hiện tương tự với các mốc thời gian, 1, 2,3,4 tuần, 
ĐẶNG THỊ THU HƯƠNG 18
Tuần 0: Chỉ tiêu đánh giá của mẫu A 
khác biệt có ý nghĩa (p<0.05) so với
mẫu B và C
- Mẫu B và C không khác nhau
Tuần 1: Chỉ tiêu đánh giá của 3 mẫu
A, B, C hoàn toàn khác biệt (p<0.05)
Tuần 2: Chỉ tiêu đánh giá của 3 mẫu
A, B, C hoàn toàn khác biệt (p<0.05)
Tuần 3: Chỉ tiêu đánh giá của mẫu A khác biệt có ý 
nghĩa (p<0.05) so với mẫu B và C
- Mẫu B và C không khác nhau
Tuần 4: Chỉ tiêu đánh giá của 3 mẫu A, B, C 
hoàn toàn khác biệt (p<0.05)
ĐẶNG THỊ THU HƯƠNG 19
ĐẶNG THỊ THU HƯƠNG 20
Thực hiện tương tự để xác định xem
có sự khác biệt về chỉ tiêu đánh giá
trong cùng một mẫu theo thời gian
bảo quản hay không.
Kết quả thể hiện như bảng bên. Kết
quả cho thấy cả 3 mẫu đều có sự
khác biệt về chỉ tiêu đánh giá giữa
các thời gian bảo quản khác nhau
Để đánh giá sự tương quan, chọn Multiple Linear Regression – Variables – biến phụ thuộc
(chọn YA), biến độc lập chọn THOI GIAN- OK-OK
ĐẶNG THỊ THU HƯƠNG 21
Hoặc chọn Summary: Regression Result
ĐẶNG THỊ THU HƯƠNG 22
Kết luận: Theo thời gian chỉ tiêu đánh giá của mẫu A 
có xu hướng tăng (R= 0,99; p<0,0001)
Để vẽ biểu đồ trên STATISTICA 
Trong hộp Statistics by Groups chọn Descripves – Categozied box &whisker –
chọn dạng biểu đồ loại gì (trong hộp Box-Whisker)- thường chọn
Mean/SD/1.96*SD
ĐẶNG THỊ THU HƯƠNG 23
Chọn Graphs – Scatterplot-OK- chọn trục X, Y- OK
ĐẶNG THỊ THU HƯƠNG 24
ĐẶNG THỊ THU HƯƠNG 25
Kết quả về sự khác biệt giữa giá trị trung bình của chỉ tiêu đánh giá thuộc nhóm A theo thời gian bảo quản và mối
tương quan giữa chỉ tiêu đánh giá với thời gian bảo quản được thể hiện ở hình a và b (sử dụng STATISTICA) 
a
b
KẾT QUẢ THỂ HIỆN CHO TỪNG NHÓM MẪU
TỔNG HỢP KẾT QUẢ (Sử dụng EXCEL) 
ĐẶNG THỊ THU HƯƠNG
26
35.00
40.00
45.00
50.00
55.00
60.00
W0 W1 W2 W3 W4
C
h
ỉ 
ti
ê
u
 đ
á
n
h
 g
iá
 Y
Thời gian bảo quản (tuần)
A
B
C
- Vì độ lệch chuẩn quá bé nên không thể hiện rõ trên biểu đồ
- Với đồ thị đường gấp khúc có thể sử dụng các chữ cái a,b,c để chỉ sự khác biệt hoặc không
thể hiện nhưng khi bình luận cần giải thích rõ.

File đính kèm:

  • pdfbai_giang_xu_ly_va_trinh_bay_so_lieu.pdf