Bài giảng Xử lý và trình bày số liệu
- Kết quả thí nghiệm cần phải được xử lý thống kê
- Với thí nghiệm thăm dò cổ điển (phân tích sự biến động) - kết quả thí nghiệm
được thể hiện qua giá trị trung bình và độ lệch chuẩn. Kết quả trình bày dưới
dạng bảng hoặc biểu đồ - Cần chỉ rõ các giá trị trung bình có khác biệt (thường
p<0,05) thống="" kê="" hay="">0,05)>
- Với thí nghiệm tối ưu hóa (thăm dò và khai thác mặt đáp ứng) – kết quả thí
nghiệm được thể hiện qua giá trị trung bình và độ lệch chuẩn – Kết quả trình bày
dưới dạng phương trình (hàm số), mặt đáp ứng và đường đồng mức. – Cần chỉ
rõ các yếu tố có ảnh hưởng đến hàm mục tiêu hay không, mặt đáp ứng đã thăm
dò có phù hợp hay không, Nếu câu trả lời là có thì tiến hành bước tối ưu hóa
như thế nào?
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xử lý và trình bày số liệu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Xử lý và trình bày số liệu
XỬ LÝ VÀ TRÌNH BÀY SỐ LIỆU ĐẶNG THỊ THU HƯƠNG 1 ĐẶNG THỊ THU HƯƠNG – BM CNSTH- K CNTP THỦ TỤC THỐNG KÊ CƠ BẢN - Kết quả thí nghiệm cần phải được xử lý thống kê - Với thí nghiệm thăm dò cổ điển (phân tích sự biến động) - kết quả thí nghiệm được thể hiện qua giá trị trung bình và độ lệch chuẩn. Kết quả trình bày dưới dạng bảng hoặc biểu đồ - Cần chỉ rõ các giá trị trung bình có khác biệt (thường p<0,05) thống kê hay không? - Với thí nghiệm tối ưu hóa (thăm dò và khai thác mặt đáp ứng) – kết quả thí nghiệm được thể hiện qua giá trị trung bình và độ lệch chuẩn – Kết quả trình bày dưới dạng phương trình (hàm số), mặt đáp ứng và đường đồng mức. – Cần chỉ rõ các yếu tố có ảnh hưởng đến hàm mục tiêu hay không, mặt đáp ứng đã thăm dò có phù hợp hay không, Nếu câu trả lời là có thì tiến hành bước tối ưu hóa như thế nào? ĐẶNG THỊ THU HƯƠNG 2 THỦ TỤC THỐNG KÊ CƠ BẢN - Nếu số liệu có phân phối chuẩn (thường số liệu thu được trong phòng thí nghiệm có phân phối chuẩn): - Khi cần so sánh 2 giá trị trung bình, áp dụng t-test - Khi cần so sánh từ 3 giá trị trung bình trở lên, áp dụng ANOVA và Post hoc test (phân tích sâu ANOVA) Nếu số liệu không có phân phối chuẩn (thường số liệu điều tra, khảo sát, thu được từ thực địa không có phân phối chuẩn): - Sử dụng các kiểm định phi tham số ĐẶNG THỊ THU HƯƠNG 3 LỰA CHỌN PHẦN MỀM XỬ LÝ SỐ LIỆU - Người nghiên cứu cần có kiến thức thống kê cơ bản, biết cách thiết kế thí nghiệm hợp lý và lựa chọn thủ tục thống kê phù hợp để xử lý số liệu. - Biết cách sử dụng các phần mềm xử lý thống kê để hỗ trợ Tiêu chí lựa chọn phần mềm: Giao diện thân thiện, dễ sử dụng, nhanh, đơn giản (Excel, SPSS, SAS, STATITICA, STATGRAPHICS, MINITAB, R, SIGMASTAT, DX,) – Có những phần mềm miễn phí, phần mềm bản quyền (bản dùng thử, bản crack) – Tất cả các phần mềm đều xử lý được số liệu với những thủ tục thống kê cơ bản, và có điểm mạnh về một mảng nào đó. Người nghiên cứu tự chọn cho mình một phần mềm phù hợp và khi trình bày báo cáo, bài báo khoa học cần chỉ rõ: số liệu đã được xử lý và biểu đồ, đồ thị đã được vẽ bằng phần mềm nào (nêu nguồn gốc (tác giả bản quyền của phần mềm đó), phiên bản, thủ tục thống kê nào đã được áp dụng,..) ĐẶNG THỊ THU HƯƠNG 4 THU THẬP SỐ LIỆU • Khi thu thập số liệu, người nghiên cứu cần xác định trước phần mềm xử lý số liệu mà mình sẽ sử dụng, thủ tục thống kê mà mình sẽ áp dụng để có cách nhập số liệu cho hợp lý. • Các số liệu nên nhập trước trong file Excel (thường nhập theo cột) – Xem file excel đính kèm ĐẶNG THỊ THU HƯƠNG 5 Theo mục tiêu của tình huống nghiên cứu, tác giả chọn MS- Excel 2013, STATISTICA để vẽ biểu đồ và xử lý số liệu Thủ tục thống kê cần áp dụng: - Tính giá trị trung bình và độ lệch chuẩn (thống kê mô tả (Descriptive Statistic trong Excel hoặc STATISTICA hay đơn giản là dùng hàm AVERAGE và STDEV trong excel). - So sánh các giá trị trung bình để chỉ ra sự khác biệt có ý nghĩa thống kê: Do có 3 nhóm mẫu (A, B, C) nên chọn ONE WAY ANOVA – VÀ TEST POST HOC để kiểm tra sự khác biệt giữa các gía trị trung bình - Để đánh giá mối tương quan giữa chỉ tiêu đánh giá và thời gian bảo quản đồng thời biết được xu hướng tăng (giảm) của chỉ tiêu đánh giá theo thời gian – sử dụng Linear Regression ĐẶNG THỊ THU HƯƠNG 6 Bảng số liệu nhập trong excel để xử lý thống kê HƯỚNG DẪN SỬ DỤNG STATISTICA ĐẶNG THỊ THU HƯƠNG 7 Tác giả sử dụng STATISTICA software (Version 10.0, StatSoft, Inc. 2300 East 14th Street Tulsa, OK 74104 USA); Tình huống áp dụng (file EXCEL đính kèm) GIAO DIỆN CỦA STATISTICA ĐẶNG THỊ THU HƯƠNG 8 BƯỚC 1: KHAI BÁO BIẾN Nhấp chuột phải vào vị trí biến cần khai báo - nếu khai báo mới thường bắt đầu từ Var1- chọn Variable Spec ĐẶNG THỊ THU HƯƠNG 9 BƯỚC 2 Tại cửa sổ khai báo thông tin biến – Nhấp chuột vào vị trí All Specs để khai báo nhiều biến cùng một lúc- Tên biến có thể chọn general hoặc number Chỉ tiêu đánh giá chọn dữ liệu number ĐẶNG THỊ THU HƯƠNG 10 BƯỚC 3 Khai báo cùng lúc tất cả các biến ĐẶNG THỊ THU HƯƠNG 11 Nhập số liệu vào STATISTICA ĐẶNG THỊ THU HƯƠNG 12 • Về mặt lý thuyết, cần phân tích one way ANOVA để biết có sự khác biệt có ý nghĩa giữa các giá trị trung bình hay không, nếu có sẽ tiếp tục phân tích Post Hoc để chỉ cụ thể sự khác biệt. • Với STATISTICA - Sự khác biệt giữa các giá trị trung bình được thể hiện trong bảng kết quả (màu đỏ) • Khi phân tích phương sai một yếu tố: • Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên. • Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn. • Phương sai của các nhóm so sánh phải đồng nhất ĐẶNG THỊ THU HƯƠNG 13 Để biết được có sự khác biệt về chỉ tiêu đánh giá giữa các mẫu trong cùng một thời gian bảo quản hay không, lần lượt từ tuần 0,1,2,3,4 thực hiện như sau: - Chọn statistics- basic statistics- breakdown &one-way ANOVA-OK. ĐẶNG THỊ THU HƯƠNG 14 - Trong hộp breakdown – chọn Variables – phần biến phụ thuộc (dependent) chọn Y0, nhóm biến cần so sánh chọn MẪU- OK- OK ĐẶNG THỊ THU HƯƠNG 15 Trong hộp STATISTICS by Groups chọn Analysis of Variance. Kết quả cho thấy có sự khác biệt thống kê giữa các giá trị trung bình (chữ màu đỏ), p=0,03 ĐẶNG THỊ THU HƯƠNG 16 ĐẶNG THỊ THU HƯƠNG 17 Trong hộp STATISTICS by Groups chọn Levene tests để kiểm tra xem phương sai của 3 nhóm mẫu là đồng nhất hay không? Kết quả cho thấy có sự đồng nhất giữa các phương sai, p=0,07 - Trong hôp Post Hoc test chọn Test TUKEY HD TEST. Sử dụng kiểm định nào là tuỳ thuộc vào mục đích của nhà nghiên cứu và tình hình thực tế nghiên cứu. Khi trình bày kết quả cần nói rõ kết quả đưa ra được thực hiện bởi kiểm định nào - Thực hiện tương tự với các mốc thời gian, 1, 2,3,4 tuần, ĐẶNG THỊ THU HƯƠNG 18 Tuần 0: Chỉ tiêu đánh giá của mẫu A khác biệt có ý nghĩa (p<0.05) so với mẫu B và C - Mẫu B và C không khác nhau Tuần 1: Chỉ tiêu đánh giá của 3 mẫu A, B, C hoàn toàn khác biệt (p<0.05) Tuần 2: Chỉ tiêu đánh giá của 3 mẫu A, B, C hoàn toàn khác biệt (p<0.05) Tuần 3: Chỉ tiêu đánh giá của mẫu A khác biệt có ý nghĩa (p<0.05) so với mẫu B và C - Mẫu B và C không khác nhau Tuần 4: Chỉ tiêu đánh giá của 3 mẫu A, B, C hoàn toàn khác biệt (p<0.05) ĐẶNG THỊ THU HƯƠNG 19 ĐẶNG THỊ THU HƯƠNG 20 Thực hiện tương tự để xác định xem có sự khác biệt về chỉ tiêu đánh giá trong cùng một mẫu theo thời gian bảo quản hay không. Kết quả thể hiện như bảng bên. Kết quả cho thấy cả 3 mẫu đều có sự khác biệt về chỉ tiêu đánh giá giữa các thời gian bảo quản khác nhau Để đánh giá sự tương quan, chọn Multiple Linear Regression – Variables – biến phụ thuộc (chọn YA), biến độc lập chọn THOI GIAN- OK-OK ĐẶNG THỊ THU HƯƠNG 21 Hoặc chọn Summary: Regression Result ĐẶNG THỊ THU HƯƠNG 22 Kết luận: Theo thời gian chỉ tiêu đánh giá của mẫu A có xu hướng tăng (R= 0,99; p<0,0001) Để vẽ biểu đồ trên STATISTICA Trong hộp Statistics by Groups chọn Descripves – Categozied box &whisker – chọn dạng biểu đồ loại gì (trong hộp Box-Whisker)- thường chọn Mean/SD/1.96*SD ĐẶNG THỊ THU HƯƠNG 23 Chọn Graphs – Scatterplot-OK- chọn trục X, Y- OK ĐẶNG THỊ THU HƯƠNG 24 ĐẶNG THỊ THU HƯƠNG 25 Kết quả về sự khác biệt giữa giá trị trung bình của chỉ tiêu đánh giá thuộc nhóm A theo thời gian bảo quản và mối tương quan giữa chỉ tiêu đánh giá với thời gian bảo quản được thể hiện ở hình a và b (sử dụng STATISTICA) a b KẾT QUẢ THỂ HIỆN CHO TỪNG NHÓM MẪU TỔNG HỢP KẾT QUẢ (Sử dụng EXCEL) ĐẶNG THỊ THU HƯƠNG 26 35.00 40.00 45.00 50.00 55.00 60.00 W0 W1 W2 W3 W4 C h ỉ ti ê u đ á n h g iá Y Thời gian bảo quản (tuần) A B C - Vì độ lệch chuẩn quá bé nên không thể hiện rõ trên biểu đồ - Với đồ thị đường gấp khúc có thể sử dụng các chữ cái a,b,c để chỉ sự khác biệt hoặc không thể hiện nhưng khi bình luận cần giải thích rõ.
File đính kèm:
- bai_giang_xu_ly_va_trinh_bay_so_lieu.pdf