Giáo trình môn Nguyên lý thống kê
Tổng thể thống kê là hiện tượng số lớn, bao gồm những đơn vị, hoặc phần tử cấu
thành hiện tượng, cần được quan sát, phân tích mặt lượng của chúng. Các đơn vị, phần tử
này được gọi là các đơn vị tổng thể.
Như vậy, muốn xác định được một tổng thể thống kê, ta cần phải xác định được tất cả
các đơn vị tổng thể của nó. Thực chất của việc xác định tổng thể thống kê là việc xác định
các đơn vị thuộc tổng thể.
Tổng thể thống kê là một khái niệm quan trọng của thống kê học. Nó giúp ta xác định
rõ phạm vi của hiện tượng đang là đối tượng của một nghiên cứu thống kê cụ thể nào đó
Trong nhiều trường hợp, các đơn vị của một tổng thể được biểu hiện một cách rõ
ràng, dễ xác định. Ta gọi đó là tổng thể bộc lộ. Ví dụ như số nhân khẩu của một địa phương,
số xe máy được cấp đăng ký trong một tháng . Ngược lại, một tổng thể mà các đơn vị của
nó không được nhận biết một cách trực tiếp, ranh giới của tổng thể không rõ ràng được gọi là
tổng thể tiềm ẩn. Loại này thường gặp nhiều trong lĩnh vực xã hội, ví dụ: Tổng thể những
người say mê nhạc cổ điển, tổng thể người mê tín dị đoan . Việc phân chia này có liên quan
trực tiếp đến việc xác định tổng thể. Thông thường, việc xác định các đơn vị của một tổng
thể bộc lộ không gặp nhiều khó khăn do chúng được định nghĩa rõ ràng, có ranh giới xác
định với các đơn vị khác,. Trong khi đó, việc tìm được đầy đủ, chính xác các đơn vị của một
tổng thể tiềm ẩn lại gặp nhiều khó khăn hơn, việc nhầm lẫn, bỏ sót các đơn vị trong tổng thể
dễ xảy ra.
Tóm tắt nội dung tài liệu: Giáo trình môn Nguyên lý thống kê
1 LỜI NÓI ĐẦU Tập bài giảng được viết nhằm đáp ứng nhu cầu giảng dạy và học tập của giáo viên cũng như sinh viên bộ môn Nguyên lý thống kê. - Đối tượng sử dụng tập bài giảng : Sinh viên cao đẳng ngành kế toán và quản trị kinh doanh - Mục đích yêu cầu đặt ra cho đối tượng sử dụng tập bài giảng: + Hiểu rõ được thống kê học và sử dụng thành thạo các công cụ của thống kê + Chủ động nghiên cứu các kiến thức có trong tập bài giảng - Cấu trúc cuốn tập bài giảng gồm có 5 chương. - Sơ lược về các kiến thức chính sẽ trình bày trong tập bài giảng : Chương 1 MỘT SỐ VẤN ĐỀ CHUNG VỀ THỐNG KÊ HỌC Chương 2 TỔNG HỢP THỐNG KÊ Chương 3 NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG Chương 4 PHƯƠNG PHÁP PHÂN TÍCH DÃY SỐ THỜI GIAN Chương 5 PHÂN TÍCH CÁC NHÂN TỐ ẢNH HƯỞNG BẰNG PHƯƠNG PHÁP CHỈ SỐ - Hướng dẫn sử dụng tập bài giảng : Sinh viên chủ động nghiên cứu các kiến thức có trong tập bài giảng Chương 1 MỘT SỐ VẤN ĐỀ CHUNG VỀ THỐNG KÊ HỌC Mục tiêu: Sau khi học xong chương này, học sinh có khả năg: - Hiểu được những vấn đề chung của tổng hợp thống kê như: + Phân tổ thống kê + Bảng thống kê và đồ thị - Sử dụng được những công cụ phân tổ thống kê, lập được bảng và vẽ được đồ thị thống kê vào điều tra thống kê một mẫu 2 1.1 ĐỐI TƯỢNG NGHIÊN CỨU CỦA THỐNG KÊ HỌC 1.1.1 Sơ lược lịch sử phát triển và vai trò của thống kê trong đời sống xã hội. Thống kê học ra đời, phát triển từ nhu cầu thực tiễn của xã hội và là một trong những môn khoa học xã hội có lịch sử lâu dài nhất. Đó là một quá trình phát triển không ngừng từ đơn giản đến phức tạp, được đúc rút dần thành lý luận khoa học và ngày nay đã trở thành một môn khoa học độc lập. Ngay từ thời cổ đại, con người đã biết chú ý tới việc đăng ký, ghi chép và tính toán số người trong bộ tộc, số súc vật, số người có thể huy động phục vụ các cuộc chiến tranh giữa các bộ tộc, số người được tham gia ăn chia phân phối của cải thu được... Mặc dù việc ghi chép còn rất giản đơn với phạm vi hẹp, nhưng đó chính là những cơ sở thực tiễn ban đầu của thống kê học. Trong xã hội phong kiến, hầu hết các quốc gia ở châu Á, châu Âu đều có tổ chức việc đăng ký, kê khai về số dân, về ruộng đất, tài sản... với phạm vi rộng hơn, có tính chất thống kê rõ hơn. Tuy nhiên, các đăng ký này còn mang tính tự phát, thiếu khoa học. Thống kê đã có một bước phát triển quan trọng, nhưng vẫn chưa thực sự hình thành một môn khoa học độc lập. Sự ra đời và phát triển mạnh mẽ của phương thức sản xuất tư bản chủ nghĩa đòi hỏi các nhà khoa học phải nghiên cứu lý luận cũng như phương pháp thu thập, tính toán và phân tích về mặt lượng các hiện tượng kinh tế - xã hội. Năm 1660, nhà kinh tế học người Đức H.Conhring (1606-1681) đã giảng về phương pháp nghiên cứu hiện tượng xã hội dựa vào các số liệu điều tra cụ thể. Năm 1682, William Petty (1623-1687), nhà kinh tế học người Anh đã xuất bản cuốn “Số học chính trị”. Đây là tác phẩm có tính phân tích thống kê đầu tiên, trong đó, tác giả nghiên cứu các hiện tượng xã hội bằng cách tổng hợp và so sánh các con số. KarMark đã gọi William Petty là người sáng lập ra môn thống kê học. Năm 1750, giáo sư người Đức G. Achenwall (1710-1772), lần đầu tiên dùng danh từ “Statistik” để chỉ phương pháp nghiên cứu nói trên và quan niệm đó là môn học so sánh các nước khác nhau về mọi mặt qua các số liệu thu thập được. Kể từ khi ra đời, thống kê ngày càng đóng vai trò quan trọng trong đời sống xã hội. Thông qua việc phát hiện, phản ánh những quy luật về lượng của hiện tượng, các con số thống kê giúp cho việc kiểm tra, giám sát, đánh giá các chương trình, kế hoạch và định hướng sự phát triển kinh tế - xã hội trong tương lai. Ngày nay, thống kê được coi là một trong những công cụ quản lý vĩ mô quan trọng, có vai trò cung cấp các thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng kế hoạch phát triển kinh tế - xã hội ngấn hạn và dài hạn. Đồng thời, các con số thống kê cũng là những cơ sở quan trọng nhất để kiểm điểm, đánh giá tình hình thực hiện các kế hoạch, chiến lược và các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân trong xã hội, mà còn phải xây dựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng các hoạt động kinh tế - xã hội của các tổ chức, đơn vị. 1.1.2 Đối tượng nghiên cứu của thống kê học Nghiên cứu quá trình hình thành và phát triển của thống kê cho thấy: thống kê học là một môn khoa học xã hội. Tuy nhiên, khác với các môn khoa học xã hội khác, thống kê học 3 không trực tiếp nghiên cứu mặt chất của hiện tượng, mà nó chỉ phản ánh bản chất, tính quy luật của hiện tượng thông qua các con số, các biểu hiện về lượng của hiện tượng. Điều đó có nghĩa là thống kê học phải sử dụng các con số về quy mô, kết cấu, quan hệ tỷ lệ, quan hệ so sánh, trình độ phát triển, trình độ phổ biến... của hiện tượng để phản ánh, biểu thị bản chất, tính quy luật của hiện tượng nghiên cứu trong những điều kiện, hoàn cảnh cụ thể. Như vậy, các con số thống kê không phải chung chung, trừu tượng, mà bao giờ cũng chứa đựng một nội dung kinh tế, chính trị, xã hội nhất định, giúp ta nhận thức được bản chất và quy luật của hiện tượng nghiên cứu. Theo quan điểm của triết học, chất và lượng là hai mặt không thể tách rời của mọi sự vật, hiện tượng, giữa chúng luôn tồn tại mối liên hệ biện chứng với nhau. Trong mối quan hệ đó, sự thay đổi về lượng quyết định sự biến đổi về chất. Quy luật lượng - chất của triết học đã chỉ rõ: mỗi lượng cụ thể đều gắn với một chất nhất định, khi lượng thay đổi và tích lũy đến một chừng mực nhất định thì chất thay đổi theo. Vì vậy, nghiên cứu mặt lượng của hiện tượng sẽ giúp cho việc nhận thức bản chất của hiện tượng. Có thể đánh giá thành tích sản xuất của một doanh nghiệp qua các con số thống kê về tổng số sản phẩm làm ra, giá trị sản xuất đạt được, tỷ lệ hoàn thành kế hoạch về sản xuất, giá thành đơn vị sản phẩm, năng suất lao động và thu nhập của người công nhân... Tuy nhiên, để có thể phản ánh được bản chất và quy luật phát triển của hiện tượng, các con số thống kê phải được tập hợp, thu thập trên một số lớn các hiện tượng cá biệt. Thống kê học coi tổng thể các hiện tượng cá biệt như một thể hoàn chỉnh và lấy đó làm đối tượng nghiên cứu. Mặt lượng của hiện tượng cá biệt thường chịu tác động của nhiều yếu tố, trong đó có cả những yếu tố tất nhiên và ngẫu nhiên. Mức độ và chiều hướng tác động của từng yếu tố này trên mỗi hiện tượng cá biệt rất khác nhau. Nếu chỉ thu thập số liệu trên một số ít hiện tượng thì khó có thể rút ra bản chất chung của hiện tượng, mà nhiều khi người ta chỉ tìm thấy những yếu tố ngẫu nhiên, không bản chất. Ngược lại, khi nghiên cứu trên một số lớn các hiện tượng cá biệt, các yếu tố ngẫu nhiên sẽ bù trừ, triệt tiêu nhau và khi đó, bản chất, quy luật phát triển của hiện tượng mới được bộc lộ rõ. Chẳng hạn, nghiên cứu tình hình sinh đẻ trong một tổng thể dân cư, ta thấy có nhiều cặp vợ chồng sinh toàn con trai, ngược lại cũng có nhiều gia đình chỉ có con gái. Nếu nghiên cứu trên một số ít gia đình, có thể thấy số bé trai được sinh ra nhiều hơn số bé gái hoặc ngược lại. Nhưng khi nghiên cứu trong cả tổng thể dân cư, với một số lớn cặp vợ chồng, những trường hợp sinh toàn con trai sẽ bị bù trừ bởi những cặp sinh toàn con gái. Khi đó, quy luật tự nhiên: số sinh trai và số sinh gái sấp sỉ bằng nhau theo tỷ lệ khoảng 103 - 104 bé trai trên 100 bé gái mới được bộc lộ rõ. Hiện tượng số lớn trong thống kê được hiểu là một tập hợp các hiện tượng cá biệt đủ bù trừ, triệt tiêu tác động của các yếu tố ngẫu nhiên. Giữa hiện tượng số lớn (tổng thể) và các hiện tượng cá biệt (đơn vị tổng thể) luôn tồn tại mối quan hệ biện chứng. Muốn nghiên cứu tổng thể, phải dựa trên cơ sở nghiên cứu từng đơn vị tổng thể. Mặt khác, trong quá trình phát triển không ngừng của xã hội, luôn nảy sinh những hiện tượng cá biệt mới, những điển hình tiên tiến hoặc lạc hậu. Sự nghiên cứu các hiện tượng cá biệt này sẽ giúp cho sự nhận thức bản chất của hiện đầy đủ, toàn diện và sâu sắc hơn. Vì vậy trong thống kê, nhất là thống kê kinh tế - xã hội, người ta thường kết hợp nghiên cứu hiện tượng số lớn với việc nghiên cứu hiện tượng cá biệt Đối tượng nghiên cứu của thống kê học bao giờ cũng tồn tại trong điều kiện thòi gian và địa điểm cụ thể. Trong điều kiện lịch sử khác nhau, các đặc điểm về chất và biểu hiện về lượng của hiện tượng cũng khác nhau, nhất là với các hiện tượng kinh tế - xã hội. Chẳng hạn, 4 trình độ hiện đại hóa, một trong những yếu tố ảnh hưởng trực tiếp đến năng suất lao động của người công nhân, lại rất khác nhau giữa các doanh nghiệp. Ngay trong cùng một đơn vị, cũng lại có thể khác nhau giữa các giai đoạn, các thời kỳ,... Thậm chí, giữa các bộ phận trong cùng một đơn vị, nhiều khi cũng tồn tại những khác biệt đảng kể. Vì vậy, các con số về năng suất lao động của người công nhân trong từng doanh nghiệp, từng thời kỳ khác nhau cũng có ý nghĩa khác nhau. Như vậy, khi sử dụng các số liệu thống kê phải luôn gắn nó trong điều kiện thời gian, địa điểm cụ thể của hiện tượng mà số liệu phản ánh. Từ các phân tích trên, có thể rút ra kết luận: Đối tượng nghiên cứu của thống kê học là mặt lượng trong sự liên hệ mật thiết với mặt chất của các hiện tượng số lớn, trong điều kiện thời gian và địa điểm cụ thể. 1.2 CÁC KHÁI NIỆM THƯỜNG DÙNG TRONG THỐNG KÊ 1.2.1 Tổng thể thống kê Tổng thể thống kê là hiện tượng số lớn, bao gồm những đơn vị, hoặc phần tử cấu thành hiện tượng, cần được quan sát, phân tích mặt lượng của chúng. Các đơn vị, phần tử này được gọi là các đơn vị tổng thể. Như vậy, muốn xác định được một tổng thể thống kê, ta cần phải xác định được tất cả các đơn vị tổng thể của nó. Thực chất của việc xác định tổng thể thống kê là việc xác định các đơn vị thuộc tổng thể. Tổng thể thống kê là một khái niệm quan trọng của thống kê học. Nó giúp ta xác định rõ phạm vi của hiện tượng đang là đối tượng của một nghiên cứu thống kê cụ thể nào đó Trong nhiều trường hợp, các đơn vị của một tổng thể được biểu hiện một cách rõ ràng, dễ xác định. Ta gọi đó là tổng thể bộc lộ. Ví dụ như số nhân khẩu của một địa phương, số xe máy được cấp đăng ký trong một tháng ... Ngược lại, một tổng thể mà các đơn vị của nó không được nhận biết một cách trực tiếp, ranh giới của tổng thể không rõ ràng được gọi là tổng thể tiềm ẩn. Loại này thường gặp nhiều trong lĩnh vực xã hội, ví dụ: Tổng thể những người say mê nhạc cổ điển, tổng thể người mê tín dị đoan .... Việc phân chia này có liên quan trực tiếp đến việc xác định tổng thể. Thông thường, việc xác định các đơn vị của một tổng thể bộc lộ không gặp nhiều khó khăn do chúng được định nghĩa rõ ràng, có ranh giới xác định với các đơn vị khác,. Trong khi đó, việc tìm được đầy đủ, chính xác các đơn vị của một tổng thể tiềm ẩn lại gặp nhiều khó khăn hơn, việc nhầm lẫn, bỏ sót các đơn vị trong tổng thể dễ xảy ra. Nếu xét theo mục đích nghiên cứu, ta có thể phân biệt hai loại tổng thể. Tổng thể đồng chất bao gồm những đơn vị có cùng chung những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. Tổng thể không đồng chất bao gồm những đơn vị khác nhau về loại hình, khác nhau về những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. Sự phân chia này có ý nghĩa rất quan trọng trong việc xác định tính đại diện của các thông số thống kê tính được. Các thông số này chỉ có ý nghĩa, đảm bảo tính đại diện khi được tính ra từ một tổng thể đồng chất. Nếu chúng được tính ra từ một tổng thể không đồng chất thì ỹ nghĩa, tính đại diện của chúng cho tổng thể giảm đi rất nhiều, thậm chí không sử dụng được. Ví dụ, khi nghiên cứu về thu nhập, ta thường sử dụng thông số thống kê là “thu nhập trung bình”. Tuy nhiên thu nhập trung bình chỉ có ý nghĩa và cũng chỉ đảm bảo tính đại diện cao khi được tính ra từ một tổng thể chỉ bao gồm những người có cùng chung những điều kiện làm việc, tính 5 chất công việc, như những người nông dân, những thương nhân... Nếu ta trộn cả nông dân và thương nhân lại với nhau, thì ý nghĩa, tính đại diện của “thu nhập trung bình” đã giảm đi rất nhiều. Ngoài ra, người ta còn phân biệt tổng thể chung bao gồm tất cả các đơn vị của hiện tượng nghiên cứu; tổng thể bộ phận là một phần của tổng thể chung. Trong thực tế thống kê, nhiều khi ranh giới của tổng thể còn có chỗ mập mờ, khó xác định chính xác, người ta phải quy ước một số loại đơn vị nào đó được đưa vào tổng thể, một số khác không được tính là đơn vị tổng thể. 1.2.2 Tiêu thức thống kê Các đơn vị tổng thể thường có nhiều đặc điểm khác nhau. Ví dụ, trong tổng thể dân mỗi người dân trong tổng thể dân cư có các đặc điểm như độ tuổi, giới tính, trình độ văn hóa, nghề nghiệp... Trong nghiên cứu thống kê, người ta chỉ chọn ra một số đặc điểm để nghiên cứu. Các đặc điểm này được gọi là tiêu thức thống kê. Như vậy, tiêu thức thống kê là một khái niệm chỉ đặc điểm của các đơn vị tổng thể được chọn ra để nghiên cứu. Tiêu thức thống kê được chia thành hai loại, tùy theo cách biểu hiện của nó. *) Tiêu thức thuộc tính Là loại tiêu thức không được biểu hiện trực tiếp bằng con số, mà các biểu hiện của nó được dùng để phản ánh loại hoặc tính chất của các đơn vị tổng thể. Ví dụ: giới tính, dân tộc, thành phần kinh tế ... Giới tính có hai biểu hiện: nam và nữ. Các biểu hiện này được dùng để chỉ rõ người này là nam giới, còn người kia là nữ giới. *) Tiêu thức số lượng Là loại tiêu thức có biểu hiện trực tiếp bằng con số. Đây là những con số phản ánh đặc trưng có thể cân đong, đo, đếm được của từng đơn vị tổng thể. Ví dụ: Chiều dài của cây cầu, số nhân khẩu trong gia đình, tiền lương tháng của mỗi người lao động... Mỗi con số này được gọi là một lượng biến. Các lượng biến chính là cơ sở để thực hiện các phép tính thống kê, như: cộng, trừ, nhân, chia, trung bình, tỷ lệ... Một tiêu thức chỉ có hai biểu hiện không trùng nhau trên một đơn vị tổng thể (ví dụ: tiêu thức giới tính chỉ có hai biểu hiện không trùng nhau là nam và nữ ) được gọi là tiêu thức thay phiên. Loại tiêu thức này có đặc điểm quan trọng là nếu một đơn vị tổng thể nào đó đã nhận biểu hiện này thì không nhận biểu hiện kia. Đây là loại tiêu thức có nhiều ứng dụng trong thực tế. Tiêu thức giúp xác định rõ từng đơn vị tổng thể cũng như tổng thể thống kê, nhờ đó ta có thể phân biệt đơn vị này với đơn vị khác, tổng thể này với tổng thể khác. 1.2.3 Chỉ tiêu thống kê Để biểu hiện rõ bản chất, quy luật của hiện tượng, thống kê phải tổng hợp các đặc điểm về lượng thành những con số của một số lớn hiện tượng trong điều kiện thời gian, không gian cụ thể. Ta gọi đó là chỉ tiêu thống kê. Như vậy, chỉ tiêu thống kê phản ánh mặt lượng gắn với chất của hiện tượng số lớn trong điều kiện thời gian, không gian cụ thể. 6 Ví dụ: Tổng sản phẩm trong nước (GDP) của Việt Nam năm 2002 theo giá thực tế là 536.098 tỷ đồng. Chỉ tiêu thống kê thường mang tính tổng hợp biểu hiện mặt lượng của nhiều đơn vị, hiện tượng cá biệt. Do đó, chỉ tiêu phản ánh những mối quan hệ chung của tất cả các ... x i 34 Qua các ví dụ trên, ta nhận thấy quyền số của số bình quân điều hoà thực ra không phải là một đại lượng giản đơn, mà là tích của 2 nhân tố: lượng biến (xi) với tần số các lượng biến đó fi, tức là Mi = xifi. Do đó, khi đem chia các quyền số Mi cho các lượng biến xi, ta tính ra được số đơn vị tổng thể: Như khi chia sản lượng mỗi tổ cho năng suất lao động mỗi tổ, sẽ được số công nhân tổ đó, chia số thời gian lao động cho số thời gian hao phí để sản xuất một đơn vị sản phẩm, sẽ tính được số sản phẩm. Như vậy, số bình quân điều hoà thường được vận dụng khi nào không có tài liệu về số đơn vị tổng thể, mà chỉ có tài liệu về các lượng biến và chỉ tiêu về tổng các lượng biến của tiêu thức. c. Số bình quân nhân Số bình quân nhân là số bình quân của những đại lượng có quan hệ tích số với nhau. Có hai công thức tính toán như sau: - Số bình quân nhân giản đơn được tính theo công thức: x x ... x x x n i n n21 (3.5) Trong đó: xi (i = 1, 2,..., n) – các lượng biến x - số bình quân - ký hiệu của tích Thí dụ: Tốc độ phát triển sản xuất của một xí nghiệp như sau: Năm 2001 so với năm 2000 bằng 116% Năm 2002 so với năm 2001 bằng 111% Năm 2003 so với năm 2002 bằng 112% Năm 2004 so với năm 2003 bằng 113% Năm 2005 so với năm 2004 bằng 112% Năm 2006 so với năm 2005 bằng 111% Ở đây, các tốc độ phát triển sản xuất (tức là số tương đối động thái) không cộng được với nhau để tính tốc độ phát triển bình quân, vì chúng là các số tương đối có gốc so sánh khác nhau. Nhưng chúng lại có quan hệ tích số với nhau, bởi vì tích của chúng sẽ cho ta một số tương đối động thái mới, nói lên tốc độ phát triển sản xuất của xí nghiệp trong thời kỳ dài hơn (xem chương VI, phần dãy số thời gian). Vì vậy, muốn tính tốc độ phát triển bình quân hàng năm về sản xuất của xí nghiệp, trước hết ta phải nhân các tốc độ phát triển sản xuất hàng năm, sau đó khai thác căn theo công thức (5.8) Cụ thể là: 6 1,11 1,12 1,13 1,12 1,11 1,16 x 35 Ta có: x = 1,125, có nghĩa là tốc độ phát triển sản xuất bình quân hàng năm của xí nghiệp là 1, 125 lần (hay 112,5%) - Số bình quân nhân gia quyền Khi các lượng biến (xi) có các tần số (fi) khác nhau, ta có công thức số bình quân nhân gia quyền (lúc này fi là quyền số): i ii n21 f f i f f n f 2 f 1 x x ... x x x (3.6) Công thức trên đây cũng được giải bằng phương pháp lôga hoá hai vế theo dạng tổng quát sau: Thí dụ: Trong thời gian 10 năm, tốc độ phát triển sản xuất của một xí nghiệp như sau: có 5 năm phát triển với tốc độ mỗi năm là 110%, có hai năm với tốc độ 125% và ba năm với tốc độ 115%. Để tính tốc độ phát triển sản xuất bình quân hàng năm, ta dùng công thức (5.9): 10 325 (1,15) x (1,25) (1,1) x Ta có: x = 1,144 (hay 114,4%) Số bình quân nhân được dùng trong trường hợp các lượng biến có quan hệ tích số với nhau. ứng dụng trong thống kê kinh tế xã hội, công thức số bình quân này thường chỉ dùng để tính các tốc độ phát triển bình quân. 3.3.3 Mốt Mốt là biểu hiện của một tiêu thức được gặp nhiều nhất trong một tổng thể hay trong một dãy số phân phối. Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất. Trị số của mốt không phụ thuộc vào trị số của tất cả các lượng biến trong dãy số, mà được xác định do sự sắp xếp các lượng biến trong dãy số này. Ví dụ: Có tài liệu phân tổ các gia đình công nhân viên chức trong một khu tập thể như sau: Bảng 3.3 Số nhân khẩu Số gia đình 1 10 2 30 3 75 4 45 5 20 6 15 7 trở lên 5 ∑ 200 36 Theo định nghĩa, ta có thể nhanh chóng xác định: mốt là số gia đình có 3 nhân khẩu, vì lượng biến này có tần số lớn nhất. Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó, trị số gần đúng của mốt tính theo công thức: )f - ( )f - ( f - h x 1M1M 1M M(min)M 00 0 oo oo o MM M o ff f M (3.7) Trong đó: M0 - ký hiệu của mốt (min)Mo x - giới hạn dưới của tổ có mốt oM h - trị số khoảng cách tổ có mốt 0M f - tần số của tổ có mốt 1M0 f - tần số của tổ đứng trước tổ có mốt 1M0 f - tần số của tổ đứng sau tổ có mốt Ví dụ: Theo tài liệu phân tổ công nhân theo năng suất lao động trong bảng 3, trước hết có thể xác định mốt ở vào tổ thứ tư (700 - 800 tấn), vì tổ này có tần số lớn nhất (80 công nhân). Từ đó xác định tiếp: (min)Mo x = 700; oM h = 100; 0M f = 80; 1M0f = 45; 1M0f = 30 Thay số liệu vào công thức (3.7): 41,2 700 85 35 100 700 30) - (80 45)- (80 45 - 80 100 700 M0 M0 = 741, 2 tấn Trong trường hợp dãy số lượng biến có khoảng cách tổ không đều nhau, mốt vẫn được tính theo công thức (4.8). Nhưng việc xác định tổ có mốt và tính toán không căn cứ vào tần số lớn nhất, mà căn cứ vào mật độ phân phối (tức là tỷ số giữa các tần số hoặc tần suất chia cho trị số khoảng cách tổ). Thí dụ: Bảng 3.4 Năng suất lao động (tấn) Trị số khoảng cách tổ (tấn) Số công nhân Mật độ phân phối (1) (2) (3) (4) 400 – 450 50 10 0,2 450 – 500 50 15 0,3 500 – 600 100 15 0,15 600 – 800 200 30 0,15 800 – 1200 400 5 0,0125 37 Như vậy, mốt ở tổ thứ hai là tổ có mật độ phân phối lớn nhất. Tính theo công thức (4.8) ta có: 0,25 0,1 50 450 0,15) - (0,3 0,2) - (0,3 0,2 - 0,3 50 450 M0 M0 = 450 + 20 = 470 tấn Trong nghiên cứu thống kê, mốt là mức độ có tác dụng bổ sung hoặc thay thế cho viẹc tính số bình quân cộng, trong trường hợp việc tính số bình quân này gặp khó khăn, không bảo đảm chính xác hoặc không có ý nghĩa. Mốt có khả năng nêu lên mức độ phổ biến nhất của hiện tượng, đồng thời bản thân nó lại không san bằng, bù trừ chênh lệch giữa các lượng biến. Như khi đăng ký giá cả một mặt hàng trên thị trường, có thể không cần tính theo số bình quân cộng, mà chỉ cần ghi giá phổ biến của mặt hàng trong thời gian đó. Có thể dùng mốt để xác định mức lương phổ biến nhất trong một xí nghiệp, tìm loại điểm nào của học sinh đạt được nhiều nhất sau một kỳ thi. Cũng có trường hợp việc tìm mốt bảo đảm được ý nghĩa thực tế hơn các tính toán khác, vì nó không chịu ảnh hưởng của tất cả các lượng biến, nhất là các lượng biến đột xuất (quá lớn hay quá nhỏ). Như một mức lương cao đột xuất có thể làm ảnh hưởng đến việc tính số bình quân cộng, nhưng không ảnh hưởng đến mốt. Nhưng cũng vì lý do trên, mốt có nhược điểm là kém nhạy bén đối với sự biến thiên của tiêu thức. Cho nên mốt chỉ được vận dụng đối với một tổng thể tương đối nhiều đơn vị. Mặt khác, nếu dãy số lượng biến có đặc điểm phân phối không bình thường (có quá nhiều điểm tập trung hoặc không có điểm chính tập trung các trị số) thì cũng không nên xác định mốt. Mốt còn có nhiều tác dụng trong việc tổ chức phục vụ nhu cầu của nhân dân được hợp lý. Các tổ chức sản xuất và thương nghiệp cần điều tra và cung ứng đầy đủ các mặt hàng tiêu thụ nhiều nhất, như cỡ số giầy, cỡ kiểu quần áo... Cuối cùng, mốt còn được dùng làm một trong các chỉ tiêu nêu lên đặc trưng của dãy số phân phối (xem phần sau của chương này). 3.3.4 Trung vị Số trung vị là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong một dãy số lượng biến. Số trung vị phân chia dãy số lượng biến thành hai phần (phần trên và phần dưới số trung vị), mỗi phần có cùng một số đơn vị tổng thể bằng nhau. Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến của đơn vị đứng ở vị trí thứ m + 1, tức là lượng biến xm+1. Giả sử có mức năng suất lao động của 5 công nhân: 40, 45, 50, 55 và 60 sản phẩm. Số trung vị là mức năng suất lao động của người công nhân thứ 3 (m + 1 = 2 15 + 1 = 3), tức là 50 sản phẩm. Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị căn cứ vào lượng biến của hai đơn vị đứng ở vị trí giữa nhất (đơn vị thứ m và m + 1) cộng lại và chia đôi, tức là 2 x x 1mm . 38 Ví dụ, có mức năng suất lao động của 6 công nhân: 40, 45, 50, 55, 60 và 65 sản phẩm. Số trung vị bằng 2 5550 = 52, 5 sản phẩm. Trong một dãy số lượng biến có khoảng cách tổ, muốn tìm số trung vị, trước hết phải xác định tổ có số trung vị. Đó là tổ có chứa lượng biến của đơn vị ở vị trí giữa trong tổng số các đơn vị của dãy số. Dùng phương pháp cộng dồn các tần số của các tổ thứ nhất, thứ hai, thứ ba... sẽ tìm ra được tần số tích luỹ bằng hoặc vượt một nửa tổng các tần số. Tổ tương ứng với tần số tích luỹ này chính là tổ có số trung vị. Sau đó, trị số gần đúng của số trung vị được tính theo công thức sau: Mef f Me 1)-(Me Me(min)Me S - 2h x (3.8) Trong đó: Me - ký hiệu số trung vị xMe(min) - giới hạn dưới của tổ có số trung vị hMe - trị số khoảng cách tổ có số trung vị f - tổng các tần số của dãy số lượng biến (số đơn vị tổng thể) S(Me-1) - tổng các tần số của các tổ đứng trước tổ có số trung vị fMe - tần số của tổ có số trung vị Lấy ví dụ theo tài liệu trong bảng 3. Tổng số công nhân là 200, vậy người công nhân ở vị trí giữa là công nhân thứ 100 và 101. Cộng dồn các tần số (xem bảng 7) ta xác định người công nhân thứ 100 và 101 thuộc vào tổ thứ tư và đó chính là tổ có số trung vị. Từ đó, tiếp tục xác định các ký hiệu: xMe(min) = 700; iMe = 100; f = 100; S(Me-1) = 85; fMe = 80 Thay số liệu vào công thức (5.11) tính ra: 18,75 700 80 15 100 700 80 85 - 2 200 100 700 Me Me = 718, 75 tấn Bảng 3.5 Năng suất lao động (kg) Số công nhân Tần số tích luỹ 400 – 500 10 10 500 – 600 30 40 600 – 700 45 85 700 – 800 80 165 800 – 900 30 195 900 – 1000 5 200 Cộng 200 39 Việc tính số trung vị, chủ yếu căn cứ vào sự sắp xếp theo thứ tự các lượng biến. Số trung vị cũng nêu lên mức độ đại biểu của hiện tượng, mà không san bằng bù trừ chênh lệch giữa các lượng biến. Cho nên nó có khả năng bổ sung hoặc thay thế cho số bình quân cộng, khi ta không có một cách chính xác toàn bộ các lượng biến. Chỉ cần bảo đảm được sự phân phối các dơn vị theo thứ tự lượng biến là có thể tính số trung vị, nhất là đối với các dãy số lượng biến có khoảng cách tổ mở và không đều đặn, việc tính số trung vị tỏ ra thuận lợi hơn. Giả sử ta có dãy số sau: Bảng 3.6 Năng suất lao động (tấn) Số công nhân) Dưới 50 10 50 – 60 30 60 – 85 40 85 – 110 15 110 trở lên 5 Mọi dãy số như trên làm cho việc tính số bình quân cộng phải dựa trên cơ sở giả định rất lớn, nhưng có thể thoạt trông mà xác định ngay rằng số trung vị nằm ở tổ thứ ba và nhanh chóng tính ra Me = 66, 25 tấn. Việc tính số trung vị cũng còn có tác dụng loại trừ ảnh hưởng của những lượng biến đột xuất. Chẳng hạn, một mức lương cao cá biệt trong dãy số lượng biến không làm ảnh hưởng đến việc đánh giá mức lương chung. Vì vậy, ta có thể dùng số trung vị khi tiêu thức nghiên cứu biến thiên quá nhiều, hoặc đối với một dãy số có quá ít đơn vị. Số trung vị cũng là một trong các chỉ tiêu dùng để nêu lên đặc trưng của một dãy số phân phối (xem phần sau của chương này). Một tính chất toán học đáng chú ý của số trung vị là: tổng các độ lệch tuyệt đối giữa các lượng biến với số trung vị là một trị số nhỏ nhất (so với bất kỳ tổng các độ lệch giữa các hiện tượng biến với một đại lượng nào khác - kể cả số bình quân cộng). Tức là: min f Me- x : haymin Me- x iii Tính chất trên đây được ứng dụng trong nhiều công tác kỹ thuật và phục vụ công cộng, như bố trí các nhà câu lạc bộ, nhà trẻ, cửa hàng, ống dẫn nước, trạm đỗ xe, ô tô buýt... sao cho được ở vị trí thuận lợi đẻ có thể phục vụ được nhiều người mà tiết kiệm nhất. 40 CÂU HỎI VÀ BÀI TẬP CHƯƠNG 3 Câu 1. Có lương bình quân 1 công nhân của các Doanh nghiệp trong tỉnh X vào ngày 31/12/2011 như sau. Lương bình quân (triệu đồng) Số doanh nghiệp 1.200 - 1.500 15 1.500 - 1.800 30 1.800 - 2.000 85 2.000 - 2.500 70 Yêu cầu: a. Tính giá trị hàng tồn kho trung bình b. Xác định Mốt của lương c. Xác định trung vị của lương Câu 2.Có số tài liệu thống kê về năng suất lao động trong một phân xưởng của doanh nghiệp X như sau: Năng suất lao động (kg) Số công nhân 100 – 200 5 200 – 300 15 300 – 400 40 400 – 500 75 500 – 600 50 600-700 20 Yêu cầu a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của năng suất lao động c. Tính Trung vị của năng suất lao động Câu 3. Có số tài liệu thống kê về năng suất lao động trong một phân xưởng của doanh nghiệp X như sau: Năng suất lao động (tạ) Số công nhân 100 – 200 5 200 – 300 15 300 – 400 40 400 – 500 75 500 – 600 50 600-700 20 Yêu cầu a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của năng suất lao động c. Tính Trung vị của năng suất lao động 41 Câu 4. Có mức tiền công của tổ 12 tại Doanh nghiệp B năm 2007. Mức tiền công (1.000đ) Số công nhân (Người) 1.000 - 1.200 20 1.200 -1.500 40 1.500-1.800 90 1.800 -2500 50 Yêu cầu: a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của tiền công c. Tính Trung vị của tiền công Câu 5. Có Năng suất lao động của Doanh nghiệp X năm 2008 như sau: Năng suất lao động (sản phẩm) Số công nhân (Người) 1.000 – 1.500 10 1.500 – 2.000 50 2.000 – 2.500 80 2.500 – 3.000 60 Yêu cầu: a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của năng suất lao động c. Tính Trung vị của năng suất lao động Câu 6. Có số tài liệu thống kê về năng suất lao động trong một phân xưởng của doanh nghiệp X như sau: Năng suất lao động (tấn) Số công nhân 0 – 200 10 200 – 400 20 400 – 600 75 600 – 800 50 800 – 1.000 30 1.000 – 1.200 10 Yêu cầu a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của năng suất lao động c. Tính Trung vị của năng suất lao động Câu 7: Có mức tiền lương của tổ 1 tại Doanh nghiệp A năm 2008. Mức tiền lương (đồng) Số công nhân (Người) 7000.000 – 10.000.000 20 10.000.000 – 15.000.000 40 15.000.000 - 20.000.000 90 20.000.000 – 25.000.000 50 Yêu cầu: a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của tiền lương c. Tính Trung vị của tiền lương 42 Câu 8: Có giá trị hàng tồn kho của các Doanh nghiệp trong tỉnh X vào ngày 31/12/2008 như sau. Gía trị hàng tồn kho (triệu đồng) Số doanh nghiệp 1.200 - 1.500 15 1.500 - 1.800 30 1.800 - 2.000 85 2.000 - 2.500 70 Yêu cầu: a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt của giá trị hàng tồn kho c. Tính Trung vị của giá trị hàng tồn kho Câu 9: Có mức tiền công của tổ 12 tại Doanh nghiệp B năm 2007. Mức tiền công (1.000đ) Số công nhân (Người) 10.000 – 12.000 20 12.000 -15.000 40 15.000-18.000 90 18.000 -25.000 50 Yêu cầu: a. Tính năng suất lao động bình quân của 1 công nhân trong phân xưởng b. Tính Mốt c. Tính Trung vị TÀI LIỆU THAM KHẢO 1. PGS.TS Nguyễn Thị Kim Thu, Giáo trình nguyên lý thống kê, Trường đại học Kinh tế quốc dân. Nhà xuất bản Giáo dục 1. PGS.TS Nguyễn Thị Kim Thu, Giáo trình thống kê doanh nghiệp, Trường đại học Kinh tế quốc dân. Nhà xuất bản Giáo dục 3. PGS.TS Nguyễn Phong Đài, Giáo trình thống kê kinh doanh , Trường đại học Kinh tế - Đại học quốc gia Hà Nội . Nhà xuất bản Giáo dục
File đính kèm:
- giao_trinh_mon_nguyen_ly_thong_ke.pdf