Cách tính phương sai trong thống kê

Mục lục:

Anonim

Một trong những khái niệm cơ bản nhất trong thống kê là trung bình, hoặc trung bình số học, của một tập hợp các số. Giá trị trung bình biểu thị một giá trị trung tâm cho tập dữ liệu. Các phương sai của một tập dữ liệu đo khoảng cách các phần tử của tập dữ liệu đó được trải ra từ giá trị trung bình. Các tập dữ liệu trong đó các số gần với giá trị trung bình sẽ có phương sai thấp. Những tập hợp trong đó các số cao hơn hoặc thấp hơn nhiều so với giá trị trung bình sẽ có phương sai cao.

Tính giá trị trung bình của tập dữ liệu

Tính toán bình phương bình phương

Bước tiếp theo liên quan đến việc tính toán sự khác biệt giữa từng yếu tố trong tập dữ liệu và giá trị trung bình. Vì một số phần tử sẽ cao hơn giá trị trung bình và một số phần tử sẽ thấp hơn, phép tính phương sai sử dụng bình phương của sự khác biệt.

Bán hàng ngày 1 - Doanh số trung bình: $ 62.000 - $ 65414,29 = (- $ 3,414,29); (-3,414,29)2 = 11,657,346.94

Bán hàng ngày 2 - Doanh số trung bình: $ 64,800- $ 65414,29 = (- $ 614,29); (-1414,29)2 = 377,346.94

Bán hàng ngày 3 - Doanh số trung bình: $ 62,600 - $ 65414,29 = (- $ 2,814,29); (-2.814,29)2 = 7,920,204.08

Bán hàng ngày 4 - Doanh số trung bình: $ 69,200 - $ 65414,29 = (+ $ 3,785,71); (+3,785,71)2 = 14,331,632.65

Bán hàng ngày 5 - Doanh số trung bình: 66.000 đô la - 65414,29 đô la = (+ $ 585,71); (+585,71)2 = 343,061.22

Bán hàng ngày 6 - Doanh số trung bình: $ 63,900 - $ 65414,29 = (- $ 1,514,29); (-1,514,29)2 = 2,293,061.22

Bán hàng ngày 7 - Doanh số trung bình: $ 69,400 - $ 65414,29 = (+ $ 3,985,71); (+3,985,71)2 = 15,885,918.37

CHÚ THÍCH: Sự khác biệt bình phương không được đo bằng đô la. Những con số này được sử dụng trong bước tiếp theo để tính toán phương sai.

Phương sai và độ lệch chuẩn

Phương sai được định nghĩa là giá trị trung bình của chênh lệch bình phương.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Vì phương sai sử dụng bình phương của sự khác biệt, căn bậc hai của phương sai sẽ cho một dấu hiệu rõ ràng hơn về sự lây lan thực tế. Trong thống kê, căn bậc hai của phương sai được gọi là độ lệch chuẩn.

SQRT (7.544.081.63) = 2.746,65 đô la

Sử dụng cho phương sai và độ lệch chuẩn

Cả phương sai và độ lệch chuẩn đều rất hữu ích trong phân tích thống kê. Phương sai đo lường mức độ lây lan tổng thể của một tập dữ liệu từ giá trị trung bình. Độ lệch chuẩn giúp phát hiện ngoại lệhoặc các phần tử của tập dữ liệu đi quá xa giá trị trung bình.

Trong dữ liệu được đặt ở trên, phương sai khá cao, chỉ có hai tổng doanh số hàng ngày đạt tới mức $ 1.000 trung bình. Tập dữ liệu cũng cho thấy hai trong số bảy tổng doanh số hàng ngày nhiều hơn một độ lệch chuẩn trên giá trị trung bình, trong khi hai số khác có nhiều hơn một độ lệch chuẩn dưới giá trị trung bình.