Cách tính độ chính xác của dữ liệu

Mục lục:

Anonim

Độ chính xác dữ liệu là một trong những cân nhắc quan trọng nhất khi tiến hành phân tích khoa học hoặc thống kê. Thường bị nhầm lẫn với khái niệm chính xác không kém phần quan trọng, bảng tương tự phi tiêu được khớp nối bởi Đại học Hawaii chứng minh mối quan hệ: các điểm dữ liệu chính xác trung bình với kết quả mong đợi bằng nhau, trong khi các điểm dữ liệu chính xác nằm sát nhau, ngay cả khi chúng không gần kết quả dự đoán. Theo Đại học Dartmouth, độ chính xác là thước đo độ tái lập của một tập hợp kết quả. Độ chính xác trong các tập dữ liệu là một khái niệm quan trọng ngay cả trong các nỗ lực liên quan đến công nghệ, như được thể hiện bởi Kenneth E. Foote và Donald J. Huebner với Đại học Texas-Austin trong một phân tích về Hệ thống thông tin địa lý. Tính toán chính xác là một bài tập khá đơn giản mặc dù hơi chủ quan.

Các mặt hàng bạn sẽ cần

  • Biểu diễn đồ họa của tập dữ liệu

  • Thông tin về các đơn vị liên quan thể hiện trong dữ liệu

  • Biên độ sai số tối thiểu cho phép trong thí nghiệm

Phát triển một đại diện trực quan của các điểm dữ liệu như một biểu đồ phân tán. Một biểu diễn trực quan rất đơn giản liên quan đến việc vẽ các giá trị biến phụ thuộc và độc lập tương ứng cho từng điểm dữ liệu trên hệ tọa độ Descartes.

Đánh giá các nhóm điểm dữ liệu và tìm kiếm các mẫu. Dữ liệu chính xác biểu hiện trong cụm các điểm dữ liệu, chỉ ra rằng các biến đầu vào tương tự có tương quan với các biến đầu ra tương tự.

Áp dụng thông tin về các đơn vị đo lường được sử dụng để thu thập dữ liệu để xác định khoảng cách trung bình giữa các điểm dữ liệu. Một phép đo thước đơn giản có thể được sử dụng để xác định khoảng cách giữa các điểm trên biểu đồ, sau đó được chuyển đổi bằng thang đo thuận tiện, tùy ý tương ứng với các đơn vị đo được sử dụng để tạo các điểm dữ liệu. Điều này sẽ cho phép tính chính xác của các điểm dữ liệu so với nhau bằng cách lấy trung bình của khoảng cách.

So sánh biên sai số tối thiểu cho phép trong thử nghiệm và độ chính xác trung bình của các điểm dữ liệu để xác định độ chính xác tổng thể tương đối của thử nghiệm. Các loại thử nghiệm khác nhau sẽ có khả năng chịu lỗi lớn hơn hoặc ít hơn: một dự án kỹ thuật có thể sẽ yêu cầu độ chính xác xuống các đơn vị rất nhỏ, trong khi một thử nghiệm xã hội có thể sẽ chịu đựng được nhiều phương sai hơn.

Lời khuyên

  • Cố gắng đánh giá thang đo đơn vị có khả năng trước khi tạo biểu diễn đồ họa của các điểm dữ liệu. Điều này sẽ giúp việc đánh giá độ chính xác trực quan dễ dàng hơn để xác định bất kỳ khu vực nào có độ chính xác hoặc độ chính xác đặc biệt đáng chú ý.

    Các mẫu dữ liệu rõ ràng xuất hiện trên một biểu diễn trực quan có tính biểu thị cao về độ chính xác và độ lặp lại của một thử nghiệm. Thử nghiệm tiếp tục sẽ thêm các điểm dữ liệu tiếp theo trong các cụm chính xác gần với các điểm đã tồn tại.

Cảnh báo

Đừng nhầm lẫn độ chính xác với độ chính xác. Nếu mục tiêu của một thử nghiệm là đạt được giá trị đầu ra trung bình cho tất cả các đầu vào và điều này đạt được bằng các giá trị trung bình từ -12 đến 14, thì điều này không chắc là một phép đo chính xác, mặc dù nó có thể chính xác. Một phép đo chính xác có thể dẫn đến tất cả các điểm dữ liệu phân cụm khoảng 17, sẽ không chính xác, nhưng chính xác và do đó có thể dự đoán được.