Lấy mẫu đề cập đến hành động chọn một số mục cụ thể từ một tập hợp dữ liệu lớn để phân tích thêm. Nghiên cứu kinh doanh thường tạo ra số lượng lớn dữ liệu, đặc biệt là trong nghiên cứu tập trung vào thị trường như nhân khẩu học. Các kỹ thuật lấy mẫu trong nghiên cứu kinh doanh cho phép các nhà nghiên cứu làm việc với một tập hợp dữ liệu dễ quản lý hơn mà họ tin là đại diện chính xác cho các xu hướng trong bộ sưu tập lớn hơn.
Nghiên cứu chính
Các doanh nghiệp có được dữ liệu nghiên cứu để lấy mẫu theo hai cách riêng biệt. Nghiên cứu đầu tiên, liên quan đến việc đào dữ liệu từ các nguồn của nó. Khảo sát là hình thức nghiên cứu chính phổ biến nhất, cho dù được tiến hành trực tiếp, qua điện thoại, qua Internet hoặc bằng bất kỳ phương tiện nào khác. Kết quả nghiên cứu chính là độc quyền, có nghĩa là không có công ty nào khác có quyền truy cập vào kết quả nghiên cứu chính trừ khi được nhà nghiên cứu cấp cụ thể hoặc cung cấp cho công chúng.
Nghiên cứu thứ cấp
Khi kết quả nghiên cứu chính được chia sẻ với các nhà nghiên cứu khác, các nhà nghiên cứu khác đang thực hiện nghiên cứu thứ cấp. Nghiên cứu thứ cấp về cơ bản dựa vào nỗ lực của những người khác đã dành thời gian để biên soạn các bộ dữ liệu lớn có liên quan và có giá trị. Tra cứu số liệu thu nhập trung bình từ Cục Thống kê Lao động là một ví dụ về nghiên cứu thứ cấp. Vì cục đã thực hiện khảo sát và tổng hợp dữ liệu trên diện rộng, các nhà nghiên cứu kinh doanh khác có thể tận dụng dữ liệu với ít hoặc không mất phí.
Lấy mẫu ngẫu nhiên
Lấy mẫu ngẫu nhiên liên quan đến việc chọn một số lượng nhất định các mục dữ liệu hoàn toàn ngẫu nhiên, sau đó sử dụng mẫu để phân tích thêm. Lấy mẫu ngẫu nhiên có thể là một kỹ thuật hiệu quả khi phân tích các bộ dữ liệu khá đồng nhất. Hãy tưởng tượng một công ty đang tìm cách xác định tỷ lệ phần trăm những người được chẩn đoán mắc bệnh béo phì ở một tiểu bang cụ thể. Thay vì làm việc với một tập hợp dữ liệu gồm vài triệu mục, công ty có thể phân tích hợp lý một mẫu ngẫu nhiên gồm vài trăm mục để đến một con số gần đúng với thống kê của toàn bộ tập dữ liệu.
Lấy mẫu tên thứ n
Lấy mẫu tên thứ N, còn được gọi là lấy mẫu có hệ thống, tương tự như lấy mẫu ngẫu nhiên, ngoại trừ việc nó làm giảm ảnh hưởng của việc lựa chọn dữ liệu tùy ý. Lấy mẫu có hệ thống liên quan đến việc chọn mọi mục nhập dữ liệu thứ n để đưa vào mẫu. Ví dụ: nếu bạn có một bộ dữ liệu gồm một triệu phản hồi khảo sát, bạn có thể chọn mỗi mục thứ một nghìn để đưa vào một mẫu, để lại cho bạn một mẫu dễ quản lý hơn với một nghìn mục.
Lấy mẫu có kiểm soát
Lấy mẫu có kiểm soát lấy các mẫu đặc biệt cao từ một bộ dữ liệu khá không đồng nhất. Lấy mẫu có kiểm soát là có giá trị nhất khi thực hiện nghiên cứu thứ cấp, vì nghiên cứu chính có thể được thiết kế để chỉ nhắm mục tiêu người trả lời cụ thể nếu muốn.
Hãy tưởng tượng một công ty mua một bộ dữ liệu lớn chứa thông tin về độ tuổi, dân tộc, trình độ học vấn và thu nhập của người trả lời khảo sát. Nếu một công ty muốn xác định mức thu nhập trung bình cho một nhóm tuổi nhất định, công ty có thể xây dựng một mẫu chỉ bao gồm các mục đáp ứng các tiêu chí độ tuổi cụ thể trước khi tính toán thu nhập.