Việcnghiên cứu thống kê liên quan trực tiếp đến các tập dữ liệu (dataset). Bài họcnày mô tả 2 kiểu tập dữ liệu quan trọng là Tổngthể (populations)Mẫu (Samples).Cuối bài học sẽ là một ví dụ về cách lấy mẫu ngẫu nhiên bằng Excel.

Đang xem: Bài 1: tổng thể là gì, Đặc trưng và ví dụ khái niệm tổng thể, mẫu và chọn mẫu

Tổng thể vs Mẫu

Sựkhác biệt chính giữa một tổng thể và mẫu là cách các quan sát (observation) đượcgán vào tập dữ liệu như thế nào

Một tổng thể bao gồm tất cả các thành phần từ một tập dữ liệuMột mẫu bao gồm một hay nhiều quan sát được rút ra từ tổng thể

Tùythuộc vào phương pháp lấy mẫu, một mẫu có thể có ít, bằng, hoặc nhiều quan sáthơn tổng thể. Từ một tổng thể, ta có thể lấy ra nhiều mẫu khác nhau.

Ngoàira, còn có thể kể đến những sự khác biệt giữa Tổng thể và Mẫu như sau:

Các đặc tính của tổng thể và mẫu được kí hiệu khác nhau. Chẳng hạn, trung bình của tổng thể được kí hiệu là

*

, nhưng trung bình của mẫu được kí hiệu là

*

Một số công thức sẽ khác nhau khi áp dụng cho Tổng thể và Mẫu. Chẳng hạn như công thức tính độ lệch chuẩn mà chúng ta sẽ học ở những bài sau.

Lấy mẫu ngẫu nhiên là gì?

Lấy mẫu là quá trình chọn lọc cácthành phần của mẫu từ một tổng thể. Lấy mẫu ngẫu nhiên là phương pháp lấy mẫucó những đặc tính sau đây:

Tổng thể bao gồm N đối tượng (objects)Mẫu bao gồm n đối tượngTất cả những mẫu có thể của n đối tượng đều có khả năng xảyra ngang nhau

Một lợi ích quan trọng của việc lấy mẫungẫu nhiên là nó cho phép các nhà nghiên cứu sử dụng các phương pháp thống kê đểphân tích kết quả mẫu. Ví dụ, cho một mẫu ngẫu nhiên, các nhà nghiên cứu có thểsử dụng các phương pháp thống kê để xác định khoảng tin cậy xung quanh trung bình cộng của mẫu. Các phương phápthống thê phân tích sẽ không phù hợp để sử dụng cho các mẫu không ngẫu nhiên.

Xem thêm: Ổ Ssd Là Gì – Ổ Cứng Ssd Là Gì

Có nhiều cách để lấy mẫu ngẫu nhiên.Một trong số đó là sử dụng phương pháp xổ số. Mỗi phần tử của Tổng thể N đượcgán cho một con số duy nhất. Các con số được đặt trong một cái rổ và được trộnkĩ. Sau đó, một người được bịt mắt kín lần lượt chọn ra n con số. Các phần tử củaTổng thể có số được trọn sẽ được dùng ở trong mẫu.

Cách chọn mẫu ngẫu nhiên bằng Excel.

Giả sử ta có một tập dữ liệu về việc bán nước mía của Thảo trong năm 2017. Download ở đây.

Xem thêm: Tặng Ad # Tiểu Cường Là Gì ? Tại Sao Gián Lại Được Gọi Là Tiểu Cường

Bây giờ, muốn chọn ngẫu nhiên một mẫutrong tổng thể này, ta cần làm thế nào.

Bước 1: Thêm một cột, có tiêu đề là RandomID trước cột NgàyBước 2: dùng hàm RAND() để tự động lấy các giá trị ngẫu nhiên từ 0 – 1 cho cột nàyBước 3: Sắp xếp các giá trị trong cột RandomID theo thứ tự từ nhỏ đến lớn

Ta có được một tập dữ liệu bị trộn lẫn một cách ngẫu nhiên. Giờ đây, ta chỉ cần chọn lấy một lượng thành phần mà chúng ta cần để đưa vào mẫu:

Leave a Reply

Your email address will not be published. Required fields are marked *