Chào mừng bạn đến với bài học về lý thuyết Thu thập và phân loại dữ liệu trong chương trình Toán 8 - Kết nối tri thức. Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản và quan trọng nhất về cách thu thập, tổ chức và phân tích dữ liệu thống kê.
Chúng ta sẽ cùng tìm hiểu về dấu hiệu thống kê, các phương pháp thu thập dữ liệu, cách lập bảng tần số và các khái niệm liên quan. Mục tiêu là giúp bạn hiểu rõ bản chất của vấn đề và áp dụng kiến thức vào giải quyết các bài tập thực tế.
Thu thập dữ liệu có thể là trực tiếp hoặc gián tiếp.
Thu thập dữ liệu có thể là trực tiếp hoặc gián tiếp.
- Thu thập dữ liệu trực tiếp là việc thu thập dữ liệu thông qua quan sát, làm thí nghiệm, lập bảng hỏi, phỏng vấn,…
- Thu thập dữ liệu gián tiếp là việc thu thập dữ liệu từ những nguồn sẵn như sách, báo, mạng Internet,…
Để có thể đưa ra các kết luận hợp lý, dữ liệu thu thập được phải đảm bảo tính đại diện cho toàn bộ đối tượng đang được quan tâm.
Số liệu có thể nhận giá trị tùy ý trong một khoảng nào đó được gọi là số liệu liên tục. Số liệu không phải là số liên tục được gọi là số liệu rời rạc.
Sơ đồ phân loại dữ liệu

Ví dụ:
Cho hai dãy dữ liệu như sau:
(1) Số học sinh các lớp 6 trong trường:
35 42 87 38 40 41 38.
(2) Tên món ăn yêu thích của các thành viên trong gia đình:
Bánh chưng, pizza, canh cua, gà rán, rau muống luộc, cá kho, rượu vang.
Trong các dãy dữ liệu trên, dãy (1) là dãy số liệu rời rạc. Giá trị 87 không hợp lý vì theo quy định, mỗi lớp ở bậc THCS thường có không quá 45 học sinh. Thực tế, do điều kiện khó khăn một số lớp có số học sinh nhiều hơn 45 nhưng không lớp nào có 87 học sinh. Do đó 87 là số liệu không hợp lí.
Dãy (2) là dãy dữ liệu không là số, không thể sắp xếp thứ tự. “Rượu vang” là dữ liệu không hợp lí vì đây không phải là tên món ăn mà là tên một loại đồ uống.

Trong chương trình Toán 8 - Kết nối tri thức, việc nắm vững lý thuyết Thu thập và phân loại dữ liệu là nền tảng quan trọng để hiểu và áp dụng các kiến thức thống kê cơ bản. Bài viết này sẽ trình bày chi tiết về các khái niệm, phương pháp và ví dụ minh họa để giúp bạn học tập hiệu quả.
Dấu hiệu thống kê là tập hợp những đối tượng có chung một thuộc tính nào đó mà ta quan tâm. Ví dụ, chiều cao của học sinh lớp 8A là một dấu hiệu thống kê.
Thu thập dữ liệu là quá trình tìm kiếm và ghi lại thông tin về dấu hiệu thống kê. Có hai phương pháp thu thập dữ liệu chính:
Việc lựa chọn phương pháp thu thập dữ liệu phù hợp phụ thuộc vào mục đích nghiên cứu và tính khả thi.
Sau khi thu thập dữ liệu, ta cần tổ chức chúng một cách có hệ thống để dễ dàng phân tích. Phương pháp phổ biến nhất là lập bảng tần số.
Bảng tần số là bảng thống kê cho biết các giá trị khác nhau của dấu hiệu và số lần xuất hiện của mỗi giá trị (tần số).
Ví dụ: Giả sử ta thu thập chiều cao của 10 học sinh lớp 8A (đơn vị cm): 150, 155, 160, 155, 165, 150, 160, 155, 170, 160.
| Chiều cao (cm) | Tần số (n) |
|---|---|
| 150 | 2 |
| 155 | 3 |
| 160 | 3 |
| 165 | 1 |
| 170 | 1 |
| Tổng | 10 |
Phân loại dữ liệu là quá trình chia các đối tượng trong dấu hiệu thống kê thành các nhóm khác nhau dựa trên một tiêu chí nào đó.
Ví dụ: Phân loại học sinh lớp 8A theo giới tính (nam, nữ) hoặc theo học lực (giỏi, khá, trung bình, yếu).
Để củng cố kiến thức, hãy giải các bài tập sau trong SGK Toán 8 - Kết nối tri thức:
Hy vọng bài viết này đã cung cấp cho bạn những kiến thức cơ bản và hữu ích về lý thuyết Thu thập và phân loại dữ liệu SGK Toán 8 - Kết nối tri thức. Chúc bạn học tập tốt!