Chào mừng bạn đến với bài học về lý thuyết Các số đặc trưng đo độ phân tán trong chương trình Toán 10 Kết nối tri thức.
Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản và quan trọng về cách đo lường mức độ phân tán của một tập dữ liệu.
Chúng ta sẽ cùng nhau tìm hiểu về các khái niệm như khoảng biến thiên, phương sai, độ lệch chuẩn và hệ số biến thiên.
1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ 2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN 3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP
1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ
a. Khoảng biến thiên
Khoảng biến thiên (hay biên độ) = Giá trị lớn nhất – Giá trị nhỏ nhất.
Ý nghĩa: Dùng để đo độ phân tán của mẫu số liệu: Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán (càng không đồng đều)
Nhận xét: Đơn giản, dễ tính toán nhưng bỏ qua thông tin từ các giá trị khác và bị ảnh hưởng bởi các giá trị bất thường.
b. Khoảng tứ phân vị
Khoảng tứ phân vị (hay độ trải giữa): \({\Delta _Q} = {Q_3} - {Q_1}\)
Ý nghĩa: Dùng để đo độ phân tán của mẫu số liệu: Khoảng tứ phân vị càng lớn thì mẫu số liệu càng phân tán (càng không đồng đều)
Nhận xét: Chỉ sử dụng thông tin của 50% số liệu chính giữa nhưng không bị ảnh hưởng bởi các giá trị bất thường.
2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
Có một vài số đặc trưng khác đo độ phân tán sử dụng thông tin của tất cả các giá trị trong mẫu. Hai trong số đó là phương sai và độ lệch chuẩn.
Cho mẫu số liệu \({x_1},{x_2},{x_3},...,{x_n}\), số trung bình là \(\overline x \)
Độ lệch của mỗi giá trị: \({x_i} - \overline x \)
Phương sai: \({s^2} = \frac{{{{({x_1} - \overline x )}^2} + {{({x_2} - \overline x )}^2} + ... + {{({x_n} - \overline x )}^2}}}{n}\)
Độ lệch chuẩn: \(s = \sqrt {{s^2}} \)
Ý nghĩa: Nếu số liệu càng phân tán thì phương sai và độ lệch chuẩn càng lớn
Chú ý: Phương sai của mẫu số liệu cho dạng bảng tần số:
\({s^2} = \frac{{{m_1}{{({x_1} - \overline x )}^2} + {m_2}{{({x_2} - \overline x )}^2} + ... + {m_k}{{({x_k} - \overline x )}^2}}}{n}\)
Với \({m_i}\) là tần số của giá trị \({x_i}\) và \(n = {m_1} + {m_2} + ... + {m_k}\)
3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP
+) Giá trị bất thường: là những giá trị quá lớn hoặc quá nhỏ so với đa số các giá trị khác.
+) Biểu đồ hộp

\( \Rightarrow x\) là giá trị bất thường nếu \(\left[ \begin{array}{l}x < {Q_1} - 1,5.{\Delta _Q}\\x > {Q_3} + 1,5.{\Delta _Q}\end{array} \right.\)
Trong thống kê, việc hiểu rõ mức độ phân tán của một tập dữ liệu là vô cùng quan trọng. Các số đặc trưng đo độ phân tán giúp chúng ta đánh giá xem các giá trị trong tập dữ liệu có xu hướng tập trung gần giá trị trung bình hay không, hay chúng phân tán rộng rãi.
Khoảng biến thiên là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong một tập dữ liệu. Nó cho biết phạm vi mà các giá trị dữ liệu trải rộng. Công thức tính khoảng biến thiên (R) như sau:
R = Xmax - Xmin
Ví dụ: Cho tập dữ liệu: 2, 5, 8, 11, 15. Khoảng biến thiên là 15 - 2 = 13.
Phương sai đo lường mức độ phân tán của các giá trị dữ liệu so với giá trị trung bình. Phương sai được tính bằng trung bình cộng của các bình phương độ lệch của mỗi giá trị so với giá trị trung bình.
Công thức tính phương sai (σ2) như sau:
σ2 = ∑(xi - μ)2 / N
Trong đó:
Ví dụ: Cho tập dữ liệu: 2, 5, 8, 11, 15. Giá trị trung bình μ = 8.2. Phương sai là:
σ2 = [(2-8.2)2 + (5-8.2)2 + (8-8.2)2 + (11-8.2)2 + (15-8.2)2] / 5 = 23.24
Độ lệch chuẩn là căn bậc hai của phương sai. Nó cũng đo lường mức độ phân tán của các giá trị dữ liệu so với giá trị trung bình, nhưng được biểu diễn bằng cùng đơn vị với dữ liệu gốc, giúp dễ dàng diễn giải hơn.
Công thức tính độ lệch chuẩn (σ) như sau:
σ = √σ2
Ví dụ: Sử dụng kết quả phương sai ở trên, độ lệch chuẩn là σ = √23.24 ≈ 4.82
Hệ số biến thiên là tỷ lệ giữa độ lệch chuẩn và giá trị trung bình, thường được biểu diễn dưới dạng phần trăm. Nó cho phép so sánh mức độ phân tán của các tập dữ liệu có giá trị trung bình khác nhau.
Công thức tính hệ số biến thiên (CV) như sau:
CV = (σ / μ) * 100%
Ví dụ: Sử dụng kết quả độ lệch chuẩn và giá trị trung bình ở trên, hệ số biến thiên là CV = (4.82 / 8.2) * 100% ≈ 58.78%
| Số đặc trưng | Công thức | Ý nghĩa |
|---|---|---|
| Khoảng biến thiên | R = Xmax - Xmin | Phạm vi của dữ liệu |
| Phương sai | σ2 = ∑(xi - μ)2 / N | Mức độ phân tán so với trung bình (bình phương) |
| Độ lệch chuẩn | σ = √σ2 | Mức độ phân tán so với trung bình (cùng đơn vị) |
| Hệ số biến thiên | CV = (σ / μ) * 100% | So sánh mức độ phân tán giữa các tập dữ liệu |
Việc nắm vững các khái niệm và công thức tính toán các số đặc trưng đo độ phân tán là nền tảng quan trọng để phân tích và hiểu rõ hơn về dữ liệu trong nhiều lĩnh vực khác nhau. Hy vọng bài học này đã cung cấp cho bạn những kiến thức hữu ích và giúp bạn tự tin hơn trong việc giải quyết các bài toán liên quan đến thống kê.
Hãy luyện tập thêm với các bài tập trong SGK Toán 10 Kết nối tri thức để củng cố kiến thức và nâng cao kỹ năng của bạn nhé!