Chào mừng các em học sinh đến với bài học về khoảng biến thiên và khoảng tứ phân vị trong chương trình Toán 12 Cánh Diều. Bài học này thuộc Chương 3: Các số đặc trưng đo mức độ phân tán cho mẫu số liệu ghép nhóm.
Tại giaibaitoan.com, chúng tôi cung cấp lời giải chi tiết, dễ hiểu, giúp các em nắm vững kiến thức và tự tin giải các bài tập liên quan.
Trong thống kê, việc đo lường mức độ phân tán của một mẫu số liệu là vô cùng quan trọng. Nó giúp chúng ta hiểu rõ hơn về sự biến động của dữ liệu và đưa ra những kết luận chính xác hơn. Bài 1 trong SGK Toán 12 Cánh Diều tập trung vào hai số đặc trưng đo mức độ phân tán cơ bản: khoảng biến thiên và khoảng tứ phân vị.
Khoảng biến thiên (range) là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong một mẫu số liệu. Nó cho biết phạm vi mà dữ liệu trải rộng. Công thức tính khoảng biến thiên:
R = Xmax - Xmin
Trong đó:
Ví dụ: Cho mẫu số liệu: 10, 12, 15, 18, 20. Khoảng biến thiên của mẫu là: 20 - 10 = 10.
Khoảng tứ phân vị (interquartile range - IQR) là hiệu giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1). Nó đo lường mức độ phân tán của 50% dữ liệu trung tâm. Công thức tính khoảng tứ phân vị:
IQR = Q3 - Q1
Để tính khoảng tứ phân vị, chúng ta cần xác định các tứ phân vị Q1, Q2, Q3.
Cách tìm Q1, Q2, Q3 cho mẫu số liệu ghép nhóm:
Qi = ai + ( (n/4)i - cfi-1 ) * h
Trong đó:
Ví dụ: Xét bảng tần số sau:
| Khoảng | Tần số (f) | Tần số tích lũy (cf) |
|---|---|---|
| [0-10) | 5 | 5 |
| [10-20) | 10 | 15 |
| [20-30) | 15 | 30 |
| [30-40) | 8 | 38 |
| [40-50) | 2 | 40 |
Tìm Q1, Q2, Q3.
n = 40
Q1: (n/4) * 1 = 10. Khoảng chứa Q1 là [10-20). a1 = 10, cf0 = 5, h = 10. Q1 = 10 + ((10) - 5) * 10 / 10 = 15.
Q2: (n/4) * 2 = 20. Khoảng chứa Q2 là [20-30). a2 = 20, cf1 = 15, h = 10. Q2 = 20 + ((20) - 15) * 10 / 10 = 25.
Q3: (n/4) * 3 = 30. Khoảng chứa Q3 là [30-40). a3 = 30, cf2 = 30, h = 10. Q3 = 30 + ((30) - 30) * 10 / 10 = 30.
IQR = Q3 - Q1 = 30 - 15 = 15.
Khoảng biến thiên cho biết phạm vi rộng hẹp của dữ liệu. Tuy nhiên, nó dễ bị ảnh hưởng bởi các giá trị ngoại lệ. Khoảng tứ phân vị khắc phục nhược điểm này bằng cách chỉ tập trung vào 50% dữ liệu trung tâm, làm cho nó trở thành một thước đo phân tán ổn định hơn.
Việc hiểu và sử dụng khoảng biến thiên và khoảng tứ phân vị giúp chúng ta phân tích dữ liệu một cách hiệu quả và đưa ra những quyết định sáng suốt.