Biểu đồ hộp (Box Plot) là gì? Đặc trưng và ví dụ cụ thể Box Plot
Biểu đồ hộp Box Plot là một dạng biểu đồ hay được dùng trong khoa học dữ liệu và thống kê. Trong bài này chúng ta cùng khám phá về định nghĩa, đặc trưng của Boxplot cũng như là ví dụ để hiểu rõ hơn về loại biểu đồ này.
Biểu đồ hộp (Box Plot) là gì?
Biểu đồ hộp trong tiếng Anh là Box Plot hay còn có cách gọi khác là Box and Whisker plot, là một loại biểu đồ thể hiện những khuôn hình của dữ liệu định tính (quantitative data). Biểu đồ hộp được John Tukey chính thức giới thiệu vào năm 1977.
Một biểu đồ boxplots chia tập dữ liệu thành những khoảng phần tư (quartiles). Có tên là boxplots vì phần thân của biểu đồ bao gồm một chiếc hộp box đi từ Q1 đến Q3. Đây là biểu đồ diễn tả 5 vị trí phân bố của dữ liệu, đó là: giá trị nhỏ nhất (min), tứ phân vị thứ nhất (Q1), trung vị (median), tứ phân vị thứ 3 (Q3) và đến giá trị lớn nhất (max).
Đặc trưng của biểu đồ hộp
Biểu đồ hộp giúp biểu diễn các đại lượng quan trọng của dãy số một cách trực quan và dễ hiểu.Trên biểu đồ hộp, ngoài các đại lượng số trung bình, trung vị thì còn thể hiện một số thông số sau:
(1) Số phân tử hay còn gọi là tứ phân vị (tiếng anh là Quartiles): Tứ phân vị là đại lượng mô tả sự phân bố và phân tán của tập dữ liệu. Số phân tử có 3 giá trị, đó là số phần tử thứ nhất (Q1), số phần tử thứ nhì (Q2) và số phần tử thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (được sắp xếp dữ liệu theo thứ tự từ bé đến lớn) thành 4 phần có số lượng quan sát đều nhau.
Tứ phân vị thường được xác định như sau:
- Sắp xếp các số theo thứ tự giá trị tăng dần
- Chia cắt dãy số thành 4 phần bằng nhau
- Tứ phân vị là tất cả những giá trị tại vị trí cắt
2) Khoảng biến thiên của số phân tử (Interquartile Range – IQR) IQR được xác định như sau:
Ví dụ của biểu đồ hộp (Box Plot)
Để hiểu rõ hơn về biểu đồ hộp (Box Plot), chúng ta hãy cùng xét một ví dụ mô tả cách sử dụng biểu đồ hộp để phân tích và nhận biết vấn đề cụ thể như sau:
Ví dụ, với số liệu thu thập được về tỉ lệ làm lại (tiếng anh là Rework Ratio) trong suốt quá trình sản xuất, (có xmin = 0,0; Q1 = 14,9; x = 19,0; x = 15,8; Q3 = 20,6; xmax =23,2) ta có được biểu đồ hộp với hình dáng biểu đồ như sau:
- Trung bình tỉ lệ làm lại là 15,8% và tỷ lệ trung vị là 19%.
- Dữ liệu có xu hướng nghiêng nhiều hơn về phía trên giá trị trung bình.
- Khoảng số phân tử được tính như sau = Q3 – Q1 = 20,6 – 14,9 = 5,7
- Khoảng cách giữa giá trị lớn nhất đến giá trị nhỏ nhất là 23,2 – 0 = 23,2.
Nhìn chung, tỉ lệ làm lại cao và quá trình có sự dao động lớn, không ổn định và kiểm soát chất lượng kém. Tuy nhiên, biểu đồ hộp sẽ giúp nhìn trực quan hơn khi so sánh 3 giai đoạn hoặc khu vực khác nhau tương tự như hình dưới đây:
Với ba lần thu thập dữ liệu về tỉ lệ làm lại tính vào thời điểm tháng 11/2011, tháng 3/2012 và tháng 6/2012, dữ liệu tính ở thời điểm tháng 11/2011 cho thấy được quá trình kiểm soát lỗi kém vì xu hướng tập trung của dữ liệu (trung vị) ở mức cao và độ dao động lớn.
Kiểm soát chất lượng vào thời điểm tháng 3/2012 được đánh giá là tốt nhất vì dữ liệu về tỉ lệ làm lại tập trung ở mức thấp và dao động ở phạm vi hẹp.
Kết luận
Qua bài viết này, chắc hẳn các bạn cũng đã nắm được biểu đồ hộp Box Plot là gì và những thông tin liên quan đến dạng biểu đồ này. Ngoài ra, nếu như bạn vẫn còn có những băn khoăn, thắc mắc muốn được chúng tôi hỗ trợ thì hãy để lại bình luận bên dưới bài viết nhé.
Thông tin được biên tập bởi: taichinh24h.com.vn
Nguồn bài viết: Biểu đồ hộp (Box Plot) là gì? Đặc trưng và ví dụ cụ thể Box Plot
source https://taichinh24h.com.vn/bieu-do-hop-box-plot/
Nhận xét
Đăng nhận xét