1
Histogram trong toán học là gì?
0
Hồng Như0 đã đăng:

thêm bình luận...
2
trungkfc02570 đã đăng:

Khái niệm histogram trong toán học rất đơn giản, giả sử bạn có một tập dữ liệu về chiều cao của 100 người chẳng hạn, bạn muốn tìm hiểu xem:

  • Có bao nhiêu người có chiều cao thấp (1m50 trở xuống)
  • Có bao nhiêu người có chiều cao trung bình (1m50 ~ 1m65)
  • Có bao nhiêu người có chiều cao bình thường (1m65 ~ 1m90)
  • Và có bao nhiêu người có chiều cao vượt mức bình thường (trên 1m90)

Một cách đơn giản là bạn kẻ 4 cột tương ứng với 4 mức chiều cao rồi nhìn vào tập dữ liệu của 100 người đó, bắt đầu từ người thứ nhất, bạn coi thử chiều cao của người này thuộc nhóm nào thì cho vào cột của nhóm đó, cho đến người cuối cùng. Sau một hồi đếm bạn xác định được ví dụ:

  • Có 30 người có chiều cao thấp
  • Có 15 người có chiều cao trung bình
  • Có 45 người có chiều cao bình thường
  • Có 10 người có chiều cao vượt mức bình thường

Vậy, những con số 30, 15, 45 và 10 bạn tính được nó thể hiện điều gì? Tất nhiên là nó thể hiện sự xuất hiện thường xuyên của các nhóm giá trị có trong tập dữ liệu.

Nhưng, nếu để những con số như vậy, bạn sẽ khó hình dung sự phân bố tổng quát về tập dữ liệu của mình cũng như so sánh sự chênh lệch giữa các nhóm với nhau, cho nên người ta nghĩ ra dùng histogram để biểu diễn sự xuất hiện thường xuyên của các nhóm giá trị có trong tập dữ liệu dưới dạng biểu đồ hình cột.

Lưu ý: Bạn không nên nhầm histogram với biểu đồ hình cột trong địa lý nhé, histogram nó chỉ có dạng giống biểu đồ hình cột thôi, histogram chỉ có thể biểu diễn một đối tượng duy nhất trong khi biểu đồ hình cột trong địa lý có thể biểu diễn nhiều hơn hai đối tượng. Ở ví dụ trên bạn thấy rằng mình chỉ nói một đối tượng duy nhất là "chiều cao".

Do đó, với ví dụ trên, bạn có thể biểu diễn lại bằng biểu đồ histogram với cột bên trái là số lượng người, đường nằm ngang ở dưới là 4 nhóm chiều cao, và mỗi cột thể hiện số lượng người có chiều cao thuộc nhóm đó,

Biểu đồ histogram trong toán học

Nhìn vào biểu đồ histogram, bạn có thể dễ dàng đánh giá dữ liệu của mình hơn phải không nào. Một điều cuối cùng là các nhóm giá trị trong histogram phải liên tục nhau nhé, nếu lấy ví dụ ở trên, mình không chia nhóm chiều cao thành các giá trị đứt quãng, ví dụ từ nhóm chiều cao thấp đến nhóm chiều cao trung bình, mình chia 1m50 cho thấp rồi từ 1m50 đến 1m65 cho trung bình chứ mình không chia 1m50 cho thấp và 1m51 đến 1m65 cho trung bình.

Hy vọng mọi thứ rõ ràng và giúp ích cho bạn.

Cảm ơn bạn, rất chi tiết và dễ hiểu.

Hồng Như 27.05.2018
thêm bình luận...
Bạn đang thắc mắc? Ghi câu hỏi của bạn và đăng ở chế độ cộng đồng (?)