1
Phân phối chuẩn là gì?
1
ngoc ha10 đã đăng:

Trong các ngành kĩ thuật khi sử dụng đến toán xác suất thống kê, người ta thường hay sử dụng công thức phân phối chuẩn. Vậy phân phối chuẩn là gì? Tại sao phân phối chuẩn lại quan trọng và thường hay được sử dụng trong khi còn có nhiều loại phân phối khác vậy các bạn?

thêm bình luận...
2
minhtri1620 đã đăng:

Trong xác suất thống kê, bạn sẽ gặp nhiều loại phân phối ngẫu nhiên với nhiều hình dạng khác nhau như:

  • Dữ liệu có thể phân phối sang thuộc tính bên trái nhiều hơn.
  • Dữ liệu có thể phân phối sang thuộc tính bên phải nhiều hơn.
  • Dữ liệu có thể phân phối đều trên mọi thuộc tính.

Phân phối dữ liệu trong xác suất thống kê

Thì, một dạng phân phối dữ liệu khá đặc biệt nơi mà dữ liệu được phân phối nhiều hơn cho các thuộc tính ở giữa và ít hơn cho các thuộc tính ở hai bên được gọi là phân phối chuẩn. Do tính chất này, đồ thị histogram của phân phối chuẩn sẽ có dạng hình cái chuông bạn có thể xem bên dưới,

Đồ thị histogram của phân phối chuẩn

Một tập dữ liệu được phân phối chuẩn thì nó sẽ có thuộc tính như sau:

  • Giá trị trung bình (mean) = giá trị trung tâm (median) = giá trị xuất hiện thường xuyên (mode). Bạn có thể xem câu trả lời của một bạn về cách phân biệt 3 giá trị mean - median - mode.
  • Có tính đối xứng.
  • 50% giá trị sẽ nhỏ hơn giá trị trung bình và 50% giá trị sẽ lớn hơn giá trị trung bình.

Công thức của phân phối chuẩn dựa trên 3 đại lượng đó là giá trị trung bình $\mu$, phương sai $\sigma^2$ và độ lệch chuẩn $\sigma$

$$f(\mu, \sigma^2, \sigma) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{\left(- \frac{(x - \mu)^2}{2\sigma^2} \right)}$$

Trong đó:

  • $x$ là một biến ngẫu nhiên.
  • Nếu xem phân phối chuẩn là một cái chuông thì giá trị $\mu$ sẽ điều khiển vị trí đỉnh chuông trên trục $x$, giá trị $\sigma$ sẽ điều khiển độ dốc hai bên đỉnh chuông.

Về quan trọng hay không thì mình không chắc nhưng người ta thường thích dùng phân phối chuẩn hơn, do phân phối chuẩn dựa trên các nguyên khái niệm cơ bản nhất của thống kê như giá trị trung bình, phương sai, độ lệch. Cũng giống như khi sử dụng hàm lôgarit $\log()$ thì người ta lại thường sử dụng nhất là lôgarit tự nhiên $\log_e()$ (viết cách khác là $\ln()$), ở đây cũng vậy phân phối chuẩn cũng được xem là một phân phối tự nhiên.

đã bổ sung 6.4 năm trước bởi
Zootopia60
Không lòng vòng anh như Hải Phòng
thêm bình luận...
Bạn đang thắc mắc? Ghi câu hỏi của bạn và đăng ở chế độ cộng đồng (?)