Loading...
Vietnam Geography App
Loading...
Vietnam Geography App
Tìm hiểu cách xác suất và thống kê được sử dụng để phân tích dữ liệu, đưa ra dự đoán và quyết định trong thế giới thực.
Công thức Bayes giúp chúng ta cập nhật niềm tin hoặc xác suất về một sự kiện khi có thêm thông tin mới. Nó được ứng dụng rộng rãi trong y học (chẩn đoán bệnh), máy học (bộ lọc spam), và nhiều lĩnh vực khác.
Thống kê có thể bị diễn giải sai hoặc cố tình bóp méo để phục vụ một mục đích nào đó. Cần xem xét kích thước mẫu, phương pháp thu thập dữ liệu và các yếu tố gây nhiễu để có cái nhìn chính xác.
Một cách nói đơn giản: Xác suất bắt đầu với một mô hình đã biết (ví dụ: một đồng xu công bằng) và dự đoán khả năng xảy ra của các kết quả. Thống kê thì ngược lại, nó bắt đầu với dữ liệu đã thu thập được và cố gắng suy ra mô hình cơ bản là gì.
Xác suất có điều kiện của sự kiện A, ký hiệu P(A|B), là xác suất sự kiện A xảy ra, biết rằng sự kiện B đã xảy ra. Ví dụ: xác suất một người bị bệnh tim, biết rằng người đó hút thuốc.
Trung bình là tổng tất cả các giá trị chia cho số lượng giá trị. Trung vị là giá trị nằm ở giữa của một tập dữ liệu đã được sắp xếp. Yếu vị là giá trị xuất hiện thường xuyên nhất. Trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) hơn so với trung bình.
Độ lệch chuẩn là một thước đo mức độ phân tán của dữ liệu so với giá trị trung bình. Độ lệch chuẩn thấp cho thấy các điểm dữ liệu có xu hướng ở gần giá trị trung bình. Độ lệch chuẩn cao cho thấy các điểm dữ liệu trải rộng trên một phạm vi giá trị lớn hơn.
Đây là một nguyên tắc quan trọng trong thống kê. Chỉ vì hai sự kiện xảy ra cùng lúc (tương quan) không có nghĩa là sự kiện này gây ra sự kiện kia. Ví dụ, doanh số bán kem và số vụ chết đuối đều tăng vào mùa hè, nhưng không phải ăn kem gây ra chết đuối. Yếu tố thứ ba (thời tiết nóng) là nguyên nhân chung.
Thiên vị chọn mẫu xảy ra khi mẫu được chọn để phân tích không đại diện cho toàn bộ tổng thể. Ví dụ, thực hiện một cuộc khảo sát về việc sử dụng internet chỉ qua điện thoại bàn sẽ bỏ qua những người chỉ sử dụng điện thoại di động, dẫn đến kết quả sai lệch.
Luật số lớn nói rằng khi bạn lặp lại một thí nghiệm một số lần rất lớn, giá trị trung bình của các kết quả thu được sẽ ngày càng tiến gần đến giá trị kỳ vọng (xác suất lý thuyết). Ví dụ, nếu bạn tung đồng xu 10.000 lần, tỷ lệ mặt ngửa sẽ rất gần với 50%.
Giá trị p là xác suất quan sát được một kết quả ít nhất cũng cực đoan như kết quả thực tế, với giả định rằng giả thuyết không (null hypothesis) là đúng. Một giá trị p nhỏ (thường < 0.05) cho thấy có bằng chứng để bác bỏ giả thuyết không.
Bạn tung một đồng xu công bằng 2 lần. Xác suất để cả hai lần đều ra mặt ngửa là bao nhiêu?