Thursday, November 3, 2016

Phương pháp dự báo (xác suất) kết quả bầu cử tổng thống Mỹ của Nate Silver (538) rất giống options pricing sử dụng...

Phương pháp dự báo (xác suất) kết quả bầu cử tổng thống Mỹ của Nate Silver (538) rất giống options pricing sử dụng Monte Carlo. Còn phương pháp của Princeton Election Consortium là điển hình của giới hàn lâm (toán/statistics): giải closed form cho hàm xác suất kết quả bầu cử.

Các bạn Princeton "chê" Nate Silver nhưng có lẽ họ hiểu sai Monte Carlo của anh này. Nate Silver không chạy simulation cho tất cả 2^51 combination mà là 20000 simulation cho mỗi bang trong số 51 bang của Mỹ (nên số simulation nhỏ hơn nhiều 2^51).

Phê phán của Princeton có lẽ phải dành cho phương pháp của NYT. NYT không công bố cụ thể phương pháp tính nhưng tôi đoán họ tính xác suất cho một subset nhỏ của 2^51 combination. Subset này là most likely outcomes. Ví dụ nếu họ loại bỏ 41 bang có kết quả gần như chắc chắn thì số simulations chỉ còn 2^10 (cái decision tree trên website của họ chỉ có 10 tầng).

Thực ra trong số 3 dự báo quantitative nói trên Nate Silver phức tạp nhất và có lẽ gần thực tế nhất (theo nghĩa phản ánh các yếu tố trên thực tế chứ không phải chính xác nhất). Chạy Monte Carlo chỉ là bước cuối cùng ít quan trọng nhất, cái chính là xử lý số liệu thô như thế nào và đưa vào mô hình những loại uncertainty/giả định nào. Nhưng mô hình phức tạp quá sẽ khó biết sai số xuất phát từ đâu. Bạn nào quan tâm đến quant/statistics nên tham khảo mô hình này (link bên dưới).

http://fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/
http://fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/

1 comment:

  1. giới Wall Street hay nói rằng: All models are wrong but some are useful. tại vì Nate Silver và Sam Wang phải đối diện với một dilemma: Bias–variance tradeoff. Sam Wang có mô hình đơn giản hơn nên sẽ dễ bị underfit training set và bias cao hơn. Còn Nate Silver thì ngược lại sẽ overfit và bias thấp hơn. Tuy nhiên không hiểu lý do gì mà Sam Wang lại thay đổi giả định để làm cho kết quả Hilary thắng lên đến 99%. trước đó chỉ là 70% thì phải. nếu Sam giữ nguyên model cũ thì Nate và Sam gần giống nhau ở poll only model (Nate còn có 2 model khác nữa) phải chờ đến ngày kiểm phiếu mới biết ai giỏi hơn. focasting vẫn còn là nghệ thuật chứ chưa phải là khoa học hoàn toàn.

    ReplyDelete

Bitcoin II

http://kinhtetaichinh.blogspot.com/2018/01/bitcoin-ii.html