Tuesday, April 22, 2014

Chocolate


Trong dịp Easter vừa rồi Felix Salmon tweet đồ thị sau về mối quan hệ giữa số lượng tiêu thụ chocolate bình quân đầu người của một quốc gia với số giải Nobel (trong 10 triệu dân) mà quốc gia đó đạt được:



Thoạt nhìn tôi nghĩ đây là một đồ thị marketing của các hãng sản xuất chocolate đang tồn hàng Easter, nhưng hóa ra theo Business Insider đây là kết quả của một bài nghiên cứu nghiêm túc đăng trên tạp chí New England Journal of Medicine, có lẽ là một trong những tạp chí hàng đầu về y khoa trên thế giới. Business Insider còn tìm được link của bản pdf miễn phí của bài nghiên cứu này và tôi không thể không đọc thử xem tác giả đã làm thế nào.

Hóa ra bài nghiên cứu vô cùng đơn giản. Tác giả download số liệu Nobel laureates per capita từ Wikipedia (bao gồm cả giải Nobel hòa bình) và số liệu chocolate consumption per capita từ website của một số công ty sản xuất chocolate rồi chạy linear regression. Kết quả là correlation của hai biến số này rất cao (có thể thấy qua đồ thị trên) và highly significant. Tác giả cho rằng (dù rào trước đón sau rất nhiều) ăn nhiều chocolate sẽ làm tăng cognitive function vì chocolate có chứa nhiều chất flavonoids, do vậy làm tăng khả năng được giải Nobel.

Bất kỳ ai đã từng học qua một khóa econometrics sẽ thấy nghiên cứu này có nhiều vấn đề. Thứ nhất như chính tác giả đã thừa nhận correlation không phải causation, nhiều khả năng số giải Nobel và lượng chocolate consumption đều cùng do một yếu tố thứ ba quyết định, dễ thấy nhất là kinh tế (vd GDP per capita). Những yếu tố khác có thể ảnh hưởng lên số Nobel prize đáng ra tác giả phải control có thể là tỷ lệ đầu tư cho giáo dục, nghiên cứu, số lượng sinh viên đại học trên 1000 dân, số lượng bài báo khoa học hoặc patent, số lượng tiêu thụ các thực phẩm khác có hàm lượng flavonoids cao...

Thứ hai số lượng giải Nobel và chocolate consumption chắc chắn thay đổi theo thời gian. Ví dụ cụ thể là Thụy điển vài thập kỷ gần đây được rất ít giải Nobel so với khi giải này mới được thành lập. Bởi vậy sử dụng số liệu giải Nobel trong toàn bộ lịch sử (stock variable) so sánh với số lượng consumption của một năm (flow variable) đòi hỏi phải có một assumption là stock variable phân bổ đều theo thời gian còn flow variable không thay đổi, khó có thể đúng trên thực tế. Một người có cognitive function tốt (nên có khả năng được giải Nobel cao hơn) phải ăn nhiều chocolate lúc nhỏ, khi đi học, lúc làm nghiên cứu hay khi nào?

Thứ ba nếu ăn chocolate làm tăng cognitive ability thì một số kiểm chứng đơn giản hơn có thể thực hiện như chạy regression giữa lượng chocolate consumption với kết quả PISA, sẽ chính xác hơn so với số giải Nobel. Ngoài ra thay vì nghiên cứu "macro" như vậy tác giả có thể tiến hành nghiên cứu "micro", nghĩa là so sánh số lượng tiêu thụ chocolate của từng cá nhân được giải Nobel (hoặc những người có thành tực khoa học cao như các giáo sư đại học) so với mức tiêu thụ trung bình. Tất nhiên làm nghiên cứu micro như vậy sẽ tốn kém và mất thời gian hơn so với việc download data từ Internet và chạy linear regression, nhưng một bài báo trên NEJE phải như vậy mới xứng đáng chứ. Hay tạp chí này không thực sự tốt như tôi tưởng?


5 comments:

  1. Em cũng thấy đây giống quảng cáo chocolate quá ah.

    ReplyDelete
  2. Năm 2012, GS Nguyễn Văn Tuấn của viện Garvan, Úc cũng đã có bài phân tích thú vị, có thể đọc lại ở đây ạ: http://tuanvannguyen.blogspot.com/2012/10/chocolate-xuong-va-giai-nobel.html

    ReplyDelete
  3. Thế thì mình cũng có hy vọng đây vì mình ăn chocolate suốt ngày!

    ReplyDelete