Wednesday, February 10, 2010

Data vintages


Số liệu thống kê macro của các nước thường được updated/revised nhiều lần vì các chuyên gia thống kê sau khi có thêm thời gian và thông tin sẽ tính được số liệu chính xác hơn các con số công bố lần đầu. Ngoài ra các chuỗi số liệu cũng có thể được chỉnh sửa vì trọng số của các thành phần cấu thành thay đổi, vd trường hợp TCTK vừa thay đổi rổ hàng hóa tính CPI. Việc update/revise số liệu này hoàn toàn vì mục đích khoa học, nghĩa là để chuỗi số liệu phản ánh đúng hơn các diễn biến kinh tế.

Tuy nhiên như trước đây tôi đã đề cập đến chuỗi CPI của VN (link broken), khác với các cơ quan thống kê trên thế giới, TCTK của VN không công bố chuỗi số liệu cũ, nghĩa là không có số liệu của các vintages trước đây. Đây là một điều rất thiệt thòi cho những người làm công tác nghiên cứu, chưa kể cách làm này gây "dị nghị" về mục đích chỉnh sửa. Thiệt thòi vì đã có những nghiên cứu (thậm chí index về statistical updates/revisions) cho thấy việc các chuỗi số liệu được chỉnh sửa up hay down so với số liệu ban đầu có ý nghĩa về mặt forecast. Dị nghị vì khi không có các vintages khác nhau để so sánh, người ta không biết các vintages có bị consistently shifted hay không, là biểu hiện của data manipulation. Đã có những dị nghị như vậy về số liệu inventory của VN trong năm 2009 vừa rồi.

Bởi vậy tôi nghĩ TCTK nên lưu trữ và công bố các data vintages khác nhau thay vì chỉ có con số cuối cùng. Khi thay đổi rổ hàng hóa tính CPI, TCTK nên đưa ra 2 chuỗi CPI dùng rổ hàng hóa cũ và hàng hóa mới. Chi phí tính toán và lưu trữ chắc chắn nhỏ hơn nhiều so với lợi ích của các vintages này đem lại cho giới nghiên cứu và policy makers.


2 comments:

  1. Chào anh Giang, em thấy TCTK vẫn công bố cpi theo rổ hàng hóa cũ và rổ hàng hóa mới đó thôi.

    http://www.gso.gov.vn/default.aspx?tabid=628&idmid=4

    Rổ hàng và quyền số phải đi song hành, khi đã sang giai đoạn mới thì có điều tra giá của rổ hàng hóa cũ nữa đâu mà tính được cpi theo rỗ và quyền số cũ. Họ chỉ tiến hành điều tra rổ hàng hóa mới thôi.

    Phần lớn các nước cũng chỉ điều tra giá và tính đồng thời CPI theo rổ hàng hóa cũ và rổ hàng hóa mới trong 1 tháng (linking period) để nối 2 chuỗi số cũ và mới với nhau thôi. Một số nước giầu thì linking period của họ là 1 năm. Và họ cũng chỉ công bố số đã nối thôi, chứ overlap thì ko thấy ai công bố.

    Em vừa làm chuyên đề về cpi nên vẫn có chuỗi số liệu cpi từ 2000 đến giờ mà.

    ReplyDelete
  2. @bachtit: Cám ơn em đã cung cấp thông tin. Lúc viết entry này anh có search website của TCTK nhưng không tìm được thông tin về các vintages cũ, có thể anh tìm không kỹ hoặc TCTK mới bổ sung thêm. Dẫu sao đây cũng là điều đáng mừng.

    Ở các nước phát triển (ít nhất là Úc và Mỹ) số liệu về data vintages có thể có overlap khá dài. Với CPI chỉ cần linking period là đủ vì đó là index, nhưng nhiều series khác như GDP, employment, trade balance... thì linking period không có ý nghĩa. Ý của anh về data vintage là nói về macro data nói chung, CPI chỉ là một ví dụ cụ thể.

    ReplyDelete