Monday, March 5, 2012
Economic data
Update: Rất nhiều bạn hỏi xin số liệu, điều mà tôi không thể đáp ứng như đã giải thích trong bài bên dưới. Tôi hiểu khó khăn của các bạn vì tôi cũng đã từng trải qua hoàn cảnh tương tự, bởi vậy tôi đã cố gắng giải thích các giải pháp tìm số liệu trong bài viết dưới đây. Vì thời gian có hạn tôi sẽ không trả các câu hỏi liên quan đến xin dữ liệu nữa, mong các bạn thông cảm.
Thời gian gần đây tôi nhận được rất nhiều comment trên blog và email của các bạn sinh viên hỏi xin số liệu kinh tế. Mặc dù có một số request không thực sự nghiêm túc, đa số các bạn đều hiểu mình làm gì và cần dữ liệu gì. Đây là dấu hiệu tốt vì nó chứng tỏ chất lượng đào tạo kinh tế đang được cải thiện và các bạn sinh viên đang dần dần tiếp cận với những lý thuyết và mô hình định lượng rất tiên tiến chứ không chỉ viết "essay" như trước. Đáng tiếc là tôi không thể đáp ứng được hầu hết request của các bạn vì hai lý do sau.
Thứ nhất nguồn số liệu mà tôi sử dụng (từ Datastream của Thomson Reuters) có bản quyền nên tôi không thể công bố rộng rãi. Trước đây tôi đã để link cho các bạn download số liệu GDP và REER của VN, mặc dù không hoàn toàn legal nhưng có thể justify được phần nào vì thực ra những số liệu đó được TCTK công bố công khai trên website và các ấn phẩm của họ. Hơn nữa đó là những số liệu liên quan trực tiếp đến những bài viết mà tôi công bố (về potential GDP và REER) nên theo truyền thống của giới academic quốc tế những số liệu đó cần phải được công khai để người đọc có thể kiểm tra lại kết quả tính toán của tôi nếu họ muốn. Thứ hai là ngay cả Datastream và các dịch vụ số liệu chuyên nghiệp cũng có nhiều hạn chế về số liệu kinh tế VN, cả về số lượng lẫn chất lượng. Tôi đã từng chỉ ra số liệu về lãi suất qua đêm liên ngân hàng của Datastream khác xa số liệu của NHNN. Một số sai lệch khác về số liệu lạm phát của Datastream so với TCTK cũng đã từng làm tôi đau đầu. Bởi vậy ngoại trừ những chuối số liệu phổ biến và có chất lượng tương đối tốt, tôi sẽ phải mất rất nhiều thời gian browse/search Datastream và các nguồn khác để tìm các chuỗi số liệu đặc thù mà một số bạn request, điều này ngoài khả năng của tôi.
Nói như vậy không có nghĩa tôi sẽ không giúp các bạn tìm số liệu cho những nghiên cứu định lượng của mình, thực ra tôi rất khuyến khích các bạn đi theo hướng nghiên cứu này vì đó là cách học kinh tế rất thực dụng và hữu ích. Tôi cũng rất thấu hiểu những khó khăn về số liệu mà các bạn đang phải đối đầu, tôi đã từng là sinh viên như các bạn. Trong entry này tôi muốn truyền lại một số kinh nghiệm của bản thân thời còn đi học để các bạn có thể tự tìm kiếm số liệu trước khi phải nhờ một ai đó, tôi luôn cho rằng kỹ năng và kiến thức về nguồn số liệu là những điều rất căn bản mà sinh viên kinh tế cần học.
Điều đầu tiên trước khi bạn bắt tay tìm kiếm số liệu là phải hiểu thật rõ mô hình lý thuyết mà mình định ước lượng. Cần hiểu kỹ các lý thuyết đằng sau nó và các mối quan hệ giữa các biến số. Điều này quan trọng vì hầu hết các số liệu thống kê thực tế không bao giờ trùng với khái niệm lý thuyết nên hiểu kỹ lý thuyết vừa giúp các bạn tránh chọn sai số liệu vừa giúp mở rộng tập hợp các số liệu có khả năng thay thế chuỗi số liệu mình không thể tìm được. Lấy ví dụ bạn có một mô hình cần sử dụng M3, tuy nhiên VN không có thống kê M3 nên bạn cần cân nhắc mô hình lý thuyết để xem thay M2 hay total credit vào mô hình đó liệu có được không. Hiểu mô hình lý thuyết còn giúp các bạn chọn instrument variables cho một số phương pháp econometric đặc thù.
Vấn đề thứ hai cần quan tâm là phải/nên hiểu bản chất và cách thức dữ liệu được thu thập/compile. Thực ra theo tôi đãy là thiếu sót của hầu hết các chương trình đào tạo kinh tế (cả ở các trường đại học nước ngoài) khi không dạy cho sinh viên về các thống kê kinh tế chủ yếu (cách thức thu thập, tính toán, hiệu chỉnh mùa vụ...). Hiểu được bản chất của chuỗi dữ liệu giúp bạn định hình được nó có thực sự phù hợp với mô hình định lượng của mình hay không. Nếu chạy mô hình xong kết quả không như mong đợi hoặc khác với kết quả của những nghiên cứu (ở các nước khác) thì đó là do dữ liệu hay do phương pháp tính toán của mình có sai sót. Có những bạn hỏi xin tôi số liệu về output gap, inflation expectation hay equity risk premium, cho thấy sự mơ hồ về chuỗi số liệu trong mô hình của mình. Hoặc những câu hỏi về đơn vị của REER, làm thế nào để chuyển năm gốc cho một chuối số liệu thực, có bao nhiêu loại hàng hóa trong rổ tính CPI, có thể tìm số liệu GDP theo tháng hay không, cũng cho thấy các bạn chưa thực sự quan tâm tìm hiểu về chuỗi số liệu của mình. Cần nhớ một nửa của kinh tế học là số liệu thống kê.
Với các bạn đang học undergraduate thì nguồn số liệu đầu tiên bạn phải nghĩ đến là thư viện trường mình (và các trường khác nếu bạn có thể tiếp cận được). Thời buổi mọi thứ được số hóa như hiện nay, có lẽ khó có thể nghĩ đến việc mất vài ngày thậm chí vài tuần vào lục thư viện và gõ lại số liệu vào máy tính, nhưng đó là những gì tôi đã làm khi còn đi học. Rất may là ngày nay thư viện đã và đang chuyển dần sang hình thức điện tử. Tôi biết các thư viện ở VN có rất ít resource nhưng các bạn vẫn nên tìm hiểu, hỏi các thủ thư xem họ có giúp được gì không. Một số database quốc tế về dữ liệu và tạp chí chuyên ngành cho phép thư viện của các trường đại học truy cập miễn phí, nhất là từ các nước đang phát triển. Các bạn (sinh viên và giáo viên) nên góp ý với thư viện trường mình lập danh sách những database nào họ có access để giúp sinh viên dễ dàng tìm kiếm số liệu.
Nguồn số liệu kinh tế tiếp theo là website của các cơ quan quản lý và thống kê quốc gia như TCTK, NHNN, BTC của VN. Những năm gần đây các cơ quan này đã có rất nhiều tiến bộ trong việc công bố thông tin, tôi rất mong họ sẽ tiếp tục xây dựng website tốt hơn nữa (có thể học tập template trên website của WB và IMF) và cung cấp thêm nhiều thông tin hơn nữa. [Một điểm tôi mong muốn các website này cải thiện là họ nên có một section về education cho đại chúng như các website của Fed, ECB, OECD]. Các bạn sinh viên nên bỏ một chút thời gian tìm hiểu cấu trúc và các ngóc ngách trên các trang web nói trên, nhất là website của TCTK. Nếu các bạn thực sự quan tâm đến số liệu và có ý định làm nghiên cứu định lượng, nên download số liệu về máy tính của mình và thỉnh thoảng cập nhận những database cá nhân này. Một skill quan trọng của các analyst trong lĩnh vực finance là phải nhớ được khi nào các cơ quan thống kê (cả nhà nước và tư nhân) release những thông số quan trọng (GDP, CPI, PMI, unemployment rate...).
Nguồn dữ liệu thứ ba là các website của các tổ chức quốc tế, vd WB, IMF, ADB, BIS, ILO, OECD. Trong số các tổ chức này, IMF có nhiều thông tin nhất và là tổ chức duy nhất có số liệu quí và tháng cho một số chỉ số quan trọng. IMF có một số database mà sinh viên từ các nước đang phát triển có thể truy cập miễn phí như IFS, DOTS, COFER, các bạn cần tìm hiểu và đang ký tài khoản để lấy số liệu. Rất tiếc vì tôi không thuộc diện được access miễn phí nên tôi không thử và hướng dẫn các bạn được, tuy nhiên đã có nhiều bạn confirm đã access thành công từ VN. Nếu có khó khăn gì các bạn thử liên hệ với văn phòng của IMF ở VN xin giúp đỡ, tôi tin họ sẽ rất nhiệt tình. Các bạn ở HN có thể đến thẳng văn phòng IMF và xin truy cập số liệu từ đó. UNDP và ADB cũng có văn phòng ở HN, nguồn số liệu trên website của ADB cũng rất tốt tuy chỉ có annual data.
Đối với số liệu nước ngoài, nhất là các nước phát triển, ngoài các nguồn quốc tế như IMF, OECD, các bạn có thể vào website của central bank của họ để tìm thông tin. Ví dụ website của FED, ECB, RBA, BOE, BOJ, ngay cả Bank of Thailand hay People Bank of China cũng có rất nhiều số liệu kinh tế. Một số nguồn không chuyên khác có số liệu tốt dù không nhiều/dài như CIA Factbook, The Economist Indicators (không phải EIU cần có tài khoản). Cuối cùng tất nhiên là Dr. Google và Google Scholar, người bạn không thể thiếu cho những người làm nghiên cứu.
Một số links số liệu quan trọng
Tổng cục Thống kê: Đây là nguồn quan trọng nhất cho các bạn sinh viên, ngoài các thông số kinh tế hàng tháng (chọn tháng trên dropdown menu có thể lấy được rất nhiều số liệu từ năm 2004) các bạn có thể xem số liệu năm trong mục "Số liệu thống kê" và số liệu của các cuộc điều tra kinh tế xã hội lớn (mục "Các cuộc điều tra").
Ngân hàng Nhà nước: Ngoài những chỉ số chính sách tiền tệ căn bản như các loại lãi suất chính sách và tỷ giá bình quân liên ngân hàng (reference rate), mục "Thị trường tiền tệ" có các thống kê về VNBOR, hoạt động thị trường mở và đấu thầu trái phiếu chính phủ. Một địa chỉ nữa cho các bạn quan tâm đến tài chính, tiền tệ là Bảo hiểm Tiền gửi Việt nam, mặc dù hiện tại chưa có nhiều số liệu.
Bộ Tài chính: Mục "Ngân sách nhà nước" có thống kê về ngân sách, chi thu của VN, ngoài ra còn có thông tin về các dự án ODA và đặc biệt là Bản tin nợ nước ngoài rất hữu ích. Số liệu về ngân sách nhà nước cũng có thể tra cứu trên website của Chinh phủ.
Bộ Lao động Thương binh và Xã hội: Mục Dữ liệu của bộ này có rất nhiều thông tin, chủ yếu kết quả của các cuộc khảo sát xã hội, rất có ích cho những bạn quan tâm đến labor market và các vấn đề xã hội. Đa số dữ liệu được cung câp dưới dạng bảng Excel khá tiện dụng.
Bộ Nông Nghiệp và Phát triển Nông thôn: Mặc dù một số trang trên website của bộ này bị lỗi và còn nhiều tài liệu không dùng Unicode, mục Thống kê - Dự báo có rất nhiều thông tin quan trọng. Tôi tìm thấy thống kê về khí tượng thủy văn của VN ở đây chứ không phải trên website của Bộ Tài nguyên Môi trường.
Bộ Công Thương: Mục Thống kê của bộ này rất tốt, số liệu xuất nhập khẩu khá chi tiết (các bạn có thể update bảng số liệu REER/NEER mà tôi cung cấp trước đây bằng số liệu xuất nhập khẩu từ trang web này). Phần thông tin về vốn đầu tư cũng khá chi tiết.
[Bộ Kế hoạch và Đầu tư, Bộ Tài nguyên Môi trường, Bộ Khoa học Công nghệ là những bộ tôi rất thất vọng vì không có các cơ sở dữ liệu/thống kê chuyên ngành đáng ra phải có.]
IMF: Như đã nói bên trên, IMF có một số database rất quan trọng về kinh tế vĩ mô, theo tôi được biết họ cung cấp miễn phí cho các nước đang phát triển nên các bạn ở VN có thể truy cập được. Những database quan trọng là WEO, IFS, DOTS, BOPS, GFS. Ngoài ra trong chuyên mục Vietnam and the IMF cũng có rất nhiều thông tin. Khi còn là sinh viên và không có truy cập vào IFS tôi thường xuyên vào chuyên mục này lấy số liệu của VN từ các Staff Report và Statistical Appendixes do văn phòng IMF Vietnam công bố hàng năm. Trong chuyên mục này cũng có rất nhiều bài nghiên cứu quan trọng về VN của các chuyên gia IMF. Năm ngoái có một bài về Output gap của VN sử dụng Bayesian estimation những bạn quan tam về vấn đề này nên tham khảo. IMF website là nguồn số liệu tất cả sinh viên kinh tế bắt buộc phải biết.
WB: Cách đây mấy năm WB đã cho access miễn phí vào tất cả các database của họ (thời tôi đi học chỉ được access vào World Development Indicators). Số liệu của WB rất rộng và họ bắt đầu có các chuỗi số liệu theo quí (trước đây chỉ có số liệu theo năm). Đây cũng là nguồn số liệu bắt buộc cho sinh viên kinh tế.
ADB: Số liệu của tổ chức này rất tốt, tiếc là cũng chỉ có annual data như WB. Chuyên mục Key Indicators có rất nhiều bảng Excel số liệu được update hàng năm (và có lẽ là data source duy nhất lưu trữ theo vintage, nghĩa là các version khác nhau hàng năm).
UNDP: Tổ chức này có một database quan trọng liên quan đến chỉ số Human Development Indicator được sử dụng rộng rãi trong các nghiên cứu kinh tế.
UNCTADSTAT: Database của Unctad, một tổ chức thuộc UN tương tự như UNDP, chuyên về trade data. Số liệu ngoại thương ở database này (cho VN) tương đương như của Bộ Công thương và DOTS của IMF tôi trích dẫn bên trên.
BIS: Mặc dù không có nhiều số liệu về VN, đây là địa chỉ quan trọng cho những bạn quan tâm đến số liệu banking and finance quốc tế.
OECD: database này chủ yếu phục vụ cho các thành viên của OECD nhưng có rất nhiều chỉ số quốc tế (một số phải trả tiền).
FRED (của Fed St Louis): Trong số các website của các ngân hàng trung ương, đây là database lớn nhất và uy tín nhất với gần như toàn bộ số liệu macro của Mỹ, có những chuỗi dài gần 100 năm. Database này cũng có số liệu của một số nước phát triển khác. Ngoài ra Fed còn có một số data tại địa chỉ này và hầu hết các chi nhánh Fed khác cũng cung cấp dữ liệu (NY, Kansas, San Francisco, Chicago, Cleveland).
Các central banks lớn khác như ECB, BoE, BoJ, RBA, tuy nhiên số liệu chủ yếu cho các nước của họ.
Pen World Table: một nguồn số liệu về national account tính theo PPP cho gần như tất cả các nước. Đây là một database lâu đời và rất uy tín trong giới học thuật tuy nhiên số liệu update chậm hơn so với nguồn WB và IMF.
The World Top Income Database: số liệu về VN đang được thu thập, hi vọng sẽ có sớm.
Economagic.com: số liệu của Mỹ và một số của Úc, ECB, BoJ
Knoema.com: số liệu kinh tế xã hội quốc tế, có khá nhiều số liệu thú vị về VN.
UN Trade data: số liệu thương mại của các nước, đặc biệt là Comtrade databasedatabase cho từng mặt hàng
UN Economic Statistics: số liệu kinh tế tổng hợp của các nước
Một số nguồn dữ liệu tài chính
Damodaran: GS Aswarth Damodaran (NYU) cung cấp một database rất lớn về số liệu của các công ty đại chúng (US and non-US, trong đó có một số công ty VN). Website này còn cung cấp một số spreadsheet tính toán liên quan đến valuation rất hữu ích cho các bạn sinh viên tài chính.
Quandl: Một website cung cấp số liệu miễn phí tương đối mới nhưng rất có triển vọng. Bạn có thể download rất nhiều số liệu kinh tế và tài chính của các nước.
(Danh sách này sẽ tiếp tục được bổ sung trong tương lai, nếu bạn nào biết link nào hữu ích muốn chia sẻ thì báo cho tôi qua email hoặc để lại link dưới phần comment).