Economic data


Thời gian gần đây tôi nhận được rất nhiều comment trên blog và email của các bạn sinh viên hỏi xin số liệu kinh tế. Mặc dù có một số request không thực sự nghiêm túc, đa số các bạn đều hiểu mình làm gì và cần gì dữ liệu gì. Đây là dấu hiệu tốt vì nó chứng tỏ chất lượng đào tạo kinh tế đang được cải thiện và các bạn sinh viên đang dần dần tiếp cận với những lý thuyết và mô hình định lượng rất tiên tiến chứ không chỉ viết "essay" như trước. Đáng tiếc là tôi không thể đáp ứng được hầu hết request của các bạn vì hai lý do sau.

Thứ nhất nguồn số liệu mà tôi sử dụng (từ Datastream của Thomson Reuters) có bản quyền nên tôi không thể công bố rộng rãi. Trước đây tôi đã để link cho các bạn download số liệu GDP và REER của VN, mặc dù không hoàn toàn legal nhưng có thể justify được phần nào vì thực ra những số liệu đó được TCTK công bố công khai trên website và các ấn phẩm của họ. Hơn nữa đó là những số liệu liên quan trực tiếp đến những bài viết mà tôi công bố (về potential GDP và REER) nên theo truyền thống của giới academic quốc tế những số liệu đó cần phải được công khai để người đọc có thể kiểm tra lại kết quả tính toán của tôi nếu họ muốn. Thứ hai là ngay cả Datastream và các dịch vụ số liệu chuyên nghiệp cũng có nhiều hạn chế về số liệu kinh tế VN, cả về số lượng lẫn chất lượng. Tôi đã từng chỉ ra số liệu về lãi suất qua đêm liên ngân hàng của Datastream khác xa số liệu của NHNN. Một số sai lệch khác về số liệu lạm phát của Datastream so với TCTK cũng đã từng làm tôi đau đầu. Bởi vậy ngoại trừ những chuối số liệu phổ biến và có chất lượng tương đối tốt, tôi sẽ phải mất rất nhiều thời gian browse/search Datastream và các nguồn khác để tìm các chuỗi số liệu đặc thù mà một số bạn request, điều này ngoài khả năng của tôi.

Nói như vậy không có nghĩa tôi sẽ không giúp các bạn tìm số liệu cho những nghiên cứu định lượng của mình, thực ra tôi rất khuyến khích các bạn đi theo hướng nghiên cứu này vì đó là cách học kinh tế rất thực dụng và hữu ích. Tôi cũng rất thấu hiểu những khó khăn về số liệu mà các bạn đang phải đối đầu, tôi đã từng là sinh viên như các bạn. Trong entry này tôi muốn truyền lại một số kinh nghiệm của bản thân thời còn đi học để các bạn có thể tự tìm kiếm số liệu trước khi phải nhờ một ai đó, tôi luôn cho rằng kỹ năng và kiến thức về nguồn số liệu là những điều rất căn bản mà sinh viên kinh tế cần học.

Điều đầu tiên trước khi bạn bắt tay tìm kiếm số liệu là phải hiểu thật rõ mô hình lý thuyết mà mình định ước lượng. Cần hiểu kỹ các lý thuyết đằng sau nó và các mối quan hệ giữa các biến số. Điều này quan trọng vì hầu hết các số liệu thống kê thực tế không bao giờ trùng với khái niệm lý thuyết nên hiểu kỹ lý thuyết vừa giúp các bạn tránh chọn sai số liệu vừa giúp mở rộng tập hợp các số liệu có khả năng thay thế chuỗi số liệu mình không thể tìm được. Lấy ví dụ bạn có một mô hình cần sử dụng M3, tuy nhiên VN không có thống kê M3 nên bạn cần cân nhắc mô hình lý thuyết để xem thay M2 hay total credit vào mô hình đó liệu có được không. Hiểu mô hình lý thuyết còn giúp các bạn chọn instrument variables cho một số phương pháp econometric đặc thù.

Vấn đề thứ hai cần quan tâm là phải/nên hiểu bản chất và cách thức dữ liệu được thu thập/compile. Thực ra theo tôi đãy là thiếu sót của hầu hết các chương trình đào tạo kinh tế (cả ở các trường đại học nước ngoài) khi không dạy cho sinh viên về các thống kê kinh tế chủ yếu (cách thức thu thập, tính toán, hiệu chỉnh mùa vụ...). Hiểu được bản chất của chuỗi dữ liệu giúp bạn định hình được nó có thực sự phù hợp với mô hình định lượng của mình hay không. Nếu chạy mô hình xong kết quả không như mong đợi hoặc khác với kết quả của những nghiên cứu (ở các nước khác) thì đó là do dữ liệu hay do phương pháp tính toán của mình có sai sót. Có những bạn hỏi xin tôi số liệu về output gap, inflation expectation hay equity risk premium, cho thấy sự mơ hồ về chuỗi số liệu trong mô hình của mình. Hoặc những câu hỏi về đơn vị của REER, làm thế nào để chuyển năm gốc cho một chuối số liệu thực, có bao nhiêu loại hàng hóa trong rổ tính CPI, có thể tìm số liệu GDP theo tháng hay không, cũng cho thấy các bạn chưa thực sự quan tâm tìm hiểu về chuỗi số liệu của mình. Cần nhớ một nửa của kinh tế học là số liệu thống kê.


Với các bạn đang học undergraduate thì nguồn số liệu đầu tiên bạn phải nghĩ đến là thư viện trường mình (và các trường khác nếu bạn có thể tiếp cận được). Thời buổi mọi thứ được số hóa như hiện nay, có lẽ khó có thể nghĩ đến việc mất vài ngày thậm chí vài tuần vào lục thư viện và gõ lại số liệu vào máy tính, nhưng đó là những gì tôi đã làm khi còn đi học. Rất may là ngày nay thư viện đã và đang chuyển dần sang hình thức điện tử. Tôi biết các thư viện ở VN có rất ít resource nhưng các bạn vẫn nên tìm hiểu, hỏi các thủ thư xem họ có giúp được gì không. Một số database quốc tế về dữ liệu và tạp chí chuyên ngành cho phép thư viện của các trường đại học truy cập miễn phí, nhất là từ các nước đang phát triển. Các bạn (sinh viên và giáo viên) nên góp ý với thư viện trường mình lập danh sách những database nào họ có access để giúp sinh viên dễ dàng tìm kiếm số liệu.

Nguồn số liệu kinh tế tiếp theo là website của các cơ quan quản lý và thống kê quốc gia như TCTK, NHNN, BTC của VN. Những năm gần đây các cơ quan này đã có rất nhiều tiến bộ trong việc công bố thông tin, tôi rất mong họ sẽ tiếp tục xây dựng website tốt hơn nữa (có thể học tập template trên website của WB và IMF) và cung cấp thêm nhiều thông tin hơn nữa. [Một điểm tôi mong muốn các website này cải thiện là họ nên có một section về education cho đại chúng như các website của Fed, ECB, OECD]. Các bạn sinh viên nên bỏ một chút thời gian tìm hiểu cấu trúc và các ngóc ngách trên các trang web nói trên, nhất là website của TCTK. Nếu các bạn thực sự quan tâm đến số liệu và có ý định làm nghiên cứu định lượng, nên download số liệu về máy tính của mình và thỉnh thoảng cập nhận những database cá nhân này. Một skill quan trọng của các analyst trong lĩnh vực finance là phải nhớ được khi nào các cơ quan thống kê (cả nhà nước và tư nhân) release những thông số quan trọng (GDP, CPI, PMI, unemployment rate...).

Nguồn dữ liệu thứ ba là các website của các tổ chức quốc tế, vd WB, IMF, ADB, BIS, ILO, OECD. Trong số các tổ chức này, IMF có nhiều thông tin nhất và là tổ chức duy nhất có số liệu quí và tháng cho một số chỉ số quan trọng. IMF có một số database mà sinh viên từ các nước đang phát triển có thể truy cập miễn phí như IFS, DOTS, COFER, các bạn cần tìm hiểu và đang ký tài khoản để lấy số liệu. Rất tiếc vì tôi không thuộc diện được access miễn phí nên tôi không thử và hướng dẫn các bạn được, tuy nhiên đã có nhiều bạn confirm đã access thành công từ VN. Nếu có khó khăn gì các bạn thử liên hệ với văn phòng của IMF ở VN xin giúp đỡ, tôi tin họ sẽ rất nhiệt tình. Các bạn ở HN có thể đến thẳng văn phòng IMF và xin truy cập số liệu từ đó. UNDP và ADB cũng có văn phòng ở HN, nguồn số liệu trên website của ADB cũng rất tốt tuy chỉ có annual data.

Đối với số liệu nước ngoài, nhất là các nước phát triển, ngoài các nguồn quốc tế như IMF, OECD, các bạn có thể vào website của central bank của họ để tìm thông tin. Ví dụ website của FED, ECB, RBA, BOE, BOJ, ngay cả Bank of Thailand hay People Bank of China cũng có rất nhiều số liệu kinh tế. Một số nguồn không chuyên khác có số liệu tốt dù không nhiều/dài như CIA Factbook, The Economist Indicators (không phải EIU cần có tài khoản). Cuối cùng tất nhiên là Dr. Google và Google Scholar, người bạn không thể thiếu cho những người làm nghiên cứu.


Một số links số liệu quan trọng

Tổng cục Thống kê: Đây là nguồn quan trọng nhất cho các bạn sinh viên, ngoài các thông số kinh tế hàng tháng (chọn tháng trên dropdown menu có thể lấy được rất nhiều số liệu từ năm 2004) các bạn có thể xem số liệu năm trong mục "Số liệu thống kê" và số liệu của các cuộc điều tra kinh tế xã hội lớn (mục "Các cuộc điều tra").

Ngân hàng Nhà nước: Ngoài những chỉ số chính sách tiền tệ căn bản như các loại lãi suất chính sách và tỷ giá bình quân liên ngân hàng (reference rate), mục "Thị trường tiền tệ" có các thống kê về VNBOR, hoạt động thị trường mở và đấu thầu trái phiếu chính phủ. Một địa chỉ nữa cho các bạn quan tâm đến tài chính, tiền tệ là Bảo hiểm Tiền gửi Việt nam, mặc dù hiện tại chưa có nhiều số liệu.

Bộ Tài chính: Mục "Ngân sách nhà nước" có thống kê về ngân sách, chi thu của VN, ngoài ra còn có thông tin về các dự án ODA và đặc biệt là Bản tin nợ nước ngoài rất hữu ích. Số liệu về ngân sách nhà nước cũng có thể tra cứu trên website của Chinh phủ.

Bộ Lao động Thương binh và Xã hội: Mục Dữ liệu của bộ này có rất nhiều thông tin, chủ yếu kết quả của các cuộc khảo sát xã hội, rất có ích cho những bạn quan tâm đến labor market và các vấn đề xã hội. Đa số dữ liệu được cung câp dưới dạng bảng Excel khá tiện dụng.

Bộ Nông Nghiệp và Phát triển Nông thôn: Mặc dù một số trang trên website của bộ này bị lỗi và còn nhiều tài liệu không dùng Unicode, mục Thống kê - Dự báo có rất nhiều thông tin quan trọng. Tôi tìm thấy thống kê về khí tượng thủy văn của VN ở đây chứ không phải trên website của Bộ Tài nguyên Môi trường.

Bộ Công Thương: Mục Thống kê của bộ này rất tốt, số liệu xuất nhập khẩu khá chi tiết (các bạn có thể update bảng số liệu REER/NEER mà tôi cung cấp trước đây bằng số liệu xuất nhập khẩu từ trang web này). Phần thông tin về vốn đầu tư cũng khá chi tiết.

[Bộ Kế hoạch và Đầu tư, Bộ Tài nguyên Môi trường, Bộ Khoa học Công nghệ là những bộ tôi rất thất vọng vì không có các cơ sở dữ liệu/thống kê chuyên ngành đáng ra phải có.]

IMF: Như đã nói bên trên, IMF có một số database rất quan trọng về kinh tế vĩ mô, theo tôi được biết họ cung cấp miễn phí cho các nước đang phát triển nên các bạn ở VN có thể truy cập được. Những database quan trọng là WEO, IFS, DOTS, BOPS, GFS. Ngoài ra trong chuyên mục Vietnam and the IMF cũng có rất nhiều thông tin. Khi còn là sinh viên và không có truy cập vào IFS tôi thường xuyên vào chuyên mục này lấy số liệu của VN từ các Staff Report và Statistical Appendixes do văn phòng IMF Vietnam công bố hàng năm. Trong chuyên mục này cũng có rất nhiều bài nghiên cứu quan trọng về VN của các chuyên gia IMF. Năm ngoái có một bài về Output gap của VN sử dụng Bayesian estimation những bạn quan tam về vấn đề này nên tham khảo. IMF website là nguồn số liệu tất cả sinh viên kinh tế bắt buộc phải biết.

WB: Cách đây mấy năm WB đã cho access miễn phí vào tất cả các database của họ (thời tôi đi học chỉ được access vào World Development Indicators). Số liệu của WB rất rộng và họ bắt đầu có các chuỗi số liệu theo quí (trước đây chỉ có số liệu theo năm). Đây cũng là nguồn số liệu bắt buộc cho sinh viên kinh tế.

ADB: Số liệu của tổ chức này rất tốt, tiếc là cũng chỉ có annual data như WB. Chuyên mục Key Indicators có rất nhiều bảng Excel số liệu được update hàng năm (và có lẽ là data source duy nhất lưu trữ theo vintage, nghĩa là các version khác nhau hàng năm).

UNDP: Tổ chức này có một database quan trọng liên quan đến chỉ số Human Development Indicator được sử dụng rộng rãi trong các nghiên cứu kinh tế.

UNCTADSTAT: Database của Unctad, một tổ chức thuộc UN tương tự như UNDP, chuyên về trade data. Số liệu ngoại thương ở database này (cho VN) tương đương như của Bộ Công thương và DOTS của IMF tôi trích dẫn bên trên.

BIS: Mặc dù không có nhiều số liệu về VN, đây là địa chỉ quan trọng cho những bạn quan tâm đến số liệu banking and finance quốc tế.

OECD: database này chủ yếu phục vụ cho các thành viên của OECD nhưng có rất nhiều chỉ số quốc tế (một số phải trả tiền).

FRED (của Fed St Louis): Trong số các website của các ngân hàng trung ương, đây là database lớn nhất và uy tín nhất với gần như toàn bộ số liệu macro của Mỹ, có những chuỗi dài gần 100 năm. Database này cũng có số liệu của một số nước phát triển khác. Ngoài ra Fed còn có một số data tại địa chỉ này và hầu hết các chi nhánh Fed khác cũng cung cấp dữ liệu (NY, Kansas, San Francisco, Chicago, Cleveland).

Các central banks lớn khác như ECB, BoE, BoJ, RBA, tuy nhiên số liệu chủ yếu cho các nước của họ.

Pen World Table: một nguồn số liệu về national account tính theo PPP cho gần như tất cả các nước. Đây là một database lâu đời và rất uy tín trong giới học thuật tuy nhiên số liệu update chậm hơn so với nguồn WB và IMF.

The World Top Income Database: số liệu về VN đang được thu thập, hi vọng sẽ có sớm.

Economagic.com: số liệu của Mỹ và một số của Úc, ECB, BoJ




Một số nguồn dữ liệu tài chính

Damodaran: GS Aswarth Damodaran (NYU) cung cấp một database rất lớn về số liệu của các công ty đại chúng (US and non-US, trong đó có một số công ty VN). Website này còn cung cấp một số spreadsheet tính toán liên quan đến valuation rất hữu ích cho các bạn sinh viên tài chính.




(Danh sách này sẽ tiếp tục được bổ sung trong tương lai, nếu bạn nào biết link nào hữu ích muốn chia sẻ thì báo cho tôi qua email hoặc để lại link dưới phần comment).




28 comments:

  1. This comment has been removed by the author.

    ReplyDelete
  2. Một chỗ để tìm số liệu rất tốt nữa là Penn World Table.

    Nhưng theo mình nghĩ thì cũng cần hướng các em có một tư tưởng kinh tế chứ không phải lúc nào cũng định lượng. Đào sâu và phát triển những khái niệm như market failure, government failure, incentive, invisible hand cũng tuyệt lắm chứ.

    ReplyDelete
  3. cám ơn Ts Giang vì những chia sẻ rất bổ ích trên blog này.

    ReplyDelete
  4. This comment has been removed by the author.

    ReplyDelete
  5. Bác Giang cho cháu hỏi cách tính Expectations Operater với ạ.
    trong phương trình
    yt = Et*Y(t+1)- 1/c(1)*(it-Et*inf(t+1))
    Ta đã có số liệu output gap, lãi suất danh nghĩa, lạm phát. ta có thể ước lượng chuỗi Et trong Eviews bằng cách nào ạ?
    Cháu cám ơn bác.

    ReplyDelete
    Replies
    1. Bạn cần đọc kỹ lại lý thuyết. Et là expectation operator, nghĩa là tương đương như dấu cộng hay dấu trừ trong biểu thức trên chứ không phải một biến số để bạn tính. Eviews hay bất kỳ chương trình econometrics nào cũng không thể tính được nó cho bạn.

      Delete
    2. Et Y(t+1)là kỳ vọng sản lượng thời điểm t+1 tại thời điểm t.
      Bác chỉ giúp cháu cách xử lý phương trình trên trong eview với ạ. Cháu đã có số liệu, nhưng không biết cách trình bày các biến kỳ vọng này.
      Cháu có thể làm theo cách này được khộng ạ:
      Y(t+1) = Et Y(t+1) + ut
      <=> Et Y(t+1) = Y(t+1) - ut
      với ut là một dãy white noise. Từ đó ta tạo 1 chuỗi này rồi đưa vào phương trình thay thế cho Et Y(t+1)
      Cám ơn bác rất nhiều!

      Delete
    3. Tôi đã giải thích bên trên rồi, Eviews hay bất kỳ chương trình nào cũng không tính được cho bạn. Bạn phải quay về mô hình lý thuyết. Cách bạn trình bày ở trên là áp dụng rational expectation vào mô hình, tuy nhiên bạn có thể áp dụng random walk (EtYt+1=Yt) hay adaptive expectation (EtYt+1=a*Yt+b*(Yt-Et-1Yt)). Thậm chí bạn có thể giải toàn bộ mô hình lý thuyết để loại bỏ expectation (gọi là reduced form) với những giả định về expectation.

      Delete
    4. cháu đã hiểu. Rất cám ơn bác ^^

      Delete
  6. Cám ơn Thầy vì những chia sẻ có ích cho sinh viên nghiên cứu kinh tế.Chúc thầy sức khỏe.

    ReplyDelete
  7. Bác Giang có thể giúp cháu cái này với được không ạ!
    Trên trang web của treasurydirect có công bố kết quả của phiên đấu giá trái phiếu như sau
    Lãi suất : 2%
    Yield : 1,954%
    Price : 102.667445
    Offering amt : 6 billion
    Total tendered : 15,789,306,000
    Total accepted : 7,157,942,000
    Cháu không hiểu offering amt là gì, rất mong được bác hướng dẫn, cháu xin cảm ơn. Đây là link của công bố nói trên: http://www.treasurydirect.gov/RI/OFAuctions?form=extended&cusip=912828GN4

    ReplyDelete
    Replies
    1. Link của bạn bị broken, tôi không vào đọc được nhưng đoán amt là viết tắt của amount, nghĩa là số lượng chào thầu.

      Delete
  8. Cháu để lại link này, bác có thể click vô từng cusip để thấy chi tiết. trong này có cả total tender (cháu nghĩ cái này là khối lượng gọi thầu) nên bác xem lại giùm cháu offering Amt nghĩa là gì
    Cháu đang tìm số liệu dư nợ TIPS tính đến thời điểm hiện tại nên rất cần những thông tin trên.
    Cháu cảm ơn bác trước ạ !

    ReplyDelete
    Replies
    1. Total tendered là khối lượng dự thầu còn offering amt là khối lượng chào thầu, total accepted là khối lượng trúng thầu.

      Delete
  9. http://www.treasurydirect.gov/RI/OFAuctions
    đây là link ạ

    ReplyDelete
  10. cháu rất cảm ơn bác
    chúc bác luôn vui vẻ, hạnh phúc

    ReplyDelete
  11. Bác Giang ơi, bác chỉ cho cháu cách lấy số liệu của IMF được không ạ

    ReplyDelete
    Replies
    1. Tôi không ở VN nên không thuộc diện được free access vào database của IMF. Nhưng có một số bạn ở VN đã confirm lấy được dữ liệu từ nguồn này rồi. Nếu bạn có khó khăn tốt nhất liên hệ với văn phòng IMF VN nhờ họ hướng dẫn.

      Delete
    2. thầy nói Et tương đương là dấu cộng hay dấu trừ.vậy trong trường hợp nào là dấu trừ,trong trường hợp nào là dấu cộng ạ.

      Delete
    3. Đấy là tôi nói ý nghĩa của một operator. Et là một operator giống như dấu cộng hay dấu trừ cũng là một operator trong một biểu thức.

      Delete
  12. cháu cảm ơn bác ạ

    ReplyDelete
  13. Thầy ơi! Thầy cho con xin số liệu tiền gửi của cá nhân, doanh nghiệp vào hệ thống ngân hàng thương mại VN nha Thầy. con cũng lang thang trên mạng nhiều rùi mà ko tìm được ạ

    ReplyDelete
    Replies
    1. Tôi không có số liệu này, bạn phải contact với NHNN xin họ vì chỉ NHNN mới có những số liệu đó.

      Delete
  14. bác cho cháu hỏi giờ cháu muốn tìm GDP toàn cầu theo quý ở đâu ạh? cháu cảm ơn bác

    ReplyDelete
    Replies
    1. Tôi không biết có tổ chức nào thống kê GDP toàn cầu theo quí cả. IMF có một số report (WEO) có đề cập đến global GDP nhưng cũng chỉ là ước tính.

      Delete
  15. Bác Lê cho cháu hỏi cái này với được không ạ!
    Cháu đọc trên nhiều tài liệu tiếng anh có cụm từ ex-ante analysis và expost analysis, cháu cũng mới chỉ hiểu sơ sơ thôi, không hiểu nó nên được dịch như thế nào và ý nghĩa của nó. Cháu nhờ bác giải đáp giùm cháu, cháu xin cảm ơn bác nhiều !

    ReplyDelete
    Replies
    1. ex-ante (có người dịch là tiền nghiệm) nghĩa là trước khi sự việc xảy ra, ex-post (hậu nghiệm) là sau khi sự việc xảy ra.

      Delete
    2. cháu cũng thấy có người dịch là phân tích tiên đoán (nghe kỳ kỳ)- nghĩa là mình dự đoán cho những kết quả có thể xảy ra và phân tích hậu suy- nghĩa là dựa vào những kết quả đã xảy ra để phân tích xem những dự đoán của mình có đúng không, phải không bác
      cháu cảm ơn rất nhiều vì bác đã reply. chúc bác luôn vui và nhiều sức khỏe

      Delete