Economic data
Giang Le
Thời gian gần đây tôi nhận được rất nhiều comment trên blog và email của các bạn sinh viên hỏi xin số liệu kinh tế. Mặc dù có một số request không thực sự nghiêm túc, đa số các bạn đều hiểu mình làm gì và cần gì dữ liệu gì. Đây là dấu hiệu tốt vì nó chứng tỏ chất lượng đào tạo kinh tế đang được cải thiện và các bạn sinh viên đang dần dần tiếp cận với những lý thuyết và mô hình định lượng rất tiên tiến chứ không chỉ viết "essay" như trước. Đáng tiếc là tôi không thể đáp ứng được hầu hết request của các bạn vì hai lý do sau.
Thứ nhất nguồn số liệu mà tôi sử dụng (từ Datastream của Thomson Reuters) có bản quyền nên tôi không thể công bố rộng rãi. Trước đây tôi đã để link cho các bạn download số liệu GDP và REER của VN, mặc dù không hoàn toàn legal nhưng có thể justify được phần nào vì thực ra những số liệu đó được TCTK công bố công khai trên website và các ấn phẩm của họ. Hơn nữa đó là những số liệu liên quan trực tiếp đến những bài viết mà tôi công bố (về potential GDP và REER) nên theo truyền thống của giới academic quốc tế những số liệu đó cần phải được công khai để người đọc có thể kiểm tra lại kết quả tính toán của tôi nếu họ muốn. Thứ hai là ngay cả Datastream và các dịch vụ số liệu chuyên nghiệp cũng có nhiều hạn chế về số liệu kinh tế VN, cả về số lượng lẫn chất lượng. Tôi đã từng chỉ ra số liệu về lãi suất qua đêm liên ngân hàng của Datastream khác xa số liệu của NHNN. Một số sai lệch khác về số liệu lạm phát của Datastream so với TCTK cũng đã từng làm tôi đau đầu. Bởi vậy ngoại trừ những chuối số liệu phổ biến và có chất lượng tương đối tốt, tôi sẽ phải mất rất nhiều thời gian browse/search Datastream và các nguồn khác để tìm các chuỗi số liệu đặc thù mà một số bạn request, điều này ngoài khả năng của tôi.
Thời gian gần đây tôi nhận được rất nhiều comment trên blog và email của các bạn sinh viên hỏi xin số liệu kinh tế. Mặc dù có một số request không thực sự nghiêm túc, đa số các bạn đều hiểu mình làm gì và cần gì dữ liệu gì. Đây là dấu hiệu tốt vì nó chứng tỏ chất lượng đào tạo kinh tế đang được cải thiện và các bạn sinh viên đang dần dần tiếp cận với những lý thuyết và mô hình định lượng rất tiên tiến chứ không chỉ viết "essay" như trước. Đáng tiếc là tôi không thể đáp ứng được hầu hết request của các bạn vì hai lý do sau.
Thứ nhất nguồn số liệu mà tôi sử dụng (từ Datastream của Thomson Reuters) có bản quyền nên tôi không thể công bố rộng rãi. Trước đây tôi đã để link cho các bạn download số liệu GDP và REER của VN, mặc dù không hoàn toàn legal nhưng có thể justify được phần nào vì thực ra những số liệu đó được TCTK công bố công khai trên website và các ấn phẩm của họ. Hơn nữa đó là những số liệu liên quan trực tiếp đến những bài viết mà tôi công bố (về potential GDP và REER) nên theo truyền thống của giới academic quốc tế những số liệu đó cần phải được công khai để người đọc có thể kiểm tra lại kết quả tính toán của tôi nếu họ muốn. Thứ hai là ngay cả Datastream và các dịch vụ số liệu chuyên nghiệp cũng có nhiều hạn chế về số liệu kinh tế VN, cả về số lượng lẫn chất lượng. Tôi đã từng chỉ ra số liệu về lãi suất qua đêm liên ngân hàng của Datastream khác xa số liệu của NHNN. Một số sai lệch khác về số liệu lạm phát của Datastream so với TCTK cũng đã từng làm tôi đau đầu. Bởi vậy ngoại trừ những chuối số liệu phổ biến và có chất lượng tương đối tốt, tôi sẽ phải mất rất nhiều thời gian browse/search Datastream và các nguồn khác để tìm các chuỗi số liệu đặc thù mà một số bạn request, điều này ngoài khả năng của tôi.
Nói như vậy không có nghĩa tôi sẽ không giúp các bạn tìm số liệu cho những nghiên cứu định lượng của mình, thực ra tôi rất khuyến khích các bạn đi theo hướng nghiên cứu này vì đó là cách học kinh tế rất thực dụng và hữu ích. Tôi cũng rất thấu hiểu những khó khăn về số liệu mà các bạn đang phải đối đầu, tôi đã từng là sinh viên như các bạn. Trong entry này tôi muốn truyền lại một số kinh nghiệm của bản thân thời còn đi học để các bạn có thể tự tìm kiếm số liệu trước khi phải nhờ một ai đó, tôi luôn cho rằng kỹ năng và kiến thức về nguồn số liệu là những điều rất căn bản mà sinh viên kinh tế cần học.
Điều đầu tiên trước khi bạn bắt tay tìm kiếm số liệu là phải hiểu thật rõ mô hình lý thuyết mà mình định ước lượng. Cần hiểu kỹ các lý thuyết đằng sau nó và các mối quan hệ giữa các biến số. Điều này quan trọng vì hầu hết các số liệu thống kê thực tế không bao giờ trùng với khái niệm lý thuyết nên hiểu kỹ lý thuyết vừa giúp các bạn tránh chọn sai số liệu vừa giúp mở rộng tập hợp các số liệu có khả năng thay thế chuỗi số liệu mình không thể tìm được. Lấy ví dụ bạn có một mô hình cần sử dụng M3, tuy nhiên VN không có thống kê M3 nên bạn cần cân nhắc mô hình lý thuyết để xem thay M2 hay total credit vào mô hình đó liệu có được không. Hiểu mô hình lý thuyết còn giúp các bạn chọn instrument variables cho một số phương pháp econometric đặc thù.
Vấn đề thứ hai cần quan tâm là phải/nên hiểu bản chất và cách thức dữ liệu được thu thập/compile. Thực ra theo tôi đãy là thiếu sót của hầu hết các chương trình đào tạo kinh tế (cả ở các trường đại học nước ngoài) khi không dạy cho sinh viên về các thống kê kinh tế chủ yếu (cách thức thu thập, tính toán, hiệu chỉnh mùa vụ...). Hiểu được bản chất của chuỗi dữ liệu giúp bạn định hình được nó có thực sự phù hợp với mô hình định lượng của mình hay không. Nếu chạy mô hình xong kết quả không như mong đợi hoặc khác với kết quả của những nghiên cứu (ở các nước khác) thì đó là do dữ liệu hay do phương pháp tính toán của mình có sai sót. Có những bạn hỏi xin tôi số liệu về output gap, inflation expectation hay equity risk premium, cho thấy sự mơ hồ về chuỗi số liệu trong mô hình của mình. Hoặc những câu hỏi về đơn vị của REER, làm thế nào để chuyển năm gốc cho một chuối số liệu thực, có bao nhiêu loại hàng hóa trong rổ tính CPI, cũng cho thấy các bạn chưa thực sự quan tâm tìm hiểu về chuỗi số liệu của mình. Cần nhớ một nửa của kinh tế học là số liệu thống kê.
Không có nhận xét nào:
Đăng nhận xét