Báo cáo tại Hội thảo KHXH Thời Hội nhập tổ chức ngày 15-12-2011 tại ĐHQG-HCM
Hai chữ khoa học trong khoa học xã hội có thể hiểu bằng nhiều nghĩa khác nhau, nhưng ở đây tôi muốn nói đến những khám phá tri thức mới có độ tin cậy và chính xác cao. Cách hiểu khoa học này thật ra xuất phát từ khoa học tự nhiên, nhưng cũng có thể áp dụng cho khoa học xã hội. Trong bài này, tôi sẽ bàn về việc ứng dụng khoa học thống kê (statistical science, chứ không phải đơn thuần thống kê học – statistics) như là một phương tiện để khám phá tri thức mới cho các nhà khoa học xã hội.
Các dữ liệu từ nghiên cứu khoa học xã hội thường rất phức tạp, vì mang tính đa biến và đa chiều. Khám phá những cơ cấu và mối liên hệ giữa các yếu tố trong một nghiên cứu là một thách thức lớn cho các nhà khoa học xã hội. Tuy nhiên, những phát triển trong khoa học thống kê đã giúp cho việc khám phá dễ dàng hơn. Ứng dụng của khoa học thống kê trong khoa học xã hội có thể chia thành hai nhóm: thiết kế nghiên cứu và suy luận khoa học.Bất cứ công trình nghiên cứu nào cũng khởi đầu từ khâu thiết kế, và khoa học thống kê đóng góp vào việc (a) chọn mô hình nghiên cứu thích hợp và tối ưu cho câu hỏi nghiên cứu; (b) ước lượng cỡ mẫu cần thiết cho mô hình nghiên cứu; cách lấy mẫu sao cho đảm bảo tính đại diện một quần thể.
Phân tích dữ liệu trong khoa học xã hội có thể chia thành hai nhóm chính: mô tả và suy luận. Mỗi nhóm phân tích đều có sự đóng góp của khoa học thống kê. Đối với phân tích mô tả, các phương pháp “cổ điển” như kiểm định Ki bình phương (Chi-squared test), kiểm định t, kiểm định z có thể ứng dụng để đáp ứng những câu hỏi nghiên cứu đơn giản. Rất nhiều phương pháp phân tích suy luận (inferential statistics) có thể ứng dụng cho các nghiên cứu khoa học xã hội. Các phương pháp định lượng mang tính suy luận bao gồm các mô hình phân tích hai biến (bivariate analysis) và đa biến (multivariate analysis) là những phương pháp quan trọng hỗ trợ cho nhà nghiên cứu trong việc thẩm định những mối tương quan phức tạp trong khoa học xã hội. Những phương pháp phân tích đa biến như phân tích yếu tố (factor analysis) và phân tích cụm (cluster analysis) còn giúp cho nhà nghiên cứu giảm độ phức tạp của cơ cấu dữ liệu, và dẫn đến những khám phá mà các phương pháp phân tích đơn giản không thể nào phát hiện được. Những mô hình như hồi qui tuyến tính, hồi qui logistic, hồi qui Poisson, hồi qui Cox cung cấp những phương tiện định lượng rất quan trọng trong việc khám phá các yếu tố có ảnh hưởng đến một sự cố hay hiện tượng xã hội.
Trong vài năm gần đây, khoa học thống kê đã có những phát triển ngoạn mục, và những phát triển này cung cấp cho khoa học xã hội những phương pháp định lượng để có những khám phá mới. Những phát triển mới trong mô hình tuyến tính cho phép nhà nghiên cứu phân tích những dữ liệu thu thập theo thời gian (longitudinal research). Với sự phát triển của máy tính, các nhà nghiên cứu khoa học xã hội đã có thể tiếp cận các phương pháp phân tích “hiện đại” như bootstrap và mô phỏng MCMC (Markov Chain Monte Carlo) mà trước đây chỉ dành cho các nhà khoa học thống kê chuyên nghiệp. Phương pháp MCMC cũng giúp cho các nhà khoa học xã hội có thể phân tích dữ liệu theo trường phái Bayes (Bayesian approach). Các phương pháp Bayes càng ngày càng trở nên hấp dẫn và quan trọng trong khoa học xã hội, vì các phương pháp này cho phép nhà nghiên cứu phát biểu về độ tin cậy của một giả thuyết khoa học dựa trên dữ liệu quan sát (thay vì phương pháp cổ điển chỉ cho phép nhà nghiên cứu phát biểu về dữ liệu quan sát trên cơ sở giả thuyết khoa học).
Ở nước ta, có một nghịch lí đáng chú ý: các nghiên cứu về khoa học xã hội hiện diện trên các tạp chí trong nước rất nhiều, nhưng lại xuất hiện rất ít trên các tạp chí khoa học quốc tế. Số liệu thống kê năm 2004 cho thấy trong số 8408 bài báo khoa học trong các tạp chí và kỉ yếu khoa học, có đến 4345 (hay 53%) là những bài báo liên quan đến khoa học xã hội. Tuy nhiên, trong năm 2004, con số bài báo khoa học xã hội trên các tạp chí khoa học quốc tế chưa quá con số 10 bài. Ngoài ra, phân tích của chúng tôi cho thấy trong thời gian 1996 – 2005, trong tổng số 3456 bài báo khoa học từ Việt Nam trên các tạp chí quốc tế, chỉ có 69 bài (tức khoảng 2%) liên quan đến ngành khoa học xã hội. Do đó, tuy số lượng nghiên cứu khoa học xã hội ở nước ta cao hơn so với các ngành khoa học tự nhiên, nhưng đại đa số những nghiên cứu đó chỉ xuất hiện trên các tạp chí trong nước, và rất ít xuất hiện trên các tạp chí quốc tế.
Một trong những “nguyên nhân” cho sự hiện diện khiêm tốn của khoa học xã hội Việt Nam trên trường quốc tế là vấn đề phương pháp định lượng. Có thể nói rằng phần lớn những nghiên cứu khoa học xã hội ở Việt Nam chưa tận dụng những phương pháp khoa học (scientific method) và phương pháp thống kê trong việc thiết kế nghiên cứu, phân tích dữ liệu, và diễn giải dữ liệu. Một số nghiên cứu có sử dụng phương pháp thống kê, nhưng chưa hẳn có hệ thống và chưa thích hợp. Nhiều sai sót hiển nhiên về cách lấy mẫu, phân tích và suy luận từ dữ liệu có thể tìm thấy trong rất nhiều bài báo trong ngành khoa học xã hội. Những thiếu sót về phương pháp dẫn đến chất lượng nghiên cứu chưa được cao, và hệ quả là nhiều công trình khó có cơ hội để được công bố trên các tạp chí khoa học xã hội quốc tế.
Ở các nước tiên tiến, khoa học thống kê (statistical science) đóng một vai trò rất quan trọng trong việc phát triển khoa học xã hội. Từ năm 1965, báo cáo Hội đồng Nghiên cứu Khoa học Xã hội ở Anh (Social Science Research Council) nhấn mạnh rằng nếu không có thống kê học và toán học, thì khoa học xã hội không thể nào phát triển được. Do đó, khoa học xã hội ở nước ta cần đến khoa học thống kê để phát triển. Khoa học thống kê có thể giúp cho các nhà khoa học xã hội phân tích mô tả và phân tích suy luận, và dẫn đến những khám phá có ý nghĩa thực tế và giúp cho việc hoạch định các chính sách công hữu hiệu hơn.
0 comments:
Post a Comment