"Trí tuệ giàu lên nhờ cái nó nhận được,con tim giàu lên nhờ cái nó cho đi" - Victor Hugo.You can make a living by what you get, but you can make a life by what you give- Winston Churchill

Tuesday, November 15, 2011

Introduction to SPSS (Statistical Package for the Social Sciences)

Phầm mềm không lạ mà cũng chẳng quen. Nghe đến thì nhiều mà ứng dụng đến thì lại ít. Nhân tiện chuẩn bị dùng lại. Tranh thủ ghi vào đây có gì để tham khảo cho tiện và cũng để giới thiệu cho những ai cần quan tâm. Tài liệu không phải do mình viết ra (Gu gồ hết) nhưng được tổng hợp và edit lại dựa trên hiểu biết của bản thân, có chỗ nào chưa đúng ... hãy tự gu gồ lại vậy.

Phần đầu mang tính giới thiệu sơ qua về SPSS. Phần sau mình sẽ nói đến cách nhập liệu, gán biến cũng như cách report bảng kết quả (out put) của SPSS.

Để hiểu và nắm chắc được cách sử dụng SPSS thì không có gì khó,phải nói rằng nó cực kỳ tiện lợi nhưng, btw, nó cũng chỉ là một phần mềm. Để sử dụng được ngoài hiểu biết tối thiểu về xác suất thống kê, thì để áp dụng vào trong NCKH (đặc biệt là khoa học xã hội), người dùng cũng cần có kiến thức tối thiểu về NCKH i.e, biến độc lập (independent var), biến phụ thuộc (dependent var), cỡ mẫu (samples size), phân phối chuẩn (normal distribution) ... Ở đây mình giới thiệu SPSS v.16.0. Khá là thích hợp với mọi người. từ v.17 trở đi nó có vì yêu cầu về cấu hình máy như Ram, Windows Vista trở lên ...

Ôi, tôi đi chết đây ... hik

Phần mềm SPSS có tất cả 4 dạng màn hình:
- Data view : Màn hình quản lý dữ liệu. Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
- Variables view : Màn hình quản lý biến. Là nơi quản lý các biến cùng với các thông số liên quan đến biến như:
+ Name (Tên biến) : Là tên đại diện cho biến, tên biến này sẽ được hiễn thị trên đầu mỗi cột trong màn hình dữ liệu
+ Type (Loại biến ): Có dạng số và dạng chuỗi
+ Label (Nhãn của biến): Tên biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến.
+ Values (Giá trị trong biến ): Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)
+ Missing (Giá trị khuyết): SPSS mặc định giá trị khuyến (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê.
+ Measures (Dạng thang đo): Hiễn thị dạng thang đo của giá trị trong biến

- Màn hình hiễn thị kết quả (output) : Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồi thị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là .SPO). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích.

- Màn hình cú pháp (syntax) : Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác các lệnh phân tích lại.

Tạo biến và nhập dữ liệu trên SPSS
Tạo biến trong màn hình quản lý biến : Nhấp vào Variables view
Name: Gõ tên biến cần khai báo
Type: Kiểu biến
Variable Label: Đặt tên nhãn cho biến một cách đầy đủ hơn
Value lables : Định tên cho các giá trị trong biến
Missing Values: Được dùng để định ra các giá trị cụ thể cho các giá trị mà ta muốn loại bỏ ra khỏi các phân tích và xử lý thống kê
Column: Định ra chiều rộng của cột đang khai báo biến
Align: Canh lề
Measurement: Chọn loại thang đo
Nhập dữ liệu
Nhập trực tiếp trên spss hay cũng có thể nhập liệu từ các phần mềm khác như Excel, Fox, … và sau đó chuyển vào trong SPSS thông qua Menu File-open

Công cụ tính toán giữa các biến (Compute)
Công cụ compute được dùng để tính toán giữa các giá trị trong các biến và kết quả sẽ được lưu giữ trong một biến mới hoặc là một biến khác sẳn có hoặc biến chứa đựng giá trị đang tính toán. Để thực hiện công cụ này ta vào Menu Transform Compute : Xuất hiện:
Mục Target variable : Tên biến sẽ nhận giá trị được tính
Ô Numeric Expressionn: chứa các biểu thức số được dùng để tính giá trị cho biến mới. Chúng ta có thể soạn các biểu thức tính toán vào thẳng ô Numeric Expression, và có thể sữ dụng các công cụ được hiển thị trong hộp thoại như các phiếm (+), (-), Function,…
Công cụ if : Dùng để định ra những điều kiện cần thiết kèm theo trong tính toán nếu có

Xử lý và phân tích dữ liệu
Kiểm tra dữ liệu (Explore) :
SPSS cung cấp cho công cụ Explore để xem xét và kiểm tra dữ liệu:
· Phát hiện các sai sót
· Nhận dạng dữ liệu để tìm phương pháp phân tích thích hợp và chuẩn bị cho việc kiểm tra giả thuyết

Để kiểm tra dữ liệu, chọn trên menu Analyze-Descriptive-Statistic- Explore… để mở hộp thoại Explore
Dependent list: Đưa các biến cần kiểm tra vào đây.
Display : Cho phép chúng ta chọn cách hiễn thị kết quả.
Statistics : Cho phép ta lựa chọn các thống kê hiễn thị như :
Descriptives : Hiễn thị các giá trị thống kê như giá trị trung bình, khoảng tin cậy, trung vị, trung bình giãn lược, giá trị nhỏ nhất, lớn nhất, khoảng biến thiên, các bách phân vị
M-estimators: Hiễn thị các giá trị trung bình theo 4 loại trọng số
Outliers: Hiễn thị các quan sát có 5 giá trị nhỏ nhất và 5 giá trị lớn nhất, gọi là Extreme Values
Percentiles: Hiển thị các giá trí bách vị phân

Kiểm nghiệm Kolmogorov-Smirnov (Lilliefors)
Kiểm nghiệm Kolmogorov-Smirnov, dùng để kiểm nghiệm tính chuẩn tắc của một mẫu hay hai mẫu.
Kiểm nghiệm Levene
Kiểm nghiệm Levene là phép kiểm nghiệm tính đồng nhất của phương sai. Ở đây ta kiểm nghiệm giả thuyết cho rằng phương sai của giữa các mẫu quan sát là bằng nhauLập bảng phân bố tần suất cho biến một trả lời (Frequencies)

Kiểm Định Mối Liên Hệ
a. Kiểm định mối liên hệ giữa hai biến Định danh-định danh,định danh-định thức (H o : hai biến không có liên hệ gì với nhau)

Người ta dùng Kiểm định Chi-square để kiểm tra xem liệu một biến này có quan hệ hay không với một biến khác, tuy nhiên phương pháp kiểm nghiệm này không chỉ ra cường độ của mối quan hệ giữa hai biến mạnh hay yếu giữa 2 biến, các hệ số trong kiểm nghiệm Chi_square như sau:
· Hệ số Pearson Chi-square và Likelihood Ratio cho biết có mối liên hệ giữa hai biến định tính hay không (sig rất nhỏ)
· Hệ số Linear-by-linear association Đo lường mối liên hệ tuyến tính giữa hai biến.(hữu dụng khi hàng cột xếp theo thứ tự tăng dần)
· Chỉ số Continuity Correction đánh giá mối tương quan giữa hai biến (dạng 2 x 2)trong bảng.

Cách thực hiện trong SPSS: vào Analyze-Descriptive Statitics- Crosstab. Hiện hộp thoại, trong đó ta đưa hai biến cần kiểm tra vào 2 ô : Row và Column sau đó nhấn ok là xong. Ta có thể vào trong phần Statistic để chọn các thông số thống kê:

Nornimal: dùng cho 2 biến định danh.
Ordinal : dùng cho 2 biến dạng thứ bậc.
Trong phần Cells: tương tự, hãy vào mà khám phá nó.

b. Kiểm định mối liên hệ giữa hai biến Thứ Bậc
- Phát biểu giả thuyết Ho : không có mối liên hệ nào giữa các biến trong tổng thể
- Thực hiện trong SPSS : AnalyzeàDescriptive Statiticsà Crosstab,
- Đưa biến vào 2 ô : Row và Column , nhấn vào Statistics và chọn : Chi square, correlation, gamma, somer’s , tau_b..

c. Kiểm định mẫu đang xét có là phân phối chuẩn không
- Phát biểu giả thuyết Ho : Độ sai lệch của tổng thể 2 giá bất động sản là phân phối chuẩn(tức giá trị dự báo đáng tin cậy).
- Ứng dụng : Kiểm định này dùng để kiểm định giả thuyết phân phối của dữ liệu có phù hợp với phân phối lý nthuyết .nó tiến hành xem xét các sai lệch giữa Giá trị cũ và giá trị mới của bất động sản, sai lệch tuyệt đối càng lớn ,giả thuyết Ho càng dễ bị bác bỏ.

Cách thực hiện:
- Bước 1: Transform Compute , hiện hộp thoại: Nhập tên biến mới vào khung : Target Variabel. Khung Numberic Expression : ta nhập : giáBĐS_dự Báo – Giá BĐScũ. Sau đó nhấn ok.
- Bước 2 : Analyze Nonparametric Test 1 _ sample K S xuất hiện hộp thoại sau: Đưa biến mới tạo bước 1 vao khung Test Variable List. Phần Test Distribution : ta chọn loại phân phối chuẩn (Normal) , nhấn OK là xong.

(sưu tầm)

0 comments: