Phân phối chuẩn là gì? Cách thực hiện trong SPSS

Phân phối chuẩn là gì? Ý nghĩa của phân phối chuẩn xác suất thống kê là như thế nào? Hôm nay, hãy cùng Psycare.com.vn tìm hiểu về cách thực hiện phân phối chuẩn dữ liệu trong SPSS khi thực hiện các đề tài nghiên cứu khoa học Tâm lý học nhé!

1. Khái niệm phân phối chuẩn là gì?

Là phân phối xác suất liên tục cho một biến ngẫu nhiên. Biến ngẫu nhiên là biến mà giá trị của nó phụ thuộc vào kết quả của một sự kiện ngẫu nhiên.

Có dạng hình chuông (bell curve), đối xướng qua giá trị trung bình; tức là trông giống như một ngọn đồi với đỉnh được xác định rõ, thì nó là phân phối chuẩn. Đỉnh của đường cong nằm ở mức trung bình và dữ liệu được phân phối đối xứng ở 2 bên của nó. Các giá trị trung bình, trung vị và mode bằng nhau hoặc nằm gần nhau.

phân phối chuẩn là gì
Mô tả ví dụ về phân phối chuẩn của dữ liệu xác suất thống kê.

2. Cách tính phân phối chuẩn xác suất thống kê trong SPSS

2.1. Tính phân phối chuẩn của dữ liệu

Cùng Psycare.com.vn thực hiện trên file Data mẫu nhé!

  • Bước 1: Tại giao diện chính của SPSS: Vào Analyze -> Descriptive Statistics -> Frequencies…
Bước 1 phân phối chuẩn spss
Bước 1: Chọn Frequencies…
  • Bước 2: Tại hộp thoại Frequencies hiện lên, chuyển biến định lượng (biến “Stress” hoặc “ESSA” trong file Data mẫu) sang ô Variable(s).
Bước 2 phân phối chuẩn spss
Bước 2: Chọn biến định lượng vào ô Variable(s).
  • Bước 3: Tiếp tục nhấn chọn các lệnh theo thứ tự: Charts -> Histograms -> Show normal curve on histogram. Nhấn Continue -> OK và chờ kết quả.

Kết quả chúng ta thu được hình dưới đây ở giao diện OutPut:

Phân phối chuẩn dữ liệu biến stress trong SPSS
Đồ thị phân phối chuẩn dữ liệu biến Stress trong SPSS.

Dựa vào hình trên, ta có: Điểm stress của sinh viên có trị số trung bình = 1.32 và độ lệch chuẩn = 0.583.

2.2. Kiểm định nhận biết phân phối chuẩn của dữ liệu

Cách 1: Dựa vào chỉ số Skewness và Kurtosis

Skewness (độ xiên/độ lệch) đề cập đến mức độ đối xứng, là thước đo sự bất đối xứng xảy ra khi dư liệu đi chệch khỏi định mức. Các bản phân phối hoặc tập dữ liệu được cho là đối xứng nếu chúng xuất hiện giống nhau ở cả hai phía của một điểm trung tâm.

  • Skewness dương: Các giá trị tập trung nhiều hơn về phía bên phải và đuôi bên trái được trải ra, các kết quả thống kê bị bẻ cong về phía bên tay trái. Trong phân phối này: Mean > Median > Mode.
  • Skewness âm: Ngược lại với hệ số dương. Trong phân phối này: Mode > Median > Mean.

Còn Kurtosis (độ nhọn) đề cập đến tỷ lệ dữ liệu có đuôi nặng hoặc đuôi nhẹ so với phân phối bình thường. Giá trị của Kurtosis càng lớn thì đỉnh càng cao.

Điều kiện để nhận dạng phân phối chuẩn:

  • Theo George & Mallery (2010): Các giá trị bất đối xứng (Skewness) và độ nhọn (Kurtosis) nằm giữa -2 và +2 được coi là chấp nhận được để chứng minh phân phối đơn biến chuẩn.
  • Theo các tác giả Hair và cộng sự (2010), Bryne (2010): Dữ liệu được coi là bình thường, hay phân phối xấp xỉ chuẩn, khi hệ số Skewness nằm trong khoảng -2 đến +2 và Kurtosis nằm trong khoảng -7 đến +7.
  • Theo Curran và cộng sự (1996): Các ngưỡng chuẩn hóa của dữ liệu được đề xuất là 2.0 và 7.0 cho Skewness và Kurtosis khi muốn thực hiện phân tích nhân tố (EFA) và MANOVA.

Thực hiện 2 bước đầu tương tự mục 2.1, chọn ô Statistics -> Ở khung Distribution, nhấp chọn ô SkewnessKurtosis -> Continue -> OK và chờ kết quả.

Bảng Statistic SPSS cho kết quả độ nhọn, độ xiên phân phối chuẩn
Bảng Statistic cho kết quả độ nhọn, độ xiên nhận biết phân phối chuẩn.

Dựa vào bảng kết quả Statistics hiển thị trong giao diện OutPut, chúng ta có hệ số Skewness của biến Stress là 0.347 và hệ số Kurtosis là – 0.231, như vậy, chúng ta có thể xem dữ liệu là phân phối xấp xỉ chuẩn (Hair et al, 2010); Bryne, 2010).

Cách 2: Dựa vào biểu đồ đường cong chuẩn (Histograms with normal curve)

Biểu đồ có dạng hình chuông đối xứng với tần số cao nhất nằm ngay giữa và các tần số thấp dần nằm ở 2 bên. Ngoài ra, Mean và Median gần bằng nhau, độ xiên (Skewness) gần bằng 0, như vậy, có thể xem dữ liệu đó là phân phối chuẩn.

Cách 3: Dựa vào kiểm định Kolmogorov-Smirnov (N > 50) hoặc Shapiro-Wilk (N < 50)

Dấu hiệu nhận biết phân phối chuẩn là gì đơn giản nhất là dựa vào mức ý nghĩa (sig.) của kiểm định Kolmogorov-Smirnov (N > 50) hoặc Shapiro-Wilk (N < 50). Nếu sig > 0.05 thì dữ liệu được xem là phân phối chuẩn.

3. Ý nghĩa của phân phối chuẩn trong nghiên cứu Tâm lý học

Phân phối chuẩn khá quan trọng trong nghiên cứu tâm lý học, đặc biệt là khi đưa ra dự đoán.

3.1. Ý nghĩa của phân phối chuẩn là gì trong thực hành tâm lý lâm sàng?

Phân phối chuẩn thường được sử dụng trong kiểm tra và đánh giá tâm lý khi diễn giải điểm đánh giá. Có nhiều đặc điểm, triệu chứng tâm lý thường phân bố trên toàn bộ dân số, bằng cách xem điểm của một cá nhân rơi vào đâu trong phân phối, chúng ta có thể biết điểm đó sai lệch bao nhiêu so với mức trung bình. Điều này có thể hỗ trợ việc chẩn đoán hoặc giúp xác định những người nào có nguy cơ mắc rối loạn.

3.2. Ý nghĩa của phân phối chuẩn trong nghiên cứu khoa học Tâm lý học

Phân phối chuẩn cũng rất quan trọng trong nghiên cứu khoa học và kiểm tra thống kê trong tâm lý học. Các thử nghiệm thống kê suy luận (như kiểm định t-test) giúp nhà nghiên cứu quyết định có bác bỏ giả thuyết ban đầu hay không, và để thực hiện được điều này thì yêu cầu dữ liệu phải được phân phối bình thường. Nếu dữ liệu không đáp ứng yêu cầu phân phối chuẩn, chúng ta sẽ phải sử dụng thử nghiệm thống kê phi tham số.

Ví dụ: Bạn đã hỏi 5 sinh viên về việc họ ngủ bao nhiêu giờ (h) đêm qua và thu thập được các dữ liệu sau: 9h, 4h, 6h, 6h, 5h. Giá trị trung bình (Mean) của dữ liệu mà bạn thu thập được là 6.

Giá trị trung vị (Median) là giá trị ở giữa khi dữ liệu được sắp xếp từ thấp nhất đến cao nhất, trong trường hợp này cũng là 6 và mode (là tần số giá trị xuất hiện nhiều nhất) cũng là 6. Như vậy, có thể nói dữ liệu bạn thu thập được là phân phối chuẩn.

Bài viết trên đây đã cùng bạn tìm hiểu phân phối chuẩn là gì trong xác suất thống kê và cách thực hành phân phối chuẩn trong phần mềm SPSS. Chúng ta thường sử dụng các bảng phân phối để vẽ biểu đồ về tần suất của các điểm số khác nhau trong một tập dữ liệu. Phân phối chuẩn có hình chuông và đối xứng. Hy vọng rằng những kiến thức này sẽ giúp ích cho bạn trong quá trình thực hiện nghiên cứu khoa học Tâm lý học nhé!

Ernie Nguyễn
Ernie Nguyễn
Bài viết: 49