Hướng Dẫn Cách Lọc Dữ Liệu Trong SPSS & Ví Dụ Dễ Hiểu

Đôi khi làm việc với một bộ dữ liệu thống kê phân tích lớn, chúng ta muốn thu hẹp phạm vi nghiên cứu để tập trung quan sát đặc điểm của một nhóm đối tượng cụ thể dựa trên các tiêu chí nhất định đã đặt ra. Phần mềm SPSS có thể giúp bạn làm điều đó. Bài viết này sẽ hướng dẫn bạn cách lọc dữ liệu trong SPSS vô cùng đơn giản và hiệu quả kèm theo các mẫu ví dụ chi tiết để bạn dễ theo dõi và thực hiện nhé.

Hướng dẫn cách lọc dữ liệu trong SPSS

 

Cách lọc dữ liệu trong SPSS với 5 bước

Để lọc dữ liệu trong SPSS, sau khi đã mở file dữ liệu cần phân tích, bạn hãy làm theo 5 bước sau đây:

Cách lọc dữ liệu trong SPSS theo 5 bước

Bước 1: Sử dụng Select Cases để lọc dữ liệu

Để bắt đầu, hãy chọn Select Cases… từ mục Data trên thanh công cụ chính.

Bước 2: Kích hoạt biến bộ lọc

Trong hộp thoại Select Cases, chọn mục If condition is satisfied trong ô Select và nhấp vào If để đặt điều kiện lọc các biến.

 

Bước 3: Đặt điều kiện lọc các trường hợp theo yêu cầu

Kéo và thả biến cần lọc từ danh mục biến bên trái vào ô văn bản trên cùng. Sau đó, nhập điều kiện để lọc biến theo ý muốn.

 

Phía dưới ô văn bản sẽ có nhiều chức năng lệnh để lựa chọn trong công thức như:

+, -, *, /

các phép tính cộng, trừ, nhân chia

>, >=

lớn, lớn hơn hoặc bằng

<, <=

nhỏ, nhỏ hơn hoặc bằng

=, ~=

bằng, không bằng

**

luỹ thừa

&

|

hoặc

~

đảo ngược hai giá trị

Chẳng hạn, ta sẽ đặt điều kiện lọc “Gender = 1”. Điều này này nghĩa là SPSS chỉ chọn các trường hợp biến Giới tính có giá trị là 1 (Nam = 1, Nữ = 2).

 

 

Nhấn Continue để tiếp tục.

Bước 4: Chọn hình thức xuất dữ liệu 

Trở về hộp thoại Select Cases, trong mục Output, chọn hình thức xuất dữ liệu sau khi lọc tùy theo ý muốn của bạn.

  • Filter out unselected cases: Loại các trường hợp không được chọn.
  • Copy selected cases to a new dataset: Sao chép các trường hợp được chọn ra một bộ dữ liệu mới.
  • Delete unselected cases: Xoá các trường hợp không được chọn.

Thông thường, SPSS sẽ mặc định chọn Filter out unselected cases.

Nhấn OK để hoàn tất.

Như bạn có thể thấy, SPSS đã loại bỏ các trường hợp bên trái không thoả mãn điều kiện. Nó cũng tạo ra một biến bộ lọc mới giả định cho thấy từng trường hợp được chọn hay không được chọn (0: trường hợp bị loại bỏ 1: trường hợp được chọn).

Bước 5: Huỷ kích hoạt biến bộ lọc

Nếu muốn quay lại bộ dữ liệu ban đầu, bạn cần tắt tính năng bộ lọc bằng cách:

  • Mở lại hộp thoại Select Cases từ mục Data.
  • Chọn All cases hoặc chọn Reset 
  • Nhấn OK

Nếu bạn đang gặp khó khăn trong quá trình lọc dữ liệu hoặc trong các thao tác liên quan đến thực hiện nghiên cứu thống kê trong SPSS, hãy liên hệ ngay với đơn vị Tri Thức Cộng Đồng để được giúp đỡ. Được thực hiện bởi các chuyên gia có trình độ chuyên môn cao, dịch vụ chạy SPSS thuê của đơn vị sẽ đem đến bạn một bộ dữ liệu sạch đẹp với kết quả xử lý phân tích đảm bảo tính chính xác và đạt yêu cầu.

Một số ví dụ tiêu biểu

Ví dụ 1 – Loại bỏ các trường hợp bị thiếu giá trị

Đôi khi bộ dữ liệu có nhiều giá trị bị thiếu có thể làm ảnh hưởng đến độ chính xác của kết quả thống kê phân tích, để loại bỏ các trường hợp này, hãy thực hiện theo 3 bước sau:

Sau khi mở hộp thoại Select Cases, tại danh mục của hộp Function group, tìm và chọn vào Missing Values. Sau đó chọn tiếp Nmiss như trong ảnh.

Chọn các biến cần lọc và đặt điều kiện, giữa các biến ngăn cách nhau bằng dấu phẩy. Sau đó nhấn Continue để tiếp tục.

Chẳng hạn như ta có điều kiện Nmiss(age, FS-score) < 1, yêu cầu SPSS sẽ tạo một cột mới mà trong đó, các trường hợp không bị thiếu giá trị được chỉ định là “1” và các trường hợp thiếu giá trị sẽ được chỉ định là “0”.

Chọn OK trong hộp thoại Select Cases để nhận kết quả lọc.

Ví dụ 2 – Lọc 2 biến cùng lúc

Bạn có thể xây dựng nhiều biểu thức phức tạp hơn nếu muốn lọc cùng lúc 2 hay nhiều biến theo hướng dẫn sau:

  • Nhập điều kiện lọc theo công thức:

Biểu thức 1 “&” Biểu thức 2

Trong đó: 

  • Biểu thức 1: bao gồm biến 1 và điều kiện lọc 1.
  • Biểu thức 2: bao gồm biến 2 và điều kiện lọc 2.

Ví dụ ta sẽ nhập biểu thức “gender = ‘f’ & jobcat = 3”. Bây giờ SPSS sẽ chọn các trường hợp có giá trị của biến giới tính là f và giá trị của biến loại công việc (jobcat) là 3, thoả mãn theo yêu cầu.

Sau khi đã thiết lập biểu thức như ảnh trên, nhấp vào Continue, sau đó bấm OK trong hộp thoại Select Cases. Màn hình xuất hiện kết quả sau khi lọc dữ liệu.

Ví dụ 3 – Lọc các biến dựa trên phạm vi thời gian được chỉ định

Đối với các biến có giá trị theo dạng thời gian như ngày tháng năm hoặc giờ phút giây, để lọc dữ liệu trong SPSS, ta sẽ thực hiện theo 2 bước như sau:

Trong hộp thoại Select Cases, tại danh mục của hộp Function group, tìm kiếm và chọn Search và sau đó chọn tiếp Range ở ô Function and Special Variables như trong ảnh.

Đặt điều kiện lọc theo hai công thức sau:

RANGE(biến,date.mdy(M1,D1,Y1),date.mdy(M2,D2,Y2))

RANGE(biến,time.hms(H1,M1,S1),date.mdy(H2,M2,S2))

Trong đó:

  • mdy: hiển thị giá trị dữ liệu theo tháng – ngày- năm
  • hsm: hiển thị giá trị dữ liệu theo giờ – phút – giây
  • M1,D1,Y1 và H1,M1,S1: giá trị mốc thời gian đầu của phạm vị
  • M2,D2,Y2 và H2,M2,S2: giá trị mốc thời gian kết thúc của phạm vi

Chẳng hạn nếu muốn lọc dữ liệu của biến Pretest_Date trong phạm vi thời gian từ ngày 15/4/2015 đến ngày 5/6/2015, ta sẽ nhập công thức: 

RANGE(Pretest_Date,date.mdy(4,15,15),date.mdy(6,5,15))

Chọn Continue để tiếp tục và sau đó nhấn OK. Kết quả nhận được sau khi lọc dữ liệu như trong ảnh.

Để tìm hiểu sâu hơn về các thao tác thực hiện xử lý dữ liệu trong SPSS cũng như có thể ứng dụng tốt phần mềm này trong các bài luận văn và nghiên cứu khoa học, bạn hãy tham khảo ngay bài viết hướng dẫn cách chạy SPSS cực chi tiết và đầy đủ nhé.

Trên đây là bài viết hướng dẫn cách lọc dữ liệu trong SPSS và một số ví dụ về cách thực hiện cho từng trường hợp cụ thể. Mong rằng những thông tin này sẽ hữu ích với bạn. Như vậy, bạn đã có thể chọn ra các trường hợp muốn nghiên cứu trong SPSS và làm việc với bộ dữ liệu đã lọc một cách hiệu nhanh và hiệu quả nhất.

Tài liệu tham khảo:

  1. Andrea Arikawa (2020). Excluding missing data.
  1. Dr. Todd L. Grande (2015). Select Cases in SPSS Based on Specified Date or Time Ranges.
  2. Edifo (2020). How to filter data using Select Case in SPSS?.
  3. EZ SPSS Tutorials. How to Select Cases in SPSS.
  4. Ruben Geert van den Berg. SPSS FILTER Tutorial – Exclude Cases from Analyses. Amsterdam, Hà Lan.

 

 

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x