Jerome M. Sattler (2008). Assessment of Children, Cognitive Foundation. Fifth edition.
NHỮNG KHÁI NIỆM ĐO LƯỜNG TÂM LÝ KHÁC
1. Sự khác nhau của hiệu ứng nền (Floor effect difference)
Giới hạn nền của điểm số có thể khác nhau ở các test khác nhau. Nền của test là điểm thấp nhất có thể đạt ở một test nhất định. Hiệu ứng nền thường nói tới/ám chỉ tới số lượng các mục dễ có thể ở mức độ thấp nhất nhằm phân biệt giữa các trẻ ở mức độ trên trung bình. Bạn cần quan tâm tới nền test vì nó chỉ ra rằng một test có thể phân loại trẻ ở mức độ chức năng thấp như thế nào; nó cũng cho biết test đó có hiệu lực với đối tượng nào. Bạn cũng cần xem xét nếu nền test liên quan đến thực hành thực sự. Nếu không, kết quả làm test nên được kiểm tra lại.
2. Sự khác nhau của hiệu ứng trần (Ceiling effect difference)
Giới hạn trần của điểm số có thể khác nhau ở các test khác nhau. Sự tương đồng của trần test, trần test là điểm số cao nhất có thể đạt được ở một test nào đó. Hiệu ứng trần ám chỉ tới số lượng các mục khó có thể ở mức độ cao nhất của một test để phân biệt giữa những trẻ có mức độ cao hơn trung bình. Bạn cần quan tâm tới trần test vì nó chỉ ra rằng một test có thể phân loại trẻ ở mức độ chức năng cao như thế nào. Bạn cũng cần xem xét nếu trần test liên quan tới thực hành thực sự. Nếu không, kết quả test nên được kiểm tra lại.
3. Sự khác nhau về dốc (gradient) của mục (Item gradient differences)
Độ dốc của mục có thể khác nhau ở các test khác nhau. Độ dốc của mục liên quan tới/ám chỉ tỉ lệ của điểm thô so với điểm chuẩn ở mỗi mục, hoặc số điểm thô cần thiết để có được một điểm chuẩn. Theo cách khác, độ dốc của mục giúp chúng ta thấy đứa trẻ có thể thành công hay thất bại nhanh đến đâu trong một mục test đơn lẻ” (Braken, 1987, p. 322). Độ dốc của mục cho chúng ta thấy mức độ dốc của các mục trong một test. Test với độ dốc lớn (trong đó, mức độ khó của các mục thay đổi rất nhanh, vì vậy một sự thay đổi trong điểm thô sẽ tạo ra sự thay đổi lớn trong điểm chuẩn) kém nhạy cảm hơn với sự khác nhau ít hay trung bình ở trong sự phát triển khả năng hay kỹ năng hơn các test có độ dốc vừa phải. Điều này có nghĩa là test với độ dốc lớn sẽ ít hiệu lực hơn trong việc đánh giá khả năng và kỹ năng của trẻ hơn các test với độ dốc vừa phải (Braken, 1987).
4. Sự khác nhau về cách bố trí/phân phối/sơ đồ bảng chuẩn (Norm table layout difference)
Bảng chuẩn có thể có những cách phân loại khác nhau về độ tuổi ở các test khác nhau. Ví dụ, phân loại tuổi có thể theo khoảng 1 tháng, 3 tháng hay 4 tháng; những sự khác nhau này có thể dẫn tới những điểm khác nhau ở những test khác nhau cho cùng một độ tuổi.
5. Sự khác nhau về điểm số tương ứng theo tuổi tác và cấp học
Điểm tương ứng theo độ tuổi và cấp học ở các test khác nhau có thể không trùng nhau, ngay cả khi điểm chuẩn của hai test là trùng nhau.
6. Sự khác nhau về độ tin cậy
Test có độ tin cậy thấp sẽ tạo ra ít điểm ổn định hơn test có độ tin cậy cao.
7. Sự khác nhau trong các khu vực kỹ năng được đánh giá
Các test khác nhau đánh giá các kỹ năng khác nhau, mặc dù vậy chúng vẫn có tên giống nhau cho một vùng kỹ năng (ví dụ kỹ năng đọc). Một test có thể đo sự nhận biết từ (ví dụ, chỉ đơn giản là đọc to từ), trong khi test khác đo khả năng đọc hiểu (ví dụ hiểu những gì mà người đó đọc).
8. Sự khác nhau về nội dung test
Các test khác nhau có thể đo đạc cùng một vùng kỹ năng nhưng chứa đựng nội dung khác nhau. Ví dụ, test đo kỹ năng tính toán số học có thể bao gồm những khái niệm và cách tiếp cận khác nhau.
9. Sự khác nhau về ngày xuất bản/công bố
Test xuất bản vào các năm khác nhau có thể có điểm số khác nhau vì sự thay đổi về khả năng của nhóm chuẩn.
10. Sự khác nhau về nhóm mẫu
Test được lấy chuẩn/được thiết lập dựa trên các nhóm chuẩn khác nhau có thể cho những điểm số khác nhau vì chúng không tương ứng. Ví dụ, một mẫu có thể có nhiều người được giáo dục ở trình độ cao hơn mẫu khác, có thể dẫn tới điểm số trung bình của mẫu đó cao hơn.
Không có nhận xét nào:
Đăng nhận xét