Đánh giá chất lượng bài kiểm tra từ vựng mới cho người học ngoại ngữ tại Việt Nam

Hiện nay, việc dạy ngoại ngữ tại Việt Nam còn gặp nhiều hạn chế do thiếu các công cụ đánh giá từ vựng hiệu quả. Bài viết đề xuất mô hình Rasch nhằm đánh giá độ tin cậy của bài kiểm tra trong việc đo lường năng lực ngôn ngữ của học sinh.

Việc kiểm tra từ vựng đóng vai trò quan trọng trong giáo dục ngôn ngữ, giúp đánh giá trình độ của người học và hỗ trợ giáo viên xây dựng kế hoạch giảng dạy hiệu quả. Tại Việt Nam, dù từ vựng luôn là một phần quan trọng trong chương trình học tiếng Anh, nhưng các công cụ đánh giá hiện có như Vocabulary Levels Test hay Vocabulary Size Test vẫn chưa đáp ứng đầy đủ nhu cầu thực tiễn của giáo viên và học viên. Những bài kiểm tra này chủ yếu được thiết kế cho môi trường giáo dục quốc tế và chưa thực sự phù hợp với bối cảnh học tập tại Việt Nam. Vì vậy, nghiên cứu này được thực hiện nhằm phát triển một bài kiểm tra từ vựng mới dành cho người học tiếng Anh và đánh giá chất lượng của bài kiểm tra này thông qua mô hình Rasch.

Mô hình Rasch là một phương pháp thuộc lý thuyết phản hồi câu hỏi, giúp đánh giá mức độ phù hợp của bài kiểm tra bằng cách phân tích xác suất trả lời đúng của người học dựa trên khả năng của họ và độ khó của câu hỏi. Ưu điểm của mô hình này là giúp xác định độ tin cậy của bài kiểm tra, đánh giá mức độ phù hợp của từng câu hỏi và đảm bảo tính nhất quán trong việc đo lường năng lực ngôn ngữ. Nhờ đó, có thể xác định các câu hỏi cần chỉnh sửa hoặc loại bỏ để tối ưu hóa bài kiểm tra.

Bài kiểm tra được thiết kế dựa trên danh sách từ vựng Oxford 3000 và 5000, được xây dựng theo khung tham chiếu ngôn ngữ CEFR nhằm đảm bảo tính phù hợp với người học. Với mục tiêu đo lường vốn từ vựng tiếp nhận, gồm 50 câu hỏi trắc nghiệm, mỗi câu chứa một từ vựng trong ngữ cảnh và bốn lựa chọn trả lời. Các từ vựng được chia thành năm cấp độ từ A1 đến C1, giúp đánh giá khả năng từ vựng của người học một cách hệ thống. Quá trình phát triển bài kiểm tra tuân theo các bước khoa học, bao gồm lựa chọn từ vựng, thiết kế câu hỏi, thử nghiệm trên nhóm đối tượng thực tế và phân tích kết quả bằng mô hình Rasch.

Nghiên cứu được thực hiện trên 202 sinh viên từ một trường Đại học tại Hà Nội, trong đó có 104 sinh viên chuyên ngành tiếng Anh và 98 sinh viên thuộc các ngành khác. Các sinh viên tham gia làm bài kiểm tra trong điều kiện không giới hạn thời gian. Họ được hướng dẫn cách làm bài và được khuyến khích không đoán câu trả lời nếu không biết đáp án để tránh làm sai lệch kết quả. Sau khi hoàn thành, dữ liệu được phân tích bằng phần mềm Conquest theo mô hình Rasch.

Nguồn: Pixabay.com

Kết quả phân tích cho thấy bài kiểm tra có độ tin cậy cao, với hệ số phân tách (Separation Reliability) đạt 0.966 và hệ số Cronbach’s Alpha đạt 0.89, chứng tỏ bài kiểm tra có thể phân biệt rõ ràng giữa các nhóm người học có trình độ khác nhau. Trong số 50 câu hỏi, 36 câu được đánh giá là rất tốt, phù hợp với mô hình Rasch; 10 câu cần được chỉnh sửa để cải thiện các phương án gây nhiễu và 4 câu không phù hợp với mô hình Rasch cần loại bỏ. Các câu hỏi có độ khó quá thấp hoặc quá cao đều được xem xét để điều chỉnh nhằm đảm bảo bài kiểm tra có thể đánh giá chính xác khả năng của người học ở nhiều trình độ khác nhau.

Phân tích phân bố khả năng của người học và độ khó câu hỏi cho thấy bài kiểm tra có xu hướng dễ đối với nhóm sinh viên tham gia. Điều này cho thấy bài kiểm tra có thể phù hợp hơn cho đối tượng có trình độ thấp hơn hoặc cần bổ sung các câu hỏi khó hơn để đánh giá chính xác nhóm người học có trình độ cao. Kết quả nghiên cứu cũng chỉ ra rằng cần thay thế bốn câu hỏi không phù hợp bằng các câu hỏi mới có độ khó phù hợp hơn, điều chỉnh các phương án gây nhiễu để tăng độ chính xác, đồng thời xây dựng thêm ngân hàng câu hỏi để tạo ra các phiên bản bài kiểm tra khác nhau phục vụ cho việc đánh giá định kỳ.

Như vậy, nghiên cứu đã phát triển và đánh giá thành công một bài kiểm tra từ vựng mới dành cho người học EFL tại Việt Nam. Kết quả cho thấy bài kiểm tra có độ tin cậy cao, nhưng vẫn cần một số điều chỉnh để tối ưu hóa chất lượng. Việc áp dụng mô hình Rasch đã giúp xác định các điểm mạnh và điểm cần cải thiện của bài kiểm tra, đồng thời mở ra hướng phát triển các công cụ đánh giá từ vựng đáng tin cậy hơn. Trong tương lai, có thể mở rộng phạm vi thử nghiệm với số lượng người tham gia lớn hơn và sử dụng các mô hình phân tích khác để tiếp tục nâng cao chất lượng bài kiểm tra.

Hoàng Dũng lược dịch

Nguồn:

Bui, T. K. P., Nguyen, Q. T., & Le, T. H. (2023). Assessing the Quality of a Newly Designed Vocabulary Test for Vietnamese EFL Learners: A Rasch-based Analysis. Vietnam Journal of Education7(1), 63-73. https://doi.org/10.52296/vje.2023.270

Bạn đang đọc bài viết Đánh giá chất lượng bài kiểm tra từ vựng mới cho người học ngoại ngữ tại Việt Nam tại chuyên mục Khoa học giáo dục và xã hội của Tạp chí Giáo dục. Mọi thông tin góp ý và chia sẻ, xin vui lòng liên hệ SĐT: (+84)2462598109 hoặc gửi về hòm thư tapchigiaoduc@moet.gov.vn

 

Hội thảo quốc tế

Hội thảo quốc gia

Phòng, chống COVID-19