Tư duy mới về cách đánh giá người học trong thời đại AI tạo sinh

Tư duy mới về cách đánh giá người học trong thời đại AI tạo sinh

Các nhà nghiên cứu Đại học RMIT Việt Nam đã đưa ra khung đánh giá giúp giáo viên xác định tính hiệu quả của các công cụ AI tạo sinh thông dụng như ChatGPT trong việc “làm hộ” bài tập cho người học.

Việc ứng dụng các công cụ AI tạo sinh hay mô hình ngôn ngữ lớn (LLM) vào giáo dục đang đặt ra thách thức đáng kể cho việc thiết kế bài kiểm tra đánh giá người học. Theo nhà nghiên cứu Đại học RMIT Tiến sĩ Nguyễn Thanh Bình, thách thức này đặc biệt rõ rệt ở các bài tập đánh giá xác thực (authentic assessment), với hình thức chủ yếu là các bài báo cáo mà người học có thể mang về nhà viết.

Các công cụ AI tạo sinh cho phép người học viết bài luận hoặc báo cáo nghiên cứu chỉ bằng cách nhập đề bài vào hệ thống. Ngoài những lo ngại về tính liêm chính học thuật, lợi ích của phương pháp đánh giá xác thực, chẳng hạn như thúc đẩy kỹ năng tư duy bậc cao của người học, cũng có thể bị ảnh hưởng.

Tiến sĩ Bình nhận xét: “ Điều quan trọng là phải xác định và đánh giá thực lực của AI tạo sinh có thể hoàn thành bài tập hay báo cáo đến mức độ nào. Dựa vào đó, giáo viên có thể điều chỉnh cách đánh giá, đặc biệt là đối với bài tập về nhà mà người học có nhiều thời gian và sự hỗ trợ của công cụ AI để hoàn thành”.

Các công cụ AI tạo sinh cho phép người học viết bài luận hoặc báo cáo chỉ bằng cách nhập đề bài vào hệ thống. (Hình: Pexels) Các công cụ AI tạo sinh cho phép người học viết bài luận hoặc báo cáo chỉ bằng cách nhập đề bài vào hệ thống. (Hình: Pexels)

Khung đánh giá năng lực của AI tạo sinh

Trong một bài báo gần đây trên tạp chí về công nghệ giáo dục Australasian Journal of Educational Technology, Tiến sĩ Bình và các đồng nghiệp thuộc nhóm bộ môn Kinh tế và Tài chính, Khoa Kinh doanh, Đại học RMIT Việt Nam, đã đề xuất một khuôn khổ toàn diện nhằm đánh giá một cách có hệ thống khả năng của các công cụ AI tạo sinh trong việc làm bài tập đánh giá xác thực.

Khung này sử dụng thang cấp độ tư duy Bloom làm nguyên tắc hướng dẫn thiết kế bài tập. Thang đo thông dụng này phân loại các kỹ năng tư duy thành sáu cấp độ, từ ghi nhớ đơn giản đến sáng tạo phức tạp, bao gồm “nhớ”, “hiểu”, “vận dụng”, “phân tích”, “đánh giá” và “sáng tạo”.

Những câu hỏi đánh giá tương ứng với các cấp độ tư duy nhận thức khác nhau, cũng như tiêu chí chấm điểm và hướng dẫn chấm điểm được nhập vào ChatGPT-4, ChatGPT-3.5, Google Bard (tiền thân của Gemini) và Microsoft Bing (tiền thân của Copilot) để cho ra câu trả lời. Sau đó, giáo viên sẽ chấm điểm các câu trả lời mà AI tạo ra để đo mức độ thành thạo của từng công cụ.

Khung đánh giá năng lực của AI tạo sinh (Hình: Nhóm nghiên cứu Đại học RMIT) Khung đánh giá năng lực của AI tạo sinh (Hình: Nhóm nghiên cứu Đại học RMIT)

Nghiên cứu của RMIT cho thấy các công cụ AI tạo sinh thể hiện tốt ở các cấp độ thấp của thang Bloom (“nhớ” và “hiểu”), cho ra kết quả chấp nhận được khi phải “vận dụng”, “phân tích” và “đánh giá”, nhưng khá lúng túng khi phải “sáng tạo”.

Có thể giải thích hiện tượng này bằng thực tế là các mô hình AI được đào tạo dựa trên các bộ dữ liệu khổng lồ, giúp chúng thực hiện tốt việc cung cấp thông tin và tóm tắt. Những khả năng như vậy của AI ảnh hưởng đến cả cách thiết kế và mục tiêu giáo dục, nêu bật sự cần thiết phải tập trung vào các mục tiêu học tập vượt xa các cấp độ tư duy cơ bản.

Giảng viên RMIT Tiến sĩ Võ Thị Hồng Diễm nhấn mạnh rằng, “điều thú vị là các công cụ AI tạo sinh có khả năng giải quyết những câu hỏi dựa trên số liệu tốt hơn các câu hỏi dựa trên văn bản”.

Ví dụ, ChatGPT-4 cùng với công cụ  Code Interpreter thể hiện khả năng rất ấn tượng trong việc tạo biểu đồ từ các tập dữ liệu, cũng như phân tích và diễn giải các biểu đồ đó.

Điều này đặt ra thách thức rất lớn đối với đội ngũ cán bộ giảng dạy và các trường đại học, đặc biệt trong những lĩnh vực phụ thuộc nhiều vào phân tích dữ liệu như thống kê và kinh tế lượng.

Tiến sĩ Diễm cho biết: “Việc sinh viên có thể dễ dàng tạo báo cáo và phân tích dữ liệu thông qua AI tạo sinh đòi hỏi chúng ta phải xem xét lại một cách toàn diện kết quả học tập, nội dung và cách đánh giá của các môn học”.

Các công cụ AI tạo sinh cho kết quả kém nhất khi thực hiện các nhiệm vụ yêu cầu khả năng sáng tạo ra nội dung mới và độc đáo. (Hình: Pexels) Các công cụ AI tạo sinh cho kết quả kém nhất khi thực hiện các nhiệm vụ yêu cầu khả năng sáng tạo ra nội dung mới và độc đáo. (Hình: Pexels)

Đua cùng, thay vì chống lại AI

Mặc dù có năng lực ngày càng mạnh mẽ hơn, các công cụ AI tạo sinh đều gặp khó khăn trong việc xây dựng lập luận dựa trên khung lý thuyết, duy trì tính mạch lạc của lập luận và đưa ra tài liệu tham khảo phù hợp.

Giảng viên RMIT Tiến sĩ Nguyễn Nhật Minh cho biết: “Điều này mang lại cho sinh viên cơ hội phát triển thêm dựa trên nền tảng cơ bản mà AI cung cấp. Thay vì chỉ thu thập thông tin và xây dựng lập luận cơ bản, sinh viên nên đảm nhận vai trò phức tạp hơn là kết hợp kết quả đầu ra của AI với các lý thuyết liên quan và bối cảnh thực tế”.

Đối với người dạy, điều quan trọng là họ phải tích hợp các công cụ AI vào phương pháp giảng dạy của mình.

Thay vì thiết kế bài tập đánh giá và hoạt động học tập nhằm mục đích kháng cự lại khả năng của AI tạo sinh, người dạy nên tập trung xây dựng bài tập đánh giá xác thực hướng tới nâng cao kỹ năng tư duy ở cấp độ cao hơn cho người học (như kỹ năng đánh giá và sáng tạo), đồng thời khai thác các lợi thế của công nghệ AI.

Mục tiêu là xây dựng một môi trường đánh giá thực sự thúc đẩy việc học tập và phát triển các kỹ năng quan trọng hài hòa với các công cụ AI.

Tiến sĩ Minh giải thích: “Môi trường như vậy không chỉ giúp sinh viên tư duy phản biện và sáng tạo mà còn trang bị cho các em khả năng sử dụng AI hiệu quả như một công cụ phục vụ đổi mới và giải quyết vấn đề”.

“Qua đó, chúng ta có thể đảm bảo rằng giáo dục phát triển song song với tiến bộ công nghệ, giúp sinh viên sẵn sàng đón đầu một tương lai nơi các em có thể cộng tác thành công với AI trong nhiều lĩnh vực khác nhau”.

Tiến sĩ Bình nhấn mạnh rằng khi AI tạo sinh trở nên phổ biến hơn ở nơi làm việc thì những người đi làm, đặc biệt là trong các lĩnh vực dựa trên dữ liệu và văn bản, sẽ thấy vai trò của họ thay đổi đáng kể.

“Sự thay đổi này đòi hỏi chúng ta phải chủ động. Những người làm nghề giáo và các cơ sở giáo dục cần xem xét và cân nhắc thiết kế lại cách đánh giá, kết quả học tập mong đợi và chương trình đào tạo”, Tiến sĩ Bình nói.

Bài báo “Race with the machines: Assessing the capability of generative AI in solving authentic assessments” (tạm dịch: Chạy đua với máy móc: Đánh giá năng lực của AI tạo sinh trong việc làm bài tập đánh giá xác thực) được đăng trên tạp chí Australasian Journal of Educational Technology  (DOI: 10.14742/ajet.8902).

Bài: Hoàng Minh Ngọc

  • Nghiên cứu
  • Nghiên cứu và Đổi mới

Tin tức liên quan