Chấm bài luận và áp lực nghề nghiệp của giảng viên đại học
Trong giáo dục đại học, bài luận vẫn là một hình thức đánh giá quan trọng vì có khả năng thể hiện năng lực đọc hiểu, tổng hợp tài liệu, tổ chức lập luận, vận dụng khái niệm và trình bày quan điểm học thuật của sinh viên. Khác với các bài kiểm tra trắc nghiệm hoặc nhiệm vụ có đáp án cố định, chấm bài luận đòi hỏi giảng viên phải đọc kĩ văn bản, đối chiếu với tiêu chí đánh giá, nhận diện mức độ đạt chuẩn đầu ra và đưa ra phản hồi có giá trị đối với quá trình học tập.
Khối lượng công việc này trở nên nặng nề hơn trong những lớp học đông, khi mỗi học phần có thể có hàng trăm bài viết cần được xử lí trong thời gian ngắn. Trong khi đó, giảng viên đại học hiện nay không chỉ đảm nhiệm giảng dạy, hướng dẫn sinh viên và đánh giá kết quả học tập, mà còn phải đáp ứng yêu cầu về công bố khoa học, bảo đảm chất lượng, phục vụ cộng đồng học thuật và tham gia quản trị nhà trường. Fauzi và cộng sự (2024) cho rằng đội ngũ giảng viên đại học đang chịu áp lực từ nhiều phía, bao gồm yêu cầu giảng dạy, tuyển sinh, nhu cầu học tập đa dạng của sinh viên và trách nhiệm nghiên cứu. Defazio và cộng sự (2022) cũng đề cập đến tình trạng quá tải trong môi trường học thuật, khi trách nhiệm nghề nghiệp và đời sống cá nhân cùng tạo nên sức ép kéo dài.
Trong bối cảnh đó, công cụ tạo sinh được quan tâm như một phương tiện có thể hỗ trợ một số khâu trong dạy học và đánh giá. Theo Okonkwo và Ade-Ibijola (2021), các chatbot giáo dục có khả năng xử lí ngôn ngữ tự nhiên và tham gia đối thoại với người học, qua đó hỗ trợ những nhiệm vụ liên quan đến học tập, phản hồi và đánh giá. Swiecki và cộng sự (2022) cũng nhận định rằng trí tuệ nhân tạo đang tác động trực tiếp đến cách thiết kế, tổ chức và thực hiện hoạt động đánh giá trong giáo dục.
Tuy nhiên, đánh giá trong giáo dục đại học không phải là thao tác kĩ thuật đơn thuần. Đó là hoạt động học thuật liên quan đến công bằng, minh bạch, chuẩn mực chuyên môn và uy tín của cơ sở đào tạo. Vì vậy, câu hỏi quan trọng không chỉ là công cụ tạo sinh có thể chấm bài nhanh đến mức nào, mà là điểm số và phản hồi do công cụ tạo ra có đủ tin cậy, phù hợp với mục tiêu học phần và hữu ích đối với sinh viên hay không.
Điểm số của công cụ tạo sinh và đánh giá của giảng viên: Gần nhau nhưng chưa tương đương
Một khảo sát thực nghiệm trong bối cảnh giáo dục đại học châu Á cung cấp thêm dữ liệu đáng chú ý về khả năng sử dụng công cụ tạo sinh trong chấm bài luận. Theo Wut, Chan và Wong (2026), 126 bài luận cá nhân của sinh viên ngành kinh doanh tại Hồng Kông đã được chấm độc lập bởi giảng viên phụ trách học phần và bởi công cụ tạo sinh. Các bài luận thuộc học phần về quản trị môi trường, xã hội và quản trị doanh nghiệp. Sinh viên được yêu cầu viết khoảng 1.000 từ về một trong 17 mục tiêu phát triển bền vững, trong đó cần trình bày mục tiêu, thành tựu hiện tại, thách thức, khuyến nghị, đồng thời sử dụng trích dẫn trong văn bản và danh mục tài liệu tham khảo. Trước khi chấm, công cụ tạo sinh được cung cấp đề bài, yêu cầu của bài luận, thang đánh giá và quy định quy đổi điểm.
Kết quả cho thấy điểm trung bình do giảng viên chấm là 70,37, trong khi điểm trung bình do công cụ tạo sinh đưa ra là 67,21. Độ lệch chuẩn của điểm giảng viên là 11,673, cao hơn độ lệch chuẩn của điểm do công cụ tạo sinh đưa ra là 10,050. Dữ liệu này cho thấy điểm số của giảng viên có độ phân tán lớn hơn, còn điểm của công cụ số có xu hướng tập trung hơn. Tương quan giữa hai cách chấm đạt 0,420, được xác định ở mức vừa phải. Phép kiểm định thống kê cho thấy sự khác biệt giữa hai nguồn điểm có ý nghĩa thống kê, nhưng mức chênh lệch nhỏ, với hệ số Cohen’s d là 0,268 (Wut et al., 2026).
Những con số trên cho phép đưa ra một nhận định thận trọng. Công cụ tạo sinh có thể tạo ra kết quả chấm điểm tương đối gần với giảng viên trong những bài luận có yêu cầu rõ ràng, cấu trúc nhiệm vụ cụ thể và thang đánh giá chi tiết. Tuy vậy, tương quan ở mức vừa phải cho thấy kết quả của công cụ số và đánh giá của giảng viên chưa thể xem là tương đương. Sự khác biệt về điểm số vẫn tồn tại và cần được kiểm tra trước khi đưa vào các quyết định đánh giá chính thức.
Kết quả của Wut và cộng sự (2026) cũng không hoàn toàn trùng với một số tài liệu trước đó. Usher (2025), khi so sánh đánh giá của công cụ tạo sinh, giảng viên và bạn học trong giáo dục đại học, ghi nhận trường hợp công cụ tạo sinh có xu hướng cho điểm cao hơn giảng viên. Trong khi đó, dữ liệu của Wut và cộng sự (2026) lại cho thấy điểm trung bình từ công cụ tạo sinh thấp hơn điểm của giảng viên. Sự khác biệt này cho thấy hiệu quả của công cụ tạo sinh trong chấm bài phụ thuộc vào nhiều điều kiện, bao gồm loại hình nhiệm vụ, mức độ cụ thể của rubric, lĩnh vực học thuật, yêu cầu chuyên môn và cách thiết kế bài tập.
Điều này có ý nghĩa quan trọng đối với các cơ sở giáo dục đại học. Công cụ tạo sinh không thể được xem như một “máy chấm điểm” có thể áp dụng giống nhau cho mọi môn học, mọi loại bài viết và mọi mục tiêu đánh giá. Công nghệ chỉ phát huy tác dụng khi nhiệm vụ học tập được thiết kế rõ, tiêu chí đánh giá minh bạch và giảng viên có cơ chế kiểm tra kết quả.
Phản hồi học tập: Không chỉ là độ dài của nhận xét
Nếu điểm số là phần có thể lượng hóa của đánh giá, phản hồi mới là nơi thể hiện rõ hơn giá trị sư phạm của quá trình chấm bài. Theo Wut và cộng sự (2026), công cụ tạo sinh thường đưa ra nhận xét chi tiết hơn, bám sát rubric hơn và phân tách phản hồi theo từng tiêu chí. Các tiêu chí trong bài luận gồm phân tích, lập luận và sáng tạo; bằng chứng từ tìm kiếm thông tin và minh chứng hỗ trợ luận điểm; vận dụng khái niệm, lí thuyết; và hình thức trình bày. Công cụ tạo sinh có thể nêu điểm mạnh, gợi ý cải thiện lập luận, nhắc sinh viên làm rõ khái niệm hoặc lí thuyết được vận dụng, đồng thời lưu ý về liên kết đoạn văn và cấu trúc trình bày.
Trong khi đó, nhận xét của giảng viên thường ngắn hơn, tập trung vào vấn đề nổi bật nhất của bài viết, chẳng hạn yêu cầu sinh viên chú ý định dạng tài liệu tham khảo hoặc bổ sung trích dẫn trong văn bản. Sự khác biệt này cần được nhìn nhận một cách cân bằng. Một phản hồi dài chưa chắc đã có giá trị sư phạm cao nếu thiếu sự phù hợp với bài làm cụ thể, bối cảnh học phần và năng lực hiện tại của sinh viên. Ngược lại, một nhận xét ngắn nhưng đúng trọng tâm, dựa trên hiểu biết chuyên môn và kinh nghiệm giảng dạy, vẫn có thể giúp người học nhận ra vấn đề cốt lõi cần điều chỉnh.
Labadze, Grigolia và Machaidze (2023) cho rằng chatbot giáo dục có tiềm năng cung cấp hỗ trợ cá nhân hóa và phản hồi kịp thời cho người học. Tuy nhiên, Usher (2025) lưu ý rằng công cụ tạo sinh vẫn gặp khó khăn khi đánh giá các năng lực phức tạp như tư duy phê phán, lập luận phân tích và năng lực ra quyết định. Lu và cộng sự (2024) cũng cho thấy điểm do ChatGPT hỗ trợ và điểm do giảng viên đánh giá bài viết học thuật của sinh viên có thể đạt mức nhất quán từ vừa đến mạnh, nhưng kết quả đó không làm mất đi nhu cầu thẩm định của giảng viên.
Phản hồi trong giáo dục không chỉ nhằm giải thích điểm số. Đó là phương tiện giúp sinh viên hiểu mình đã đạt được gì, còn hạn chế ở đâu và cần cải thiện theo hướng nào. Vì vậy, chất lượng phản hồi phải được đánh giá dựa trên khả năng hỗ trợ tiến bộ học thuật, không chỉ căn cứ vào độ dài hoặc số lượng nhận xét. Đây là ranh giới quan trọng giữa năng lực xử lí ngôn ngữ của công cụ số và năng lực sư phạm của giảng viên.
Chuẩn mực học thuật trước "sức hấp dẫn của tốc độ"
Công cụ tạo sinh có thể mang lại nhiều lợi ích rõ ràng cho hoạt động đánh giá. Công cụ có khả năng xử lí nhanh khối lượng bài lớn, tạo phản hồi có cấu trúc, đối chiếu bài làm với tiêu chí đã được cung cấp và hỗ trợ giảng viên trong những nhiệm vụ lặp lại. Zhao, Chapman và Sabet (2024) cho rằng công cụ tạo sinh đang mở ra nhiều khả năng mới trong đánh giá giáo dục, đặc biệt với các hoạt động cần phản hồi nhanh và có khả năng triển khai ở quy mô lớn. Nikolopoulou (2024) cũng nhấn mạnh tiềm năng của công cụ tạo sinh trong hỗ trợ thực hành sư phạm ở giáo dục đại học. Tuy nhiên, thuận lợi về tốc độ không thể thay thế yêu cầu về độ tin cậy. Khi một công cụ số tham gia vào chấm bài, nhà trường phải trả lời nhiều câu hỏi có tính nguyên tắc. Công cụ có hiểu đúng yêu cầu của bài làm hay không. Phản hồi có bám sát chuẩn đầu ra và bối cảnh môn học hay không. Điểm số có công bằng giữa các sinh viên hay không. Dữ liệu bài làm có được bảo vệ hay không. Giảng viên có đủ năng lực để kiểm tra, điều chỉnh và giải thích kết quả do công cụ tạo ra hay không.
Miao và Holmes (2023), trong hướng dẫn của UNESCO về công cụ tạo sinh trong giáo dục và khoa học, nhấn mạnh yêu cầu quản trị có trách nhiệm, bảo đảm quyền riêng tư, minh bạch và kiểm soát rủi ro khi đưa công nghệ vào môi trường học thuật. Wang, Wang và Su (2024) cũng chỉ ra các thách thức đáng lưu ý, gồm liêm chính học thuật, sai sót và thiên lệch trong phản hồi, nguy cơ phụ thuộc quá mức vào công cụ số, chênh lệch tiếp cận công nghệ, quyền riêng tư và an toàn dữ liệu. Những cảnh báo này đặc biệt quan trọng trong đánh giá, bởi kết quả chấm bài ảnh hưởng trực tiếp đến quyền lợi học tập của sinh viên. Một công cụ có thể tạo phản hồi thuyết phục về mặt ngôn ngữ, nhưng nếu nhận xét không phù hợp với bài làm hoặc điểm số thiếu nhất quán, cơ sở đào tạo vẫn phải chịu trách nhiệm. Trách nhiệm giải trình trong đánh giá không thể chuyển giao cho hệ thống công nghệ. Công cụ có thể hỗ trợ xử lí, nhưng quyết định học thuật cuối cùng phải thuộc về con người.
Đánh giá đại học cần được thiết kế lại trong môi trường số
Sự phổ biến của công cụ tạo sinh không chỉ đặt ra câu hỏi về chấm bài, mà còn buộc giáo dục đại học phải điều chỉnh cách thiết kế đánh giá. Khi sinh viên có thể sử dụng công cụ số để hỗ trợ viết, tóm tắt tài liệu, lập dàn ý, diễn đạt lại nội dung hoặc gợi ý luận điểm, những dạng bài tập truyền thống cần được xem xét lại để tiếp tục đo lường đúng năng lực của người học.
Moorhouse, Yeo và Wan (2023) cho thấy nhiều đại học hàng đầu thế giới đã xây dựng hướng dẫn về việc sử dụng công cụ tạo sinh trong học tập và đánh giá, bao gồm khai báo việc sử dụng công nghệ, xử lí vấn đề đạo văn, phát hiện nội dung do công cụ tạo ra và điều chỉnh thiết kế đánh giá. Chan và Colloton (2024) cũng bàn đến yêu cầu thiết kế lại hoạt động đánh giá trong thời đại công cụ tạo sinh. Điều đó cho thấy trọng tâm không chỉ là cho phép hay không cho phép sử dụng công cụ, mà là tái cấu trúc đánh giá sao cho kết quả học tập vẫn phản ánh năng lực thật của sinh viên.
Một số hình thức đánh giá có thể được kết hợp linh hoạt hơn, như vấn đáp sau bài luận, thuyết trình bảo vệ sản phẩm học tập, nhật kí quá trình, bài viết gắn với dữ liệu thực tế, nhiệm vụ yêu cầu liên hệ trải nghiệm học tập hoặc đánh giá theo dự án có minh chứng tiến trình. Mulder, Baik và Ryan (2023) cho rằng giáo dục đại học cần suy nghĩ lại về đánh giá trước tác động của công cụ tạo sinh, trong đó có thể bổ sung các cơ chế xác thực năng lực sau khi sinh viên nộp sản phẩm viết.
Trong chấm bài, mô hình phù hợp hơn cả là phối hợp giữa công cụ số và giảng viên. Công cụ tạo sinh có thể được dùng để tạo phản hồi sơ bộ, phát hiện những điểm cần chú ý, đối chiếu bài làm với rubric hoặc hỗ trợ giảng viên trong các lớp đông. Sau đó, giảng viên kiểm tra, hiệu chỉnh, quyết định điểm cuối cùng và chịu trách nhiệm về phản hồi chính thức. Cách tiếp cận này không xem công nghệ là đối thủ của nhà giáo, mà đặt công nghệ vào vị trí trợ lý chuyên môn có giới hạn.
Khuyến nghị đối với giáo dục đại học Việt Nam
Tại Việt Nam, việc ứng dụng công cụ tạo sinh trong đánh giá cần được đặt trong bối cảnh đổi mới quản trị giáo dục, chuyển đổi số và nâng cao chất lượng đào tạo. Quyết định số 131/QĐ-TTg ngày 25 tháng 01 năm 2022 của Thủ tướng Chính phủ phê duyệt Đề án “Tăng cường ứng dụng công nghệ thông tin và chuyển đổi số trong giáo dục và đào tạo giai đoạn 2022–2025, định hướng đến năm 2030”, tạo cơ sở chính sách quan trọng cho việc thúc đẩy chuyển đổi số trong giáo dục và đào tạo. Quyết định số 1705/QĐ-TTg ngày 31 tháng 12 năm 2024 phê duyệt Chiến lược phát triển giáo dục đến năm 2030, tầm nhìn đến năm 2045, tiếp tục đặt ra yêu cầu phát triển giáo dục theo hướng hiện đại, chất lượng và phù hợp với xu thế mới. Nghị quyết số 71-NQ/TW ngày 22 tháng 8 năm 2025 của Bộ Chính trị về đột phá phát triển giáo dục và đào tạo cũng là căn cứ quan trọng để thúc đẩy đổi mới quản trị, phát triển đội ngũ và nâng cao chất lượng giáo dục trong giai đoạn tới.
Trên nền tảng chính sách đó, các cơ sở giáo dục đại học Việt Nam cần tiếp cận công cụ tạo sinh trong đánh giá theo hướng thận trọng, có thử nghiệm và có kiểm soát. Trước hết, không nên xem công cụ tạo sinh là hệ thống chấm điểm tự động thay thế giảng viên. Trong giai đoạn đầu, công cụ này chỉ nên được sử dụng như trợ lý hỗ trợ phản hồi, nhất là với những học phần có rubric rõ ràng, bài luận ngắn, số lượng bài lớn và mức rủi ro học thuật không quá cao. Điểm chính thức vẫn cần do giảng viên quyết định, trên cơ sở đọc bài, đối chiếu chuẩn đầu ra và kiểm tra mức độ phù hợp của nhận xét.
Bên cạnh đó, các trường cần chuẩn hóa rubric đánh giá ở từng học phần. Dữ liệu của Wut và cộng sự (2026) cho thấy công cụ tạo sinh hoạt động hiệu quả hơn khi được cung cấp đề bài, yêu cầu, tiêu chí và cách quy đổi điểm cụ thể. Điều này có ý nghĩa trực tiếp đối với giáo dục đại học Việt Nam, bởi việc ứng dụng công nghệ trong đánh giá chỉ có thể đạt chất lượng khi quy trình chấm bài được thiết kế rõ ràng, minh bạch và có khả năng giải trình. Rubric không chỉ phục vụ công cụ số, mà còn giúp sinh viên hiểu yêu cầu học tập và giúp giảng viên bảo đảm sự nhất quán trong chấm điểm.
Các cơ sở giáo dục đại học cũng cần ban hành quy định cấp trường về việc sử dụng công cụ tạo sinh trong kiểm tra, đánh giá. Quy định này nên làm rõ phạm vi sử dụng của sinh viên, trách nhiệm khai báo, nguyên tắc bảo vệ dữ liệu bài làm, điều kiện sử dụng công cụ trong hỗ trợ chấm bài và cơ chế xử lí khi có thắc mắc về điểm số. Nếu công cụ tạo sinh được sử dụng để hỗ trợ phản hồi hoặc chấm thử, sinh viên cần được thông tin minh bạch. Trong giáo dục đại học, minh bạch không chỉ là yêu cầu quản trị, mà còn là điều kiện để duy trì niềm tin học thuật.
Một yêu cầu quan trọng khác là bồi dưỡng năng lực đánh giá có hỗ trợ công nghệ cho giảng viên. Một giảng viên sử dụng hiệu quả công cụ tạo sinh không chỉ là người biết nhập yêu cầu vào hệ thống, mà phải biết thiết kế tiêu chí đánh giá, kiểm chứng phản hồi, nhận diện điểm bất hợp lí, điều chỉnh nhận xét và giải thích kết quả cho sinh viên. Năng lực này cần được xem là một phần trong phát triển chuyên môn của giảng viên đại học, đặc biệt tại các cơ sở đào tạo có quy mô lớn hoặc sử dụng nhiều bài luận, tiểu luận, báo cáo học phần và dự án học tập.
Các trường cũng nên triển khai thử nghiệm trong phạm vi hẹp trước khi mở rộng. Nhà trường có thể lựa chọn một số học phần phù hợp để sử dụng công cụ tạo sinh trong phản hồi sơ bộ, sau đó so sánh với đánh giá của giảng viên, khảo sát trải nghiệm của sinh viên và phân tích mức độ nhất quán giữa các nguồn nhận xét. Cách làm này giúp cơ sở đào tạo ra quyết định dựa trên bằng chứng, tránh hai khuynh hướng thiếu cân bằng: hoặc phủ nhận hoàn toàn công nghệ, hoặc quá vội vàng giao phó hoạt động đánh giá cho hệ thống số.
Đặc biệt, các trường cần chú ý đến quyền riêng tư và an toàn dữ liệu học tập. Bài làm của sinh viên chứa thông tin cá nhân, năng lực học thuật và đôi khi cả dữ liệu liên quan đến quá trình đào tạo. Vì vậy, trước khi sử dụng bất kì công cụ tạo sinh nào trong chấm bài, cơ sở giáo dục cần xác định rõ dữ liệu được nhập vào đâu, được lưu trữ ra sao, có được dùng để huấn luyện hệ thống hay không và ai chịu trách nhiệm nếu phát sinh rủi ro. Đây là yêu cầu phù hợp với tinh thần quản trị có trách nhiệm mà UNESCO đã khuyến nghị trong việc sử dụng công cụ tạo sinh trong giáo dục và khoa học (Miao & Holmes, 2023).
Chất lượng đánh giá không thể được phó mặc cho công nghệ
Công cụ tạo sinh đang mở ra một hướng hỗ trợ đáng chú ý cho hoạt động đánh giá trong giáo dục đại học. Khi được cung cấp tiêu chí rõ ràng, công cụ này có thể tạo điểm số tương đối gần với giảng viên, đưa ra phản hồi chi tiết và góp phần giảm bớt một phần áp lực trong các lớp học đông. Tuy nhiên, chính những dữ liệu thực nghiệm hiện có cũng cho thấy khoảng cách giữa công cụ số và đánh giá của con người chưa biến mất. Điểm số có thể gần nhau, nhưng giá trị sư phạm của phản hồi, sự phù hợp với bối cảnh học phần và trách nhiệm giải trình vẫn cần đến giảng viên. Trong giáo dục, đánh giá không chỉ nhằm phân loại kết quả học tập. Đó là quá trình xác nhận năng lực, định hướng cải thiện và bảo vệ sự công bằng học thuật. Vì vậy, công cụ tạo sinh chỉ thực sự có giá trị khi được đặt trong một thiết kế đánh giá có mục tiêu rõ ràng, tiêu chí minh bạch, dữ liệu an toàn và sự giám sát chuyên môn của con người.
Tương lai của đánh giá đại học không nên được hình dung như sự thay thế giảng viên bằng công nghệ. Hướng đi phù hợp hơn là xây dựng một cơ chế phối hợp mới, trong đó công cụ số hỗ trợ hiệu suất, còn nhà giáo bảo đảm chuẩn mực, công bằng và giá trị nhân văn của giáo dục. Khi công nghệ càng phát triển, trách nhiệm học thuật của con người càng cần được xác lập rõ ràng hơn; bởi chất lượng đào tạo không thể chỉ đo bằng tốc độ xử lí bài làm, mà phải được khẳng định bằng sự công bằng, độ tin cậy và khả năng thúc đẩy tiến bộ thực chất của người học.
Tài liệu tham khảo
Chan, C. K. Y., & Colloton, T. (2024). Redesigning assessment in the AI era. In Generative AI in higher education. Routledge.
Defazio, D., Kolymiris, C., Perkmann, M., & Salter, A. (2022). Busy academics share less: The impact of professional and family roles on academic withholding behaviour. Studies in Higher Education, 47(4), 731–750.
Fauzi, M. A., Rahamaddulla, S. R., Lee, C. K., Ali, Z., & Alias, U. N. (2024). Work pressure in higher education: A state of the art bibliometric analysis on academic work–life balance. International Journal of Workplace Health Management, 17(2), 175–195.
Labadze, L., Grigolia, M., & Machaidze, L. (2023). Role of AI chatbots in education: Systematic literature review. International Journal of Educational Technology in Higher Education, 20(1), 56.
Lu, Q., Yao, Y., Xiao, L., Yuan, M., Wang, J., & Zhu, X. (2024). Can ChatGPT effectively complement teacher assessment of undergraduate students’ academic writing? Assessment & Evaluation in Higher Education, 49(5), 616–633.
Miao, F., & Holmes, W. (2023). Guidance for generative AI in education and research. UNESCO.
Moorhouse, B. L., Yeo, M. A., & Wan, Y. (2023). Generative AI tools and assessment: Guidelines of the world’s top-ranking universities. Computers and Education Open, 5, 100151.
Mulder, R., Baik, C., & Ryan, T. (2023). Rethinking assessment in response to AI. Melbourne Centre for the Study of Higher Education, The University of Melbourne.
Nikolopoulou, K. (2024). Generative artificial intelligence in higher education: Exploring ways of harnessing pedagogical practices with the assistance of ChatGPT. International Journal of Changes in Education, 1(2), 103111.
Okonkwo, C. W., & Ade-Ibijola, A. O. (2021). Chatbots applications in education: A systematic review. Computers and Education: Artificial Intelligence, 2, 100033.
Swiecki, Z., Khosravi, H., Chen, G., Martinez-Maldonado, R., Lodge, J. M., Milligan, S., Selwyn, N., & Gašević, D. (2022). Assessment in the age of artificial intelligence. Computers and Education: Artificial Intelligence, 3, 100075.
Thủ tướng Chính phủ (2022). Quyết định số 131/QĐ-TTg ngày 25 tháng 01 năm 2022 phê duyệt Đề án “Tăng cường ứng dụng công nghệ thông tin và chuyển đổi số trong giáo dục và đào tạo giai đoạn 2022–2025, định hướng đến năm 2030”.
Thủ tướng Chính phủ (2024). Quyết định số 1705/QĐ-TTg ngày 31 tháng 12 năm 2024 phê duyệt Chiến lược phát triển giáo dục đến năm 2030, tầm nhìn đến năm 2045.
Bộ Chính trị (2025). Nghị quyết số 71-NQ/TW ngày 22 tháng 8 năm 2025 về đột phá phát triển giáo dục và đào tạo.
Usher, M. (2025). Generative AI vs. instructor vs. peer assessments: A comparison of grading and feedback in higher education. Assessment & Evaluation in Higher Education, 50(6), 912–927.
Wang, N., Wang, X., & Su, Y. S. (2024). Critical analysis of the technological affordances, challenges and future directions of Generative AI in education: A systematic review. Asia Pacific Journal of Education, 44(1), 139–155.
Wut, T. M., Chan, E. A., & Wong, H. S. (2026). Killing educators’ nightmare—Opportunities and challenges when using GenAI in marking an essay assignment. Education Sciences, 16, 270.
Zhao, J., Chapman, E., & Sabet, P. G. P. (2024). Generative AI and educational assessments: A systematic review. Educational Research and Practice, 51, 124–155.