Sự phát triển nhanh chóng của trí tuệ nhân tạo tạo sinh (Generative AI) và các mô hình ngôn ngữ lớn (Large Language Models – LLMs) như ChatGPT đang đặt ra nhiều câu hỏi quan trọng đối với phương pháp nghiên cứu khoa học xã hội. Một trong những vấn đề được tranh luận nhiều là liệu các công cụ AI có thể hỗ trợ quá trình phân tích dữ liệu định tính – vốn lâu nay dựa chủ yếu vào kỹ thuật coding (mã hóa dữ liệu) – hay không. Trong bối cảnh đó, bài báo Narrative-Integrated Thematic Analysis (NITA): How can LLMs support theme generation without coding? của các tác giả Nguyễn-Trung Kiên và Nguyễn Lan Ngọc (2026), đăng trên tạp chí Qualitative Research in Psychology, đã đề xuất một phương pháp phân tích dữ liệu định tính mới tích hợp AI.
Trong nghiên cứu định tính, coding từ lâu được xem là bước trung tâm của quá trình phân tích dữ liệu. Coding là quá trình gán nhãn cho các đoạn dữ liệu nhằm nhận diện các đặc điểm quan trọng và từ đó hình thành các chủ đề (themes) hoặc khái niệm lý thuyết.
Tuy nhiên, nhiều học giả cho rằng coding chỉ là một trong nhiều cách phân tích dữ liệu, chứ không phải là con đường duy nhất. Một số cách tiếp cận khác như phân tích tường thuật (narrative analysis) hoặc phân tích theo trường hợp (case-based analysis) nhấn mạnh việc duy trì mối liên hệ ngữ cảnh giữa các trải nghiệm của người tham gia nghiên cứu.
Sự xuất hiện của các mô hình ngôn ngữ lớn đã mở ra khả năng tương tác trực tiếp với dữ liệu thông qua đối thoại với AI. Thay vì phải mã hóa từng đoạn dữ liệu, nhà nghiên cứu có thể đặt câu hỏi cho AI, yêu cầu mô hình gợi ý các mẫu ý nghĩa (patterns of meaning) trong dữ liệu. Tuy nhiên, việc sử dụng AI theo cách này đặt ra nhiều vấn đề về phương pháp luận, đặc biệt là câu hỏi:
LLMs có thể hỗ trợ quá trình tạo chủ đề (theme generation) trong phân tích dữ liệu định tính mà không cần coding hay không?
Phương pháp NITA: một cách tiếp cận mới
Để trả lời câu hỏi trên, nhóm tác giả đề xuất phương pháp Narrative-Integrated Thematic Analysis (NITA). Phương pháp này được thiết kế nhằm cho phép nhà nghiên cứu hướng dẫn và kiểm soát AI trong quá trình phân tích dữ liệu, thay vì để AI tự động thực hiện toàn bộ quá trình. NITA dựa trên quan điểm phi thực chứng và thực dụng (non-positivist, pragmatist), đặt tính phản tư và phán đoán học thuật của nhà nghiên cứu vào trung tâm của quá trình phân tích. AI chỉ đóng vai trò hỗ trợ gợi ý và xử lý dữ liệu, trong khi các quyết định diễn giải vẫn do nhà nghiên cứu đảm nhiệm. Phương pháp này kết hợp hai yếu tố chính:
1. Khung quy trình PERFECT – một quy trình phản tư và học hỏi liên tục khi làm việc với AI.
2. Phương pháp đối thoại với AI – cho phép nhà nghiên cứu tương tác với dữ liệu thông qua các câu hỏi và phản hồi với mô hình ngôn ngữ.
Thiết lập mô hình GPT phục vụ phân tích dữ liệu định tính theo phương pháp NITA (Nguồn: Nhóm tác giả)
Quy trình NITA gồm 6 giai đoạn chính:
1. Lập kế hoạch phân tích (Planning): xây dựng quy trình PERFECT để định hướng việc sử dụng AI.
2. Chuẩn bị dữ liệu và hệ thống AI (Preparation): làm quen với dữ liệu, chuẩn bị tập dữ liệu và cấu hình hệ thống AI.
3. Tạo danh sách chủ đề ban đầu (Generating candidate themes): yêu cầu AI đề xuất các chủ đề tiềm năng từ dữ liệu.
4. Xây dựng câu chuyện cá nhân (Constructing individual narratives): áp dụng các chủ đề để phân tích từng trường hợp người tham gia.
5. Xây dựng meta-narrative (Constructing meta-narratives): so sánh các trường hợp và phát hiện các mẫu ý nghĩa chung.
6. Viết báo cáo nghiên cứu (Writing up): tổng hợp kết quả phân tích để trả lời câu hỏi nghiên cứu.
Một điểm đặc biệt của NITA là quá trình phân tích mang tính lặp lại và phản tư, trong đó nhà nghiên cứu liên tục kiểm tra, điều chỉnh và đánh giá các gợi ý của AI.
Thử nghiệm phương pháp
Để kiểm nghiệm phương pháp, nhóm tác giả sử dụng một bộ dữ liệu gồm 11 cuộc phỏng vấn về nhận thức của cộng đồng đối với biến đổi môi trường tại vùng Down East (North Carolina, Hoa Kỳ). Tổng số dữ liệu khoảng 20.000 từ.
Các tác giả sử dụng ChatGPT (GPT-4o) để hỗ trợ phân tích và so sánh kết quả của phương pháp NITA với một nghiên cứu trước đó sử dụng phương pháp coding truyền thống trên cùng bộ dữ liệu.
Kết quả cho thấy AI có thể hỗ trợ tạo ra các chủ đề phân tích tương đối giống với các chủ đề được xây dựng bằng phương pháp coding. Các chủ đề chính được xác định bao gồm:
- Gắn bó gia đình và truyền thống địa phương
- Bản sắc văn hóa và ngôn ngữ cộng đồng
- Tính gắn kết cộng đồng
- Mối quan hệ với môi trường tự nhiên
- Sinh kế gắn với biển
- Sự phản kháng đối với các thay đổi phát triển không bền vững
Những chủ đề này được kết nối trong một meta-narrative giải thích cách người dân hình thành sự gắn bó sâu sắc với vùng Down East.
Trí tuệ nhân tạo có thể mở ra những khả năng mới cho phân tích dữ liệu định tính, nhưng không làm thay đổi bản chất của nghiên cứu định tính.
Ý nghĩa và đóng góp
Nghiên cứu đưa ra một số đóng góp quan trọng cho phương pháp nghiên cứu định tính trong thời đại AI. Thứ nhất, nghiên cứu cho thấy AI có thể hỗ trợ quá trình tạo chủ đề mà không cần coding, mở ra khả năng phát triển các phương pháp phân tích dữ liệu định tính mới. Thứ hai, nghiên cứu nhấn mạnh rằng AI không thể thay thế vai trò của nhà nghiên cứu. Các mô hình ngôn ngữ chỉ nên đóng vai trò hỗ trợ trong việc phát hiện mẫu dữ liệu và gợi ý diễn giải, trong khi các quyết định phân tích vẫn cần dựa vào tri thức, kinh nghiệm và sự phản tư của nhà nghiên cứu. Thứ ba, phương pháp NITA cung cấp một khung phương pháp luận rõ ràng để sử dụng AI một cách có trách nhiệm và minh bạch trong nghiên cứu định tính.
Bài báo của Nguyễn-Trung Kiên và Nguyễn Ngọc Lan cho thấy rằng trí tuệ nhân tạo có thể mở ra những khả năng mới cho phân tích dữ liệu định tính, nhưng không làm thay đổi bản chất của nghiên cứu định tính. Thay vì thay thế các phương pháp truyền thống, các công cụ AI nên được xem như một công cụ bổ trợ giúp nhà nghiên cứu khám phá dữ liệu hiệu quả hơn. Phương pháp NITA vì vậy có thể được xem là một hướng tiếp cận mới đáng chú ý trong bối cảnh AI đang ngày càng được tích hợp vào các hoạt động nghiên cứu khoa học xã hội.
Tài liệu tham khảo Nguyen-Trung, K., & Nguyen, N. (2025). Narrative-Integrated Thematic Analysis (NITA): How can LLMs support theme generation without coding? Qualitative Research in Psychology (online 6 March 2026). https://doi.org/10.1080/14780887.2026.2638348