Giáo sư Ethan Mollick của Trường Kinh doanh Wharton (Đại học Pennsylvania) trong bài đăng trên nền tảng X ngày 4/25 đã đưa ra một nhận xét có tác động mạnh mẽ đến giới học thuật: hiện nay các AI agent đã có thể độc lập tái hiện các kết quả nghiên cứu học thuật phức tạp chỉ dựa vào mô tả phương pháp và dữ liệu công khai, mà không cần có bản thân bài báo gốc và cũng không cần có mã nguồn gốc. Mollick còn chỉ ra rằng, khi các phiên bản AI tái hiện này khác với bài báo gốc, “lỗi thường nằm ở chính văn bản/đoạn văn của con người, chứ không phải ở AI”. Đây là một bước ngoặt thực chất trong cuộc khủng hoảng khả năng tái lập trong thời đại AI tạo sinh—việc từng cần nhân lực đắt đỏ để tiến hành kiểm chứng đồng cấp, giờ đang được AI thực hiện trên quy mô lớn với chi phí thấp.
Claude tái hiện nhiều bài báo, rồi dùng GPT-5 Pro kiểm chứng hai lớp
Trong blog OneUsefulThing của mình và trong tweet này, Mollick mô tả thí nghiệm cụ thể của anh với Claude: đưa một bài báo học thuật cho Claude, yêu cầu nó mở kho lưu trữ, sắp xếp các tệp, tự động chuyển đổi mã STATA dùng cho thống kê sang Python, rồi lần lượt chạy tất cả các phát hiện trong bài báo. Sau khi Claude hoàn tất, anh lại dùng GPT-5 Pro để kiểm tra lần thứ hai trên cùng một kết quả tái hiện. Nhiều bài báo được thử nghiệm theo cách tương tự; kết quả nhìn chung thành công, chỉ bị cản trở khi tệp dữ liệu quá lớn hoặc bản thân replication data gốc có vấn đề.
Đối với giới học thuật, quy trình này trước đây thường cần nghiên cứu sinh/assistant tốn vài tuần thậm chí vài tháng. Quy mô thời gian Mollick mô tả là từ một buổi chiều đến một ngày, và chi phí vận hành chỉ là phí token của API LLM thương mại.
Lỗi đa phần nằm ở bản gốc do con người viết, không phải ở AI
Gây tranh cãi hơn là đánh giá của Mollick về “ai sai”. Trong tweet, anh nêu rõ rằng khi kết quả tái hiện bằng AI không khớp với bài báo gốc, thì trong đa số trường hợp không phải AI gây sai, mà là bài báo gốc có lỗi trong xử lý dữ liệu, dùng sai mô hình, hoặc các kết luận vượt ra ngoài phạm vi mà dữ liệu có thể chống đỡ. Trong khoảng mười năm gần đây, các ngành khoa học xã hội như tâm lý học, kinh tế học hành vi, quản lý học đã xuất hiện nhiều lần các sự kiện khủng hoảng lớn về khả năng tái lập; sự kiện nổi tiếng nhất là nghiên cứu tái hiện quy mô lớn của Open Science Collaboration năm 2015, chỉ khoảng 36% kết quả của các bài báo tâm lý học có thể được tái hiện độc lập. AI agent đang đẩy ranh giới của quá trình kiểm nghiệm này từ “cần phân bổ nhân lực” sang “có thể thực hiện phổ biến”.
Học hội vẫn cấm AI vào quy trình duyệt bài, thể chế lạc hậu so với công nghệ
Trong một tweet khác ngày 4/25, Mollick nêu đích danh học hội lớn nhất của lĩnh vực mình là Academy of Management vẫn còn cấm AI một cách rõ ràng tham gia quy trình nộp/bình duyệt bài báo. Anh trích dẫn một số nghiên cứu hiện có cho thấy việc duyệt bài bằng AI về độ chính xác, tính nhất quán và kiểm soát thiên kiến đã vượt trội so với một phần người duyệt bài truyền thống. Do đó, quan điểm “cấm” có thể vô tình làm trầm trọng thêm sự thất bại của hệ thống duyệt bài hiện hữu. Khoảng cách giữa thể chế và công nghệ như vậy là một vấn đề chính sách mà 1–2 năm tới giới xuất bản học thuật, các học hội và tổ chức tài trợ đều phải đối mặt.
Đối với người đọc, cuộc tranh luận này không chỉ giới hạn trong học thuật. Khi AI agent có thể kiểm chứng tức thời các phát hiện nghiên cứu, các trích dẫn nghiên cứu trong ngành công nghiệp, các báo cáo chính sách, và các cơ sở học thuật trong quyết định tài chính sẽ bước vào một ngưỡng kiểm chứng mới: “kết luận có chịu được việc AI tái hiện độc lập hay không”. Theo phần bổ sung trong một tweet khác của Mollick, anh cho rằng chính phủ là đơn vị duy nhất có thể đặt “mốc” cho cơ chế kiểm chứng này khi cường độ công cụ tiếp tục tăng lên—và mức độ phức tạp của thiết kế chính sách, sẽ đồng thời trở thành một trục chính tương đối bị bỏ quên trong thảo luận quản trị AI.
Bài viết này: AI Agent đã có thể độc lập tái hiện các bài báo học thuật phức tạp—Mollick cho rằng lỗi chủ yếu nằm ở bản gốc do con người viết chứ không phải AI. Lần đầu tiên xuất hiện trên Chuỗi tin ABMedia.
Bài viết liên quan
Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI
Các Tiểu vương quốc Ả Rập Thống nhất (UAE) Công bố Chuyển hướng sang Mô hình Chính phủ dựa trên AI trong Hai Năm Tiếp theo
Nền tảng giao dịch AI Fere AI huy động 1,3 triệu USD, được dẫn dắt bởi Ethereal Ventures
Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell
Startup mã hóa bằng AI Cognition đang đàm phán vòng gọi vốn định giá $25B
Nền tảng tác nhân giao dịch bằng AI Fere AI huy động được 1,3 triệu USD, do Ethereal Ventures dẫn dắt