
OpenAI đã phát hành GPT-5.4 Mini và GPT-5.4 Nano vào ngày 18 tháng 3, hai mô hình nhẹ được thiết kế cho các tải trọng AI có dung lượng lớn. Chỉ chưa đầy hai tuần sau khi ra mắt phiên bản flagship GPT-5.4, OpenAI đã tiếp tục cập nhật. GPT-5.4 Mini nhanh gấp đôi so với phiên bản GPT-5 Mini trước đó, còn GPT-5.4 Nano được tối ưu hóa với chi phí thấp hơn để phù hợp với các kịch bản đối thoại tức thì.
OpenAI định vị GPT-5.4 Mini và Nano là “các mô hình nhỏ mạnh nhất từ trước đến nay”, nhưng điều này không có nghĩa là chúng chỉ là phiên bản rút gọn của flagship. Chúng được thiết kế dựa trên các ưu tiên khác nhau: khi nhiệm vụ thực tế bị giới hạn bởi tốc độ và chi phí hơn là khả năng suy luận sâu, các mô hình nhỏ hơn thường mang lại tính thực dụng cao hơn.
Ví dụ trong hệ thống dịch vụ khách hàng: nếu mỗi ngày trả lời 200 câu hỏi cố định, khả năng suy luận cấp tiến sĩ gần như không mang lại lợi ích gì thêm, trong khi chi phí phản hồi dưới một giây mỗi lần chỉ vài phần trăm cent Mỹ, mới là yếu tố quyết định khả năng mở rộng của hệ thống.
Hiện tại, một quy trình làm việc hiệu quả là: để mô hình flagship (như GPT-5.4) đảm nhận vai trò lập kế hoạch và điều phối nhiệm vụ, trong khi Mini hoặc Nano xử lý song song hàng loạt nhiệm vụ lặp lại như tìm kiếm trong kho mã, đọc tài liệu hoặc xử lý biểu mẫu. Phó giám đốc kỹ thuật của Perplexity, Jerry Ma, sau khi thử nghiệm cho biết: “Mô hình Mini có khả năng suy luận mạnh mẽ, còn Nano phản hồi nhanh và hiệu quả, phù hợp cho quy trình đối thoại tức thì.”

(nguồn: OpenAI)
Dựa trên các dữ liệu tiêu chuẩn công khai, hiệu suất của GPT-5.4 Mini đã gần như sánh ngang với phiên bản flagship:
Dữ liệu này cho thấy: trong các tình huống cần thao tác trên desktop hoặc xử lý mã, Mini gần như sánh ngang với phiên bản flagship; Nano dù độ chính xác thấp hơn, vẫn có lợi thế về chi phí và tốc độ trong các kịch bản yêu cầu phản hồi nhanh.
Giá API: GPT-5.4 Mini có giá 0,75 USD cho mỗi triệu token đầu vào, 4,50 USD cho mỗi triệu token đầu ra; GPT-5.4 Nano có giá 0,20 USD cho mỗi triệu token đầu vào, 1,25 USD cho mỗi triệu token đầu ra — giá đầu vào của Nano khoảng một phần tư của Mini.
Khả năng truy cập: GPT-5.4 Mini đã mở cho người dùng ChatGPT Free và Go, có thể truy cập qua tùy chọn “+” trong giao diện ChatGPT dưới mục “Suy nghĩ”. Khi người dùng trả phí đạt giới hạn sử dụng GPT-5.4, hệ thống sẽ tự động chuyển sang Mini. Hiện tại, GPT-5.4 Nano chỉ cung cấp qua API, hướng tới các nhà phát triển, không trực tiếp dành cho người tiêu dùng.
GPT-5.4 Mini và GPT-5.4 flagship khác nhau chính ở điểm nào?
GPT-5.4 Mini nhanh hơn gấp hơn hai lần so với phiên bản GPT-5 Mini cũ, đạt điểm 72.1% trong thử nghiệm OSWorld-Verified, vượt qua mức chuẩn của con người là 72.4%, chỉ thấp hơn một chút so với flagship là 75.0%. Sự khác biệt chính nằm ở khả năng suy luận sâu và xử lý các nhiệm vụ phức tạp, trong khi Mini có lợi thế về tốc độ và chi phí, phù hợp cho các nhiệm vụ lặp lại quy mô lớn.
Kịch bản sử dụng tốt nhất của GPT-5.4 Nano là gì?
GPT-5.4 Nano hướng tới các nhà phát triển API, phù hợp cho các quy trình đối thoại nhẹ, yêu cầu phản hồi tức thì như hệ thống chăm sóc khách hàng trực tuyến hoặc các truy vấn tự động hàng ngày quy mô lớn. Với giá đầu vào chỉ 0,20 USD cho mỗi triệu token, các công ty khởi nghiệp có thể triển khai quy mô lớn một cách kinh tế.
Làm thế nào để sử dụng GPT-5.4 Mini trong ChatGPT?
GPT-5.4 Mini đã mở cho người dùng ChatGPT Free và Go, có thể truy cập qua tùy chọn “+” trong giao diện ChatGPT dưới mục “Suy nghĩ”. Khi người dùng đạt giới hạn sử dụng, hệ thống sẽ tự động chuyển sang phiên bản Mini.