Anthropic Hoàn thành nâng cấp mô hình AI với Claude Opus 4.5—Và giảm giá

Decrypt

2025-11-25 17:09:00

Trung tâm Nghệ thuật, Thời trang và Giải trí của Decrypt.

Khám phá SCENE

Anthropic đã phát hành Claude Opus 4.5 vào thứ Hai, hoàn thành gia đình ba mô hình của mình và đánh dấu lần ra mắt lớn thứ ba của công ty chỉ trong hai tháng. Mô hình flagship mới này tuyên bố vị trí hàng đầu trong các tiêu chuẩn mã hóa trong khi giảm giá mạnh.

Việc phát hành này đánh dấu sự ra mắt nhanh chóng bắt đầu với Claude Sonnet 4.5 vào cuối tháng Chín và tiếp tục với Claude Haiku 4.5 vào tháng Mười. Giờ đây, với Opus gia nhập vào nhóm, Anthropic cung cấp cho các nhà phát triển một bộ công cụ hoàn chỉnh: Opus cho công việc sản xuất phức tạp, Sonnet cho các nhiệm vụ hàng ngày, và Haiku cho các nhiệm vụ liên quan đến tốc độ và hiệu quả cần logic đơn giản.

Claude Opus 4.5 đạt 80.9% trên SWE-bench Verified, một bài kiểm tra đánh giá các nhiệm vụ kỹ thuật phần mềm thực tế. Điều này vượt qua GPT-5.1-Codex-Max của OpenAI ở mức 77.9% và Gemini 3 Pro của Google ở mức 76.2%. Anthropic cho biết Opus đã vượt qua mọi ứng viên con người trong kỳ thi kỹ thuật hiệu suất nội bộ của họ—một bài kiểm tra kéo dài hai giờ được thiết kế để đánh giá khả năng phán đoán dưới áp lực.

Đã có một cuộc đua giữa các ông lớn AI để kết thúc năm ở vị trí dẫn đầu bảng xếp hạng. Google đã ra mắt Gemini 3 Pro vào ngày 18 tháng 11, định vị nó là một bước đột phá trong lý luận đa phương thức. OpenAI đã phản công vào ngày hôm sau với GPT-5.1-Codex-Max.

Giới thiệu Claude Opus 4.5: mô hình tốt nhất thế giới cho lập trình, đại lý và sử dụng máy tính.

Opus 4.5 là một bước tiến trong khả năng của các hệ thống AI, và là một cái nhìn trước về những thay đổi lớn hơn trong cách thức làm việc.

— Claude (@claudeai) ngày 24 tháng 11 năm 2025

<br>

Phản hồi của Anthropic với Opus đến chỉ vài ngày sau đó, nhưng nó đã đến với một điểm nhấn: giá cả là $5 cho mỗi triệu token đầu vào và $25 cho mỗi triệu token đầu ra, điều này đại diện cho việc giảm 67% so với mô hình Opus trước đó.

Các mô hình Qwen của Alibaba đã thêm một chiều cạnh mới vào cuộc đua. Công ty đã phát hành Qwen2.5-Max vào cuối tháng Giêng với hơn 20 nghìn tỷ token đào tạo, khẳng định rằng nó vượt trội hơn DeepSeek-V3 trên các tiêu chuẩn chính. Qwen3-Max, ra mắt vào tháng Chín với hơn 1 nghìn tỷ tham số, xếp thứ ba toàn cầu trên LMArena và xuất sắc trong nhiều nhiệm vụ khác nhau như nghiên cứu sâu, suy luận đa phương thức, hoặc quy trình làm việc trong các ngôn ngữ phương Đông. Trong khi các mô hình Qwen vẫn còn tương đối mờ nhạt trên thị trường phương Tây, chúng đại diện cho nỗ lực tự chủ AI của Trung Quốc trong bối cảnh các hạn chế xuất khẩu chip từ Hoa Kỳ.

Mức giá đó nằm giữa GPT-5.1 mới nhất của OpenAI ($1.25/$10) và Opus 4.1 cũ hơn của Anthropic ($15/$75), mặc dù vẫn đắt hơn Gemini 3 Pro với giá $2/$12. Sự giảm giá này báo hiệu áp lực thị trường khi các phòng thí nghiệm AI hàng đầu cạnh tranh không chỉ về khả năng, mà còn về việc làm cho trí tuệ tiên tiến có tính kinh tế khả thi cho việc triển khai quy mô.

Sản phẩm mới nhất của Claude vẫn đắt hơn nhiều đối thủ châu Á, nhưng cũng có khả năng tốt hơn một chút. Vì vậy, người dùng giờ đây có khả năng lựa chọn giữa hiệu quả chi phí hoặc khả năng kỹ thuật thuần túy.

Sonnet 4.5, phát hành vào ngày 30 tháng 9, mang đến khả năng lập trình và tác nhân tiên tiến với chi phí hợp lý và đã tốt hơn Opus 4.1 ở một số nhiệm vụ cụ thể. Haiku 4.5 đơn giản hơn đã được ra mắt vào ngày 15 tháng 10. Opus 4.5 hiện đang đứng đầu, xử lý những lý luận khó nhất và các nhiệm vụ kéo dài lâu nhất.

Tương tự như Sonnet và GPT-5, Claude Opus 4.5 sử dụng kiến trúc “lập luận kết hợp” mà Anthropic gọi là — một mô hình duy nhất được đào tạo cho cả suy diễn trực tiếp và xử lý chuỗi tư duy. Nó hỗ trợ cửa sổ ngữ cảnh 200.000 token và có thể xuất ra tối đa 64.000 token. Thời điểm cắt đứt kiến thức của mô hình là tháng 3 năm 2025, sớm hơn một chút so với ngày tháng 1 của Sonnet.

Nhà phát triển Simon Willison đã thử nghiệm Opus 4.5 một cách toàn diện trong suốt cuối tuần, sử dụng nó để tái cấu trúc một trong những dự án của mình. Mô hình đã xử lý 20 lần cam kết trên 39 tệp, thêm 2.022 dòng và xóa 1.173 dòng khác. “Rõ ràng đây là một mô hình mới xuất sắc,” Willison viết, mặc dù ông lưu ý rằng việc quay lại Sonnet 4.5 sau đó không làm giảm đáng kể năng suất của ông.

“Tôi không nói rằng mẫu mới không phải là một cải tiến so với Sonnet 4.5 — nhưng tôi không thể nói với sự tự tin rằng những thách thức mà tôi đặt ra [cho] nó đã có thể xác định một sự khác biệt có ý nghĩa về khả năng giữa hai cái.”

Theo Browne, một nhà phát triển, YouTuber, và Giám đốc điều hành của nền tảng AI T3 Chat, đã gọi Claude Opus 4.5 là “điên rồ,” đồng thời thêm vào một bài đánh giá video rằng nó “chắc chắn là mô hình lập trình tốt nhất từng được tạo ra.”

Cảnh quan cạnh tranh ngày càng trở nên đông đúc. Gemini 3 Pro của Google đã chiếm lĩnh tiêu đề tuần trước, đạt 1501 điểm trên LMArena và nhận được lời khen từ CEO Salesforce Marc Benioff, người đã nói rằng ông sẽ từ bỏ ChatGPT để chuyển sang mô hình của Google. Thông báo đó đã khiến cổ phiếu của Alphabet tăng hơn 6% và báo cáo cho biết đã khiến CEO OpenAI Sam Altman lo lắng, người đã nói với các đồng nghiệp rằng Gemini sẽ tạo ra “các cơn gió ngược kinh tế tạm thời.”

Microsoft và Nvidia đã công bố các khoản đầu tư hàng tỷ đô la vào Anthropic vào tuần trước, nâng định giá của công ty khởi nghiệp lên khoảng $350 tỷ. Các thỏa thuận bao gồm việc mở rộng tích hợp Azure và hạ tầng được hỗ trợ bởi Nvidia để đào tạo và triển khai các mô hình Claude.

Opus 4.5 có sẵn ngay lập tức thông qua API của Anthropic, AWS Bedrock, Google Vertex AI, và các ứng dụng web và desktop của Claude.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.