Nguồn: TokenPost
Tiêu đề gốc: Anthropic ra mắt mô hình ngôn ngữ lớn ‘Claude 4.5’… Tăng cường tự động hóa công việc và giảm chi phí suy luận.
Liên kết gốc:
Công ty khởi nghiệp AI Anthropic( vừa chính thức ra mắt mô hình ngôn ngữ lớn thế hệ tiếp theo)LLM( 'Claude Opus 4.5)'. Mô hình mới nhất này được công ty đánh giá là AI hàng đầu với hiệu suất cao nhất và độ an toàn. Claude Opus 4.5 là đỉnh cao của dòng sản phẩm Claude 4.5, sau các mô hình trung cấp trước đó 'Sonnet( 4.5' và mô hình dành cho người mới bắt đầu 'Haiku) 4.5'.
Theo Anthropic, Opus 4.5 cung cấp hiệu suất nổi bật so với các mô hình cạnh tranh trong tự động hóa công việc dựa trên tác nhân tự trị. Đặc biệt, ngay cả khi thất bại trong lần thử đầu tiên, mô hình sẽ cải thiện dần khả năng của mình qua quá trình lặp lại để giải quyết vấn đề. Kết quả thử nghiệm của Anthropic cho thấy mô hình này thường đạt hiệu suất tối ưu trong vòng lặp học 4 lần, trong khi các LLM cạnh tranh cần trung bình hơn 10 lần lặp.
Opus 4.5 cũng có những ưu điểm trong việc thực hiện các công việc dài hạn như viết lại các ứng dụng quy mô lớn, có thể mất vài giờ xử lý. Các nhà phát triển thường vận hành nhiều tác nhân đồng thời trong môi trường làm việc phức tạp, và Anthropic cho biết họ có thể xử lý công việc chính bằng Opus 4.5 trong khi sử dụng Haiku 4.5 nhẹ hơn cho các công việc phụ nhằm giảm chi phí. Phương pháp này cũng được kỳ vọng sẽ giúp giảm chi phí suy luận.
Hiệu suất lập trình cũng đã được cải thiện. Công ty cho biết mức độ phụ thuộc vào hướng dẫn của nhà phát triển đã giảm so với các mô hình trước và khả năng giải thích câu đa nghĩa một cách tinh vi hơn đã được trang bị. Ví dụ, chỉ với một lệnh, có thể xem xét nhiều hệ thống và xác định nguyên nhân của lỗi.
Các tính năng mới đã được tăng cường tích hợp để sử dụng thân thiện với người dùng. Tính năng tích hợp với Excel và Google Chrome cho thấy điều này. Cloud có thể truy cập qua thanh bên Excel đã thêm tính năng tạo bảng tổng hợp và biểu đồ gần đây, và người dùng của kế hoạch Team, Max và Enterprise có thể ngay lập tức sử dụng tính năng này. Tiện ích mở rộng Chrome hỗ trợ Cloud thực hiện các tác vụ của người dùng trực tiếp trên ứng dụng web, và cũng được trang bị tính năng phản hồi với các lời nhắc độc hại. Tính năng này cũng đã được mở hoàn toàn cho người dùng gói Max.
Ngoài ra, bản phát hành lần này còn bao gồm nhiều cải tiến chức năng. Ví dụ, trợ lý lập trình 'Claude Code' đã được tích hợp vào ứng dụng khách máy tính để bàn, và giới hạn sử dụng đã tăng lên cho các gói Max và Team. Chức năng tóm tắt lịch sử trò chuyện trước đó cũng đã được thêm mới vào Claude Chat.
Opus 4.5 có thể được sử dụng thông qua Claude Chat, mã và API, và người dùng API cũng có thể tận dụng tính năng 'cài đặt nỗ lực' để điều chỉnh thời gian xử lý và phân bổ tài nguyên trong quá trình làm việc. Khi tài nguyên tính toán tăng lên, chất lượng đầu ra sẽ được cải thiện. Giá được xác định là 5 đô la cho mỗi triệu token đầu vào và 25 đô la cho mỗi triệu token đầu ra.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
16 thích
Phần thưởng
16
6
Đăng lại
Retweed
Bình luận
0/400
MiningDisasterSurvivor
· 11-25 02:02
Một "hiệu suất cao nhất" nữa, tôi đã trải qua... Vào năm 2018 cũng có người nói như vậy, kết quả thì sao?
Xem bản gốcTrả lời0
fren.eth
· 11-25 02:02
opus 4.5 thật sự đã đến, giờ thì openai lại phải lo lắng rồi ha ha
Xem bản gốcTrả lời0
MidnightTrader
· 11-25 02:02
Lại có mô hình mới, lần này claude có thể rẻ bao nhiêu? Thực sự điều quan trọng vẫn là liệu chi phí suy luận có thể giảm xuống không.
Xem bản gốcTrả lời0
YieldHunter
· 11-25 02:01
không giấu diếm, anthropic đang chơi trò giảm chi phí một cách quyết liệt nhưng mà... thực sự họ đã hiển thị các số liệu suy diễn thực chưa? nếu bạn nhìn vào dữ liệu, những cải tiến về hiệu suất không phải lúc nào cũng chuyển thành lợi nhuận bền vững cho các nhà phát triển sử dụng những api này thật lòng mà nói. tôi vẫn hoài nghi cho đến khi tôi thấy hệ số tương quan thực giữa những tuyên bố của họ và tỷ lệ chấp nhận thị trường.
Xem bản gốcTrả lời0
ETHmaxi_NoFilter
· 11-25 01:58
claude 4.5 lại vừa ra phiên bản mới nữa, chi phí còn giảm? Tốc độ này thực sự hơi quá đáng rồi haha
Xem bản gốcTrả lời0
WagmiWarrior
· 11-25 01:43
Claude lại ra phiên bản mới rồi, chi phí còn có thể giảm nữa không? Lần này thực sự muốn đánh bại OpenAI sao?
Anthropic, ra mắt mô hình ngôn ngữ lớn 'Claude Opera 4.5'... Tăng cường tự động hóa công việc và giảm chi phí suy luận
Nguồn: TokenPost Tiêu đề gốc: Anthropic ra mắt mô hình ngôn ngữ lớn ‘Claude 4.5’… Tăng cường tự động hóa công việc và giảm chi phí suy luận. Liên kết gốc: Công ty khởi nghiệp AI Anthropic( vừa chính thức ra mắt mô hình ngôn ngữ lớn thế hệ tiếp theo)LLM( 'Claude Opus 4.5)'. Mô hình mới nhất này được công ty đánh giá là AI hàng đầu với hiệu suất cao nhất và độ an toàn. Claude Opus 4.5 là đỉnh cao của dòng sản phẩm Claude 4.5, sau các mô hình trung cấp trước đó 'Sonnet( 4.5' và mô hình dành cho người mới bắt đầu 'Haiku) 4.5'.
Theo Anthropic, Opus 4.5 cung cấp hiệu suất nổi bật so với các mô hình cạnh tranh trong tự động hóa công việc dựa trên tác nhân tự trị. Đặc biệt, ngay cả khi thất bại trong lần thử đầu tiên, mô hình sẽ cải thiện dần khả năng của mình qua quá trình lặp lại để giải quyết vấn đề. Kết quả thử nghiệm của Anthropic cho thấy mô hình này thường đạt hiệu suất tối ưu trong vòng lặp học 4 lần, trong khi các LLM cạnh tranh cần trung bình hơn 10 lần lặp.
Opus 4.5 cũng có những ưu điểm trong việc thực hiện các công việc dài hạn như viết lại các ứng dụng quy mô lớn, có thể mất vài giờ xử lý. Các nhà phát triển thường vận hành nhiều tác nhân đồng thời trong môi trường làm việc phức tạp, và Anthropic cho biết họ có thể xử lý công việc chính bằng Opus 4.5 trong khi sử dụng Haiku 4.5 nhẹ hơn cho các công việc phụ nhằm giảm chi phí. Phương pháp này cũng được kỳ vọng sẽ giúp giảm chi phí suy luận.
Hiệu suất lập trình cũng đã được cải thiện. Công ty cho biết mức độ phụ thuộc vào hướng dẫn của nhà phát triển đã giảm so với các mô hình trước và khả năng giải thích câu đa nghĩa một cách tinh vi hơn đã được trang bị. Ví dụ, chỉ với một lệnh, có thể xem xét nhiều hệ thống và xác định nguyên nhân của lỗi.
Các tính năng mới đã được tăng cường tích hợp để sử dụng thân thiện với người dùng. Tính năng tích hợp với Excel và Google Chrome cho thấy điều này. Cloud có thể truy cập qua thanh bên Excel đã thêm tính năng tạo bảng tổng hợp và biểu đồ gần đây, và người dùng của kế hoạch Team, Max và Enterprise có thể ngay lập tức sử dụng tính năng này. Tiện ích mở rộng Chrome hỗ trợ Cloud thực hiện các tác vụ của người dùng trực tiếp trên ứng dụng web, và cũng được trang bị tính năng phản hồi với các lời nhắc độc hại. Tính năng này cũng đã được mở hoàn toàn cho người dùng gói Max.
Ngoài ra, bản phát hành lần này còn bao gồm nhiều cải tiến chức năng. Ví dụ, trợ lý lập trình 'Claude Code' đã được tích hợp vào ứng dụng khách máy tính để bàn, và giới hạn sử dụng đã tăng lên cho các gói Max và Team. Chức năng tóm tắt lịch sử trò chuyện trước đó cũng đã được thêm mới vào Claude Chat.
Opus 4.5 có thể được sử dụng thông qua Claude Chat, mã và API, và người dùng API cũng có thể tận dụng tính năng 'cài đặt nỗ lực' để điều chỉnh thời gian xử lý và phân bổ tài nguyên trong quá trình làm việc. Khi tài nguyên tính toán tăng lên, chất lượng đầu ra sẽ được cải thiện. Giá được xác định là 5 đô la cho mỗi triệu token đầu vào và 25 đô la cho mỗi triệu token đầu ra.