#AnthropicReleasesFable5Model


Claude Fable 5 là mô hình có khả năng cao nhất của Anthropic hiện có sẵn công khai và là mô hình đầu tiên trong lớp Mythos mới của họ có khả năng truy cập rộng rãi. Nó được định vị cho kỹ thuật phần mềm, công việc kiến thức, các nhiệm vụ dài hạn và lý luận hình ảnh.
Anthropic đã báo cáo điểm số 80,3% trên SWE-Bench Pro, một tiêu chuẩn đánh giá các nhiệm vụ kỹ thuật phần mềm thực tế.
Mô hình bao gồm các kiểm soát an toàn mạnh hơn so với phiên bản Claude Mythos 5 hạn chế. Trong một số lĩnh vực có rủi ro cao (chẳng hạn như sinh học nâng cao hoặc an ninh mạng), các yêu cầu có thể bị chặn hoặc chuyển hướng đến một mô hình kém khả năng hơn.
Giá API là 10 đô la cho mỗi triệu token đầu vào và 50 đô la cho mỗi triệu token đầu ra, xấp xỉ gấp đôi giá của các mô hình Opus cấp trước của Anthropic.
Tại sao việc ra mắt này quan trọng
Việc ra mắt làm nổi bật xu hướng ngày càng tăng trong các phòng thí nghiệm AI tiên phong: đẩy khả năng cao hơn trong khi đồng thời thêm các biện pháp bảo vệ hạn chế hơn. Anthropic lập luận rằng Fable 5 có thể xử lý các luồng công việc dài hơn, tự chủ hơn so với các mô hình công khai trước đây, nhưng cũng đã giới thiệu các cơ chế hạn chế một cách có chủ ý các khả năng nhạy cảm nhất định.
Sự đánh đổi
Hiệu suất lập trình và lý luận mạnh mẽ hơn Chi phí token cao hơn
Thực thi nhiệm vụ dài hạn tốt hơn Các hạn chế an toàn nghiêm ngặt hơn
Sẵn có công khai Các truy vấn có thể bị chuyển hướng hoặc từ chối
Kết quả benchmark mạnh mẽ Chỉ số dẫn đầu benchmark không phải lúc nào cũng chuyển trực tiếp sang mọi quy trình làm việc thực tế
Tổng thể, việc ra mắt này định vị Claude Fable 5 như một mô hình cao cấp, có khả năng cao, hướng tới các tổ chức coi trọng hiệu suất trong các nhiệm vụ kỹ thuật phức tạp và phân tích, và sẵn sàng trả mức phí cao hơn đáng kể cho nó.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim