Amazon Web Services ( AWS ) đang bổ sung các tính năng độ sâu mới cho dòng mô hình AI sinh sinh “Nova”, thúc đẩy cạnh tranh AI đa phương thức. AWS đã công bố bốn mô hình Nova mới có khả năng xử lý đồng thời nhiều định dạng như văn bản, giọng nói, video, cùng với việc phát hành nền tảng sản xuất mô hình AI có thể tùy chỉnh “Nova Forge”.
Mô hình mới được giới thiệu lần này phân loại chức năng và khả năng xử lý dựa trên mục đích sử dụng, nhằm mục đích đạt được các ứng dụng AI rộng rãi từ việc đối phó với khách hàng hàng ngày đến nhận diện giọng nói khó khăn. Khác với các AI trước đây dựa trên chức năng đơn lẻ, tất cả các mô hình mới Nova đều có khả năng xử lý đa phương thức, có thể hiểu và phản hồi tổng hợp nhiều loại phương tiện.
“Nova 2 Lite” là mô hình nhấn mạnh hiệu quả chi phí và tốc độ xử lý, có khả năng chấp nhận đầu vào văn bản, hình ảnh, video, được thiết kế đặc biệt để phân tích dữ liệu phi cấu trúc và áp dụng vào công việc tài liệu tự động. Người dùng có thể điều chỉnh độ sâu suy diễn cần thiết giữa thời gian trễ và độ chính xác, các chức năng tìm kiếm trực tuyến và thực thi mã tích hợp sẵn có thể phản ánh thông tin theo thời gian thực vào kết quả.
Là một mô hình tiên tiến nhất, “Nova 2 Pro” hỗ trợ nhiều tác vụ suy diễn và chạy các tác nhân thông minh dựa trên mã. Mô hình này còn có thể đóng vai trò là “mô hình giáo viên” dùng để đào tạo AI, giúp khách hàng suy diễn và áp dụng phiên bản nhẹ cho các doanh nghiệp cụ thể.
“Nova 2 Sonic” là mô hình chuyên về tương tác giọng nói thời gian thực, hỗ trợ nhiều ngôn ngữ và có khả năng xử lý các tác vụ bất đồng bộ trong nền tảng. Nó hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token, có thể xử lý khoảng 75.000 dòng mã hoặc 1.500 trang tài liệu cùng một lúc. Mô hình này còn được tích hợp với dịch vụ trung tâm liên lạc Amazon Connect của AWS, có khả năng mở rộng hiệu quả giao diện tương tác giọng nói.
Cuối cùng, “Nova 2 Omni” là mô hình sinh đa phương thức hoàn chỉnh đầu tiên có thể xử lý bốn loại đầu vào (văn bản, hình ảnh, video, giọng nói) và tạo ra kết quả văn bản và hình ảnh. Nó thể hiện lợi thế trong các nhiệm vụ phức hợp như tự động tạo nội dung tiếp thị sau khi đọc toàn bộ danh sách sản phẩm, mà không cần kết hợp các mô hình chuyên nghiệp độc lập, có thể tích hợp xử lý dữ liệu đa phương tiện quy mô lớn trong một quy trình làm việc duy nhất.
Triển khai đám mây cũng rất thuận tiện. Các nhà phát triển có thể sử dụng công cụ Nova để xây dựng nguyên mẫu ứng dụng thông qua nova.amazon.com/dev, trong khi khách hàng doanh nghiệp có thể chạy các mô hình này trong môi trường bảo mật và khả năng mở rộng tiêu chuẩn thông qua Amazon Bedrock.
AWS thông qua lần phát hành này, đang củng cố quyền lực kỹ thuật của mình trên thị trường AI sinh tạo. Dòng sản phẩm Nova mới với khả năng xử lý đa phương thức và chức năng phản hồi thời gian thực được tăng cường, dự kiến sẽ tạo ra hiệu ứng lan tỏa mạnh mẽ đối với toàn bộ ngành công nghiệp khi ứng dụng AI ngày càng trở nên phổ biến.