Chuyển đổi từ Điện toán Đám mây sang Điện toán Cạnh
AI suy luận dựa trên đám mây đã trở nên quá đắt đỏ. Mặc dù chi phí token giảm mạnh—dữ liệu của Stanford cho thấy các mô hình tương đương GPT-3.5 đã giảm giá 280 lần trong hai năm—các doanh nghiệp vẫn phải đối mặt với chi tiêu ngày càng tăng cho các tác vụ AI. Vấn đề trở nên trầm trọng hơn khi xử lý các mô hình lý luận nâng cao và các tác nhân AI, đòi hỏi nhiều token hơn nhiều so với các nhiệm vụ suy luận đơn giản.
Điều này tạo ra một cơ hội. Khi các mô hình AI trở nên hiệu quả hơn và phần cứng được cải thiện, việc xử lý một số tác vụ tại chỗ trên các thiết bị cá nhân bắt đầu có ý nghĩa kinh tế. Một khung công tác do Deloitte đề xuất xác định ba kịch bản triển khai riêng biệt: các nhà cung cấp đám mây hyperscaler xử lý các tác vụ phức tạp, thử nghiệm yêu cầu các mô hình hàng đầu; hạ tầng tại chỗ phục vụ các tác vụ dự đoán, nhạy cảm nơi độ trễ quan trọng; và các thiết bị cạnh, bao gồm máy tính cá nhân, xử lý các nhiệm vụ thời gian thực với các mô hình nhỏ hơn.
Thông tin quan trọng? Chúng ta đang bước vào kỷ nguyên mà xử lý AI phân tán trở nên không thể tránh khỏi.
Phản hồi của AMD: Nền tảng Ryzen AI Halo
Tại CES, AMD giới thiệu một sản phẩm xứng đáng nhận nhiều sự chú ý hơn các GPU MI440X gây chú ý: đó là Ryzen AI Halo. Ra mắt vào Quý 2, chiếc mini-PC này thể hiện vị trí quan trọng của nó trong chu kỳ tính toán tiếp theo.
Các thông số kỹ thuật kể câu chuyện:
Kiến trúc CPU 16 nhân
Bộ nhớ thống nhất 128GB
Bộ xử lý AI tích hợp với bộ xử lý đồ họa phụ trợ
Tổng công suất tính toán AI: lên đến 126 TOPS (Tỷ lượt hoạt động mỗi giây)
Sản phẩm này không nhắm vào người tiêu dùng phổ thông. Đây là nền tảng dành cho các nhà phát triển xây dựng ứng dụng AI tại chỗ. Kho bộ nhớ 128GB cho phép chạy các mô hình AI mã nguồn mở lớn—nghĩ đến các mô hình có hàng tỷ tham số—trực tiếp trên thiết bị. Mặc dù chúng không cạnh tranh với các mô hình tiên phong của OpenAI hay Anthropic, nhưng đủ mạnh để xử lý các nhiệm vụ phức tạp trong thực tế.
Tại sao Sản phẩm này Quan trọng đối với Tương lai của AMD
Ryzen AI Halo có thể sẽ không đạt doanh số bán hàng đột phá. Nó đắt đỏ, chuyên biệt và theo nghĩa đen là ngách. Tuy nhiên, nó báo hiệu điều gì đó sâu sắc về tư duy chiến lược của AMD.
Dòng sản phẩm PC AI rộng hơn của công ty đã có khả năng đáng kể. Ryzen AI 400 series cung cấp 60 TOPS và bắt đầu được bán ra trong tháng này, trong khi các bộ xử lý Ryzen AI Max+ trong Halo hỗ trợ đầy đủ cấu hình bộ nhớ 128GB và có thể thực thi các mô hình với 128 tỷ tham số.
Các PC AI ngày nay gặp nhiều hạn chế đáng kể. Công suất xử lý vẫn chưa đủ, bộ nhớ có sẵn quá hạn chế, và các thách thức về cung cấp bộ nhớ vẫn tồn tại. Nhưng đây chỉ là ma sát tạm thời, không phải giới hạn vĩnh viễn.
Sự hội tụ không thể tránh khỏi
Hãy xem xét các trợ lý mã như Claude Code, đã biến đổi quy trình lập trình. Một mô hình AI dựa trên laptop với độ tinh vi tương đương còn xa bao nhiêu? Ba năm? Bốn năm? Quỹ đạo này chỉ theo một hướng.
Chạy suy luận AI tại chỗ loại bỏ chi phí API đám mây liên tục, duy trì quyền riêng tư dữ liệu trên thiết bị, và giảm độ trễ xuống gần bằng không. Những lợi thế này tích tụ lại. Đồng thời, việc yêu cầu thiết bị truy vấn các dịch vụ từ xa cho các nhiệm vụ nó có thể xử lý độc lập cuối cùng sẽ trở nên lãng phí.
Định vị cho Thị trường ngày mai
AMD không chỉ cạnh tranh với Nvidia trong trung tâm dữ liệu nữa. Công ty đang chuẩn bị cho một mô hình tính toán nơi xử lý thông minh diễn ra gần hơn với người dùng, nơi các thiết bị cá nhân trở thành các nền tảng AI khả thi, và nơi vai trò quan trọng của nó trong quá trình chuyển đổi này ngày càng rõ ràng.
Ryzen AI Halo ngày nay là ngách. Các bộ xử lý AI cục bộ mạnh mẽ của ngày mai sẽ không phải vậy. AMD đang xây dựng nền tảng ngay bây giờ để khi sự chuyển đổi đó đến, họ có thể nắm bắt giá trị trên nhiều tầng của hệ sinh thái AI đang phát triển.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
AMD's Ryzen AI Halo: Tại sao xử lý AI cục bộ sắp làm thay đổi ngành công nghiệp
Chuyển đổi từ Điện toán Đám mây sang Điện toán Cạnh
AI suy luận dựa trên đám mây đã trở nên quá đắt đỏ. Mặc dù chi phí token giảm mạnh—dữ liệu của Stanford cho thấy các mô hình tương đương GPT-3.5 đã giảm giá 280 lần trong hai năm—các doanh nghiệp vẫn phải đối mặt với chi tiêu ngày càng tăng cho các tác vụ AI. Vấn đề trở nên trầm trọng hơn khi xử lý các mô hình lý luận nâng cao và các tác nhân AI, đòi hỏi nhiều token hơn nhiều so với các nhiệm vụ suy luận đơn giản.
Điều này tạo ra một cơ hội. Khi các mô hình AI trở nên hiệu quả hơn và phần cứng được cải thiện, việc xử lý một số tác vụ tại chỗ trên các thiết bị cá nhân bắt đầu có ý nghĩa kinh tế. Một khung công tác do Deloitte đề xuất xác định ba kịch bản triển khai riêng biệt: các nhà cung cấp đám mây hyperscaler xử lý các tác vụ phức tạp, thử nghiệm yêu cầu các mô hình hàng đầu; hạ tầng tại chỗ phục vụ các tác vụ dự đoán, nhạy cảm nơi độ trễ quan trọng; và các thiết bị cạnh, bao gồm máy tính cá nhân, xử lý các nhiệm vụ thời gian thực với các mô hình nhỏ hơn.
Thông tin quan trọng? Chúng ta đang bước vào kỷ nguyên mà xử lý AI phân tán trở nên không thể tránh khỏi.
Phản hồi của AMD: Nền tảng Ryzen AI Halo
Tại CES, AMD giới thiệu một sản phẩm xứng đáng nhận nhiều sự chú ý hơn các GPU MI440X gây chú ý: đó là Ryzen AI Halo. Ra mắt vào Quý 2, chiếc mini-PC này thể hiện vị trí quan trọng của nó trong chu kỳ tính toán tiếp theo.
Các thông số kỹ thuật kể câu chuyện:
Sản phẩm này không nhắm vào người tiêu dùng phổ thông. Đây là nền tảng dành cho các nhà phát triển xây dựng ứng dụng AI tại chỗ. Kho bộ nhớ 128GB cho phép chạy các mô hình AI mã nguồn mở lớn—nghĩ đến các mô hình có hàng tỷ tham số—trực tiếp trên thiết bị. Mặc dù chúng không cạnh tranh với các mô hình tiên phong của OpenAI hay Anthropic, nhưng đủ mạnh để xử lý các nhiệm vụ phức tạp trong thực tế.
Tại sao Sản phẩm này Quan trọng đối với Tương lai của AMD
Ryzen AI Halo có thể sẽ không đạt doanh số bán hàng đột phá. Nó đắt đỏ, chuyên biệt và theo nghĩa đen là ngách. Tuy nhiên, nó báo hiệu điều gì đó sâu sắc về tư duy chiến lược của AMD.
Dòng sản phẩm PC AI rộng hơn của công ty đã có khả năng đáng kể. Ryzen AI 400 series cung cấp 60 TOPS và bắt đầu được bán ra trong tháng này, trong khi các bộ xử lý Ryzen AI Max+ trong Halo hỗ trợ đầy đủ cấu hình bộ nhớ 128GB và có thể thực thi các mô hình với 128 tỷ tham số.
Các PC AI ngày nay gặp nhiều hạn chế đáng kể. Công suất xử lý vẫn chưa đủ, bộ nhớ có sẵn quá hạn chế, và các thách thức về cung cấp bộ nhớ vẫn tồn tại. Nhưng đây chỉ là ma sát tạm thời, không phải giới hạn vĩnh viễn.
Sự hội tụ không thể tránh khỏi
Hãy xem xét các trợ lý mã như Claude Code, đã biến đổi quy trình lập trình. Một mô hình AI dựa trên laptop với độ tinh vi tương đương còn xa bao nhiêu? Ba năm? Bốn năm? Quỹ đạo này chỉ theo một hướng.
Chạy suy luận AI tại chỗ loại bỏ chi phí API đám mây liên tục, duy trì quyền riêng tư dữ liệu trên thiết bị, và giảm độ trễ xuống gần bằng không. Những lợi thế này tích tụ lại. Đồng thời, việc yêu cầu thiết bị truy vấn các dịch vụ từ xa cho các nhiệm vụ nó có thể xử lý độc lập cuối cùng sẽ trở nên lãng phí.
Định vị cho Thị trường ngày mai
AMD không chỉ cạnh tranh với Nvidia trong trung tâm dữ liệu nữa. Công ty đang chuẩn bị cho một mô hình tính toán nơi xử lý thông minh diễn ra gần hơn với người dùng, nơi các thiết bị cá nhân trở thành các nền tảng AI khả thi, và nơi vai trò quan trọng của nó trong quá trình chuyển đổi này ngày càng rõ ràng.
Ryzen AI Halo ngày nay là ngách. Các bộ xử lý AI cục bộ mạnh mẽ của ngày mai sẽ không phải vậy. AMD đang xây dựng nền tảng ngay bây giờ để khi sự chuyển đổi đó đến, họ có thể nắm bắt giá trị trên nhiều tầng của hệ sinh thái AI đang phát triển.