Kết quả tìm kiếm cho "CLOUD"

DeepSeek V4 Pro trên Ollama Cloud: Claude Code kết nối một lần

Theo tweet của Ollama, DeepSeek V4 Pro được ra mắt vào 4/24, đã được tích hợp theo chế độ đám mây vào thư mục Ollama, chỉ với một lệnh duy nhất là có thể gọi các công cụ như Claude Code, Hermes, OpenClaw, OpenCode, Codex, v.v. V4 Pro có bộ tham số 1.6T, 1M context, Mixture-of-Experts; suy luận trên đám mây không tải trọng số về máy cục bộ. Nếu muốn chạy cục bộ thì cần tự tải trọng số và thực thi bằng INT4/GGUF với nhiều GPU. Tốc độ đo thử giai đoạn đầu bị ảnh hưởng bởi tải trọng của đám mây, thông thường khoảng 30 tok/s, đỉnh đạt 1.1 tok/s; khuyến nghị sử dụng nguyên mẫu trên đám mây, rồi khi sản xuất chính thức thì tự suy luận hoặc dùng API thương mại.
ChainNewsAbmedia·20giờ trước

DeepSeek V4-Flash lên Ollama Cloud, máy chủ Mỹ: Claude Code, OpenClaw tích hợp một lần

Ollama Cloud đã niêm yết DeepSeek V4-Flash, suy luận trên máy chủ tại Mỹ, cung cấp ba bộ lệnh một lần để kết nối Claude Code, OpenClaw, Hermes. V4-Flash/V4-Pro sử dụng kiến trúc MoE, hỗ trợ nguyên sinh ngữ cảnh 1M, và giảm chi phí bằng nén theo Token-wise + chú ý thưa DSA; trong bối cảnh 1M, FLOPs cho mỗi token giảm 27%, bộ nhớ đệm KV giảm 10%. API tương thích với OpenAI ChatCompletions và Anthropic, giúp chuyển đổi dễ dàng giữa nhiều quy trình làm việc, đồng thời giảm chi phí và rủi ro về chủ quyền dữ liệu.
ChainNewsAbmedia·04-24 10:45

CEO Google: Đầu tư vốn năm 2026 đạt 1850 tỷ, tăng mạnh đầu tư cho thời đại tác nhân AI

Giám đốc điều hành Google Sundar Pichai đã công bố tại sự kiện Google Cloud Next ở Las Vegas vào ngày 22 tháng 4 rằng Google dự kiến đầu tư từ 175 đến 185 tỷ USD chi tiêu vốn vào năm 2026 để xây dựng cơ sở hạ tầng cần thiết cho các tác nhân AI (AI Agent) tự chủ, tăng so với 31 tỷ USD vào năm 2022.
MarketWhisper·04-23 06:19
news-image

Google Cloud Next 2026: Ra mắt Nền tảng đại lý doanh nghiệp Gemini, 750 triệu USD hỗ trợ các công ty tư vấn triển khai

Google Cloud tại Cloud Next 2026 đã công bố Nền tảng tác nhân doanh nghiệp Gemini Enterprise Agent Platform, tích hợp lựa chọn mô hình, xây dựng tác nhân, DevOps, điều phối và kiểm soát an ninh cho doanh nghiệp, đồng thời ra mắt quỹ 750 triệu USD để hỗ trợ McKinsey, Accenture, Deloitte triển khai các tác nhân doanh nghiệp. Nền tảng kết hợp Ironwood TPU, A2A và MCP, xây dựng hệ sinh thái toàn ngăn của riêng mình cùng kênh dành cho tư vấn, nhằm đối đầu với OpenAI Operator và phiên bản doanh nghiệp của Anthropic Claude.
ChainNewsAbmedia·04-23 02:54

Google mở rộng Wiz Cloud Security trên AWS, Azure và Google Cloud

Google đã công bố các tính năng bảo mật mới và mức độ tích hợp sâu hơn của Wiz, công ty bảo mật đám mây của Israel mà họ đã mua lại với giá US$32 billion, trên Google Cloud và các nền tảng đối thủ tại sự kiện Cloud Next '26. Công ty đã giới thiệu ba tác nhân AI cho Hoạt động An ninh ở chế độ xem trước, được thiết kế cho
CryptoFrontier·04-23 02:44

Huang Jen-hsun: Nvidia và TSMC chưa bao giờ ký hợp đồng, lập trình CUDA phổ dụng là nền tảng GPU lớn nhất

Giám đốc điều hành Nvidia Huang Renxun nhấn mạnh trong cuộc phỏng vấn rằng chìa khóa thành công của TSMC nằm ở văn hóa doanh nghiệp về chất lượng và tin tưởng, chứ không chỉ là quy trình sản xuất tiên tiến. Trong ba mươi năm hợp tác giữa Nvidia và TSMC, họ không ký hợp đồng mà dựa trên sự tin tưởng. Huang Renxun chỉ ra rằng cơ số cài đặt GPU CUDA là chiếc hố sâu nhất của Nvidia, cùng với khả năng tích hợp theo chiều dọc của họ trong các ngành công nghiệp khác nhau, sẽ tiếp tục củng cố vị trí thị trường.
ChainNewsAbmedia·03-25 02:14

Google Cloud Giới Thiệu Năm Mô Hình Thiết Kế: Xây Dựng Kỹ Năng AI Agent Độ Tin Cậy Cao, Tạm Biệt Thời Đại Prompt Hack

Khi các ứng dụng AI Agent phát triển, các nhà phát triển đang chuyển từ kỹ thuật prompt sang thiết kế có cấu trúc. Google Cloud Tech công bố năm mẫu thiết kế, nâng cao độ tin cậy và khả năng tái sử dụng của kỹ năng AI Agent, đánh dấu giai đoạn mới của kỹ thuật hóa. SKILL.md trở thành tiêu chuẩn, hỗ trợ thiết kế mô-đun hóa, và cung cấp năm mẫu thiết kế để tăng cường hiệu quả phát triển và độ chính xác.
ChainNewsAbmedia·03-18 08:54

WSJ: ByteDance vượt qua lệnh cấm, triển khai 36.000 chip Blackwell tiên tiến nhất tại Malaysia

ByteDance thiết lập cơ sở hạ tầng AI quy mô lớn tại Malaysia, với kế hoạch triển khai khoảng 500 hệ thống tính toán Nvidia Blackwell, với tổng chi phí vượt quá 2,5 tỷ USD, nhằm hỗ trợ mở rộng hoạt động AI toàn cầu. Biện pháp này giúp vượt qua các hạn chế xuất khẩu chip của Mỹ đối với Trung Quốc và tăng cường khả năng cạnh tranh toàn cầu trong lĩnh vực AI.
ChainNewsAbmedia·03-13 09:14

NVIDIA và Nebius liên minh, đầu tư 20 tỷ đô la để triển khai hạ tầng trí tuệ nhân tạo toàn diện

NVIDIA và Nebius đã đạt được liên minh chiến lược, dự định cùng phát triển hạ tầng đám mây trí tuệ nhân tạo toàn diện và đầu tư 2 tỷ USD để đáp ứng nhu cầu GPU ngày càng tăng. Sự hợp tác này không chỉ mở rộng kênh kinh doanh của NVIDIA mà còn nâng cao tính linh hoạt của hạ tầng đám mây, đặc biệt là tối ưu hóa cho các tải trọng công việc trí tuệ nhân tạo. Nỗ lực này nhằm giảm sự phụ thuộc vào các nhà cung cấp dịch vụ đám mây lớn và nâng cao khả năng cạnh tranh trên thị trường.
ChainNewsAbmedia·03-12 03:38