Vẫn còn mua trung tâm chuyển đổi AI trên Taobao? Người tiết lộ mã nguồn Claude Code: Ít nhất hàng chục người bị đầu độc

robot
Đang tạo bản tóm tắt

Báo cáo mới nhất về nhà tố cáo rò rỉ mã nguồn Claude Code tiết lộ rằng trung gian AI thương mại tiềm ẩn rủi ro an ninh mạng. Thử nghiệm thực tế cho thấy một số trung gian sẽ đánh cắp chứng thực, khoá ví hoặc chèn mã độc, trở thành điểm tấn công chuỗi cung ứng.

Nhà tố cáo rò rỉ mã nguồn Claude Code, tiết lộ rủi ro an ninh của trung gian AI

Gần đây có một bài nghiên cứu mang tên 《Người đại diện của bạn là của tôi》 (Your Agent Is Mine) được công bố, trong đó một trong những tác giả là người đầu tiên tiết lộ vụ rò rỉ mã nguồn Claude Code, Chaofan Shou.

Bài báo lần đầu tiên nghiên cứu hệ thống các mối đe dọa an ninh đối với bộ định tuyến API của mô hình ngôn ngữ lớn (LLM), còn gọi là trung gian, và tiết lộ rằng các trung gian này có thể trở thành điểm tấn công chuỗi cung ứng.

Trung gian AI là gì?

Vì việc gọi LLM tiêu tốn nhiều token, tạo ra chi phí tính toán cao, trung gian AI có thể sử dụng bộ nhớ đệm để lặp lại các câu hỏi và bối cảnh, giúp khách hàng tiết kiệm đáng kể chi phí.

Đồng thời, trung gian còn có chức năng phân phối mô hình tự động, có thể dựa trên độ khó của câu hỏi của người dùng để động thái chuyển đổi giữa các mô hình có tiêu chuẩn tính phí và hiệu năng khác nhau, và tự động chuyển sang mô hình dự phòng khi máy chủ mô hình chính gặp sự cố, đảm bảo dịch vụ luôn ổn định.

Trung gian đặc biệt phổ biến ở Trung Quốc, vì quốc gia này không thể trực tiếp sử dụng các sản phẩm AI nước ngoài nhất định, cộng thêm nhu cầu địa phương hoá tính phí của doanh nghiệp, do đó trung gian trở thành cầu nối quan trọng giữa mô hình phía trên và nhà phát triển phía dưới. Các nền tảng như OpenRouter và SiliconFlow đều thuộc loại dịch vụ này.

Tuy nhiên, trung gian tưởng chừng giảm chi phí và rào cản kỹ thuật lại ẩn chứa rủi ro an ninh cực lớn.

Nguồn hình: Nghiên cứu tiết lộ rủi ro tấn công chuỗi cung ứng trung gian AI

Trung gian AI có quyền truy cập hoàn toàn, trở thành lỗ hổng tấn công chuỗi cung ứng

Bài báo chỉ rõ, trung gian hoạt động ở tầng ứng dụng của kiến trúc mạng, có quyền đọc toàn bộ dữ liệu tải JSON trong quá trình truyền tải.

Vì khách hàng và nhà cung cấp mô hình phía trên thiếu xác thực mã hoá toàn diện từ đầu đến cuối, trung gian có thể dễ dàng xem xét và chỉnh sửa API key, lệnh hệ thống và tham số gọi mô hình trong kết quả trả về.

Nhóm nghiên cứu chỉ ra rằng, từ tháng 3 năm 2026, bộ định tuyến mã nguồn mở nổi tiếng LiteLLM đã từng bị tấn công xung đột phụ thuộc, cho phép kẻ tấn công chèn mã độc vào pipeline xử lý yêu cầu, làm nổi bật tính dễ tổn thương của phần này.

  • **Báo cáo liên quan:**Tóm tắt vụ tấn công độc hại LiteLLM: Làm thế nào để kiểm tra ví mã hoá, khoá đám mây có bị xâm phạm?

Thử nghiệm thực tế cho thấy hàng chục trung gian AI có hành vi độc hại

Nhóm nghiên cứu đã mua 28 trung gian trả phí trên các nền tảng như Taobao, Xianyu và Shopify, và thu thập 400 trung gian miễn phí từ cộng đồng để thử nghiệm sâu, kết quả cho thấy có 1 trung gian trả phí và 8 trung gian miễn phí chủ động chèn mã độc.

Trong số các mẫu trung gian miễn phí, có 17 trung gian cố gắng sử dụng chứng thực AWS do nhóm nghiên cứu thiết lập, thậm chí có 1 trung gian trực tiếp đánh cắp tiền mã hoá trong ví Ethereum của nhóm.

Dữ liệu nghiên cứu còn cho thấy, chỉ cần trung gian tái sử dụng chứng thực bị rò rỉ từ phía trên hoặc dẫn lưu lượng truy cập đến các nút có bảo vệ yếu hơn, thì ngay cả trung gian ban đầu có vẻ bình thường cũng có thể bị kéo vào cùng một mặt trận tấn công.

Trong các thử nghiệm nhiễm độc, nhóm phát hiện rằng, các nút bị ảnh hưởng này đã xử lý hơn 2.1 tỷ token, và trong 440 cuộc hội thoại đã lộ ra 99 chứng thực thực, trong đó có 401 cuộc hội thoại đang hoạt động hoàn toàn tự chủ, cho phép kẻ tấn công dễ dàng chèn tải độc hại mà không cần điều kiện kích hoạt phức tạp.

Nguồn hình: Nghiên cứu thực nghiệm trên hơn 400 trung gian, phát hiện nhiều trung gian AI có hành vi độc hại

Bốn phương pháp tấn công chính bị phơi bày

Bài báo tổng hợp hành vi tấn công của trung gian độc hại thành hai loại chính và hai biến thể tự thích nghi để tránh detection.

  • Tấn công chèn tải: Sau khi mô hình phía trên trả về kết quả, trung gian âm thầm chỉnh sửa tham số gọi công cụ, ví dụ thay thế URL hợp pháp bằng máy chủ do kẻ tấn công kiểm soát, dẫn đến khách hàng chạy mã độc.
  • Tấn công rò rỉ bí mật: Trung gian qua việc quét thụ động lưu lượng truyền tải, chặn và đánh cắp API key, chứng thực AWS và khoá riêng Ethereum cùng các thông tin nhạy cảm khác.

Để tránh bị phát hiện theo cách thông thường, kẻ tấn công còn phát triển phương pháp chèn mục tiêu phụ thuộc, chỉnh sửa tên gói trong lệnh cài đặt phần mềm, thay thế gói hợp pháp bằng các gói độc hại cùng tên hoặc dễ gây nhầm lẫn đã đăng trên registry công khai, nhằm tạo backdoor chuỗi cung ứng lâu dài trong hệ thống mục tiêu.

Một phương pháp khác là giao hàng theo điều kiện, hành vi độc hại chỉ kích hoạt khi đáp ứng điều kiện nhất định, ví dụ như số lần yêu cầu vượt quá 50 lần, hoặc khi phát hiện hệ thống đang hoạt động hoàn toàn tự chủ (chế độ YOLO), nhằm tránh các kiểm tra an ninh hạn chế.

Ba biện pháp phòng ngừa khả thi

Đối mặt với tấn công chuỗi cung ứng đầu độc trung gian AI, bài báo đề xuất ba biện pháp phòng ngừa khả thi:

  • Thực thi chính sách kiểm soát đối với công cụ nguy cơ cao: Kiểm tra và chặn các tên miền hoặc lệnh cài đặt gói không được phép, cơ chế này có thể ngăn chặn phần lớn tấn công chèn tải với tỷ lệ sai sót chỉ 1%.
  • Hệ thống lọc bất thường phía phản hồi: Có thể xác định 89% mẫu tải độc hại với tỷ lệ sai sót 6.7%, hỗ trợ nhà phát triển trong việc kiểm tra thủ công.
  • Ghi nhật ký minh bạch bổ sung: Dù không thể ngăn chặn tấn công, cơ chế này lưu trữ các hash của yêu cầu và phản hồi, giúp truy vết và đánh giá thiệt hại khi xảy ra sự cố an ninh.

Kêu gọi nhà cung cấp mô hình phía trên xây dựng cơ chế xác thực mật mã

Dù các biện pháp phòng thủ phía khách hàng có thể giảm thiểu rủi ro phần nào trong giai đoạn này, nhưng không thể giải quyết triệt để lỗ hổng xác thực nguồn gốc. Chỉ cần hành vi chỉnh sửa của trung gian không kích hoạt cảnh báo bất thường của khách hàng, kẻ tấn công vẫn có thể dễ dàng thay đổi ý nghĩa thực thi của chương trình và gây hại.

Để đảm bảo an toàn toàn diện cho hệ sinh thái AI代理, cuối cùng cần dựa vào các nhà cung cấp mô hình phía trên hỗ trợ cơ chế xác thực mật mã trong phản hồi. Chỉ khi kết hợp kết quả mô hình với lệnh thực thi cuối cùng của khách hàng một cách mã hoá chặt chẽ, mới có thể đảm bảo tính toàn vẹn dữ liệu đầu cuối, phòng ngừa toàn diện rủi ro chuỗi cung ứng từ trung gian chỉnh sửa dữ liệu.

Đọc thêm:
OpenAI dùng Mixpanel gặp sự cố! Dẫn đến rò rỉ dữ liệu cá nhân của một số người dùng, cảnh báo lừa đảo qua email

Một lỗi sao chép dán, 50 triệu đô la biến mất! Tấn công đầu độc địa chỉ mã hoá, làm thế nào để phòng tránh

ETH0,01%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim