Nguy hiểm: Alibaba bị cáo buộc tấn công chưng cất AI quy mô lớn

Nguy hiểm: Alibaba bị cáo buộc tấn công chưng cất AI quy mô lớn

Anthropic chính thức cáo buộc tập đoàn công nghệ và thương mại điện tử khổng lồ của Trung Quốc là Alibaba đứng sau một chiến dịch trích xuất dữ liệu quy mô lớn, trái phép nhắm vào mô hình AI Claude của họ. Đây được mô tả là cuộc tấn công chưng cất (distillation attack) lớn nhất từng được ghi nhận.

Chiến dịch Trích xuất Dữ liệu Quy mô Lớn

Trong một bức thư đề ngày 10 tháng 6 năm 2026, gửi tới Chủ tịch Ủy ban Ngân hàng Thượng viện Hoa Kỳ Tim Scott và Thành viên Cao cấp Elizabeth Warren, Anthropic cáo buộc các nhà điều hành liên kết với Alibaba và bộ phận nghiên cứu AI của Alibaba, Alibaba Qwen, đã tiến hành một chiến dịch phối hợp nhằm thu hoạch bất hợp pháp các khả năng từ mô hình AI Claude.

Chiến dịch này diễn ra từ ngày 22 tháng 4 đến ngày 5 tháng 6 năm 2026, tạo ra hơn 28.8 triệu lượt trao đổi với Claude thông qua gần 25.000 tài khoản giả mạo. Mục tiêu của hoạt động này là nhắm vào các khả năng tiên tiến và có giá trị thương mại cao nhất của Claude, bao gồm kỹ thuật phần mềm và lý luận tác tử (agentic reasoning), những trụ cột của mô hình Mythos Preview tiên phong của Anthropic.

Kỹ thuật Chưng cất Đối nghịch (Adversarial Distillation)

Cuộc tấn công dựa trên một kỹ thuật gọi là “chưng cất đối nghịch”. Đây là phương pháp huấn luyện một mô hình AI có năng lực thấp hơn dựa trên kết quả đầu ra của một mô hình mạnh mẽ hơn để bắt chước khả năng của nó với chi phí phát triển thấp hơn nhiều. Anthropic cảnh báo rằng quy trình này cho phép các phòng thí nghiệm AI của Trung Quốc sao chép các khả năng AI tiên phong của Hoa Kỳ mà không phải chịu chi phí nghiên cứu và phát triển (R&D) cùng chi phí tính toán khổng lồ cần thiết để huấn luyện mô hình từ đầu.

Trong thư của mình, Anthropic viết: “Các cuộc tấn công chưng cất này được thực hiện bất hợp pháp, một cách có hệ thống và ở quy mô công nghiệp để thu hoạch các khả năng AI của Hoa Kỳ từ các phòng thí nghiệm tiên phong và đóng gói lại như của riêng họ mà không phải chịu chi phí huấn luyện và R&D cần thiết để huấn luyện các mô hình tiên phong của Hoa Kỳ”.

Anthropic cũng cảnh báo rằng các hệ thống AI được xây dựng thông qua phương pháp chưng cất đối nghịch này thường thiếu các biện pháp bảo vệ an toàn, gây ra các rủi ro bảo mật và an toàn rộng lớn hơn ngoài việc đánh cắp sở hữu trí tuệ. Để tìm hiểu thêm về việc phát hiện và ngăn chặn các cuộc tấn công chưng cất, bạn có thể tham khảo tại đây.

Các Vụ Tấn công Tương tự và Phản ứng Chính sách

Đây không phải là một sự cố đơn lẻ. Vào tháng 2 năm 2026, Anthropic đã tiết lộ một âm mưu riêng liên quan đến DeepSeek, một startup AI của Trung Quốc cùng với hai phòng thí nghiệm AI khác của Trung Quốc đã cố gắng truy cập trái phép vào nền tảng Claude.

Đầu tháng này, công ty đã thông báo họ nhận được chỉ thị từ chính quyền yêu cầu dừng cho phép bất kỳ ai bên ngoài Hoa Kỳ, bao gồm cả nhân viên không phải công dân Hoa Kỳ, truy cập vào các mô hình mới nhất của họ là Claude, đặc biệt là Fable 5 và Mythos 5. Chi tiết về lệnh cấm truy cập có thể xem tại đây.

Anthropic hiện mô tả mô hình này là sự “khai thác có hệ thống và trái phép” các mô hình AI hàng đầu của Hoa Kỳ để xây dựng một thế hệ chatbot cạnh tranh của Trung Quốc. Thông tin này đã thúc đẩy hành động lập pháp tại Đồi Capitol.

Hành động Lập pháp Tiềm năng

Các Thượng nghị sĩ Bill Hagerty (R-TN) và Andy Kim (D-NJ) đang đề xuất một sửa đổi đối với dự luật quốc phòng bắt buộc, nhằm đưa vào danh sách đen hoặc áp đặt lệnh trừng phạt đối với bất kỳ công ty Trung Quốc nào bị phát hiện truy cập trái phép vào kết quả đầu ra của mô hình AI Hoa Kỳ để huấn luyện các hệ thống cạnh tranh.

Alibaba chưa đưa ra phản hồi nào cho các yêu cầu bình luận. Sự đối đầu ngày càng tăng về việc trộm cắp mô hình AI báo hiệu sự rạn nứt công nghệ và địa chính trị ngày càng sâu sắc giữa các ngành công nghiệp AI của Hoa Kỳ và Trung Quốc. An ninh mô hình tiên phong hiện đang nằm trong tầm ngắm của chính sách an ninh quốc gia. Việc bảo vệ tài sản trí tuệ AI trở nên cấp thiết hơn bao giờ hết trong bối cảnh các mối đe dọa mạng ngày càng tinh vi.