Lỗ Hổng Zero-Day: Nguy Hiểm Từ AI Anthropic Bị Lộ

Lỗ Hổng Zero-Day: Nguy Hiểm Từ AI Anthropic Bị Lộ

Một phiên bản mô hình Anthropic thế hệ tiếp theo đã xuất hiện trong các kênh thử nghiệm hạn chế. Tuy nhiên, việc phân phối sớm đã bị lộ thông tin trước khi quá trình đánh giá chính thức bắt đầu, làm dấy lên những lo ngại nghiêm trọng về rủi ro bảo mật của các mô hình trí tuệ nhân tạo tiên tiến.

Mô Hình Claude Oceanus-v1-p Bị Lộ Và Rao Bán

Các tham chiếu đến claude-oceanus-v1-p bắt đầu lan truyền trong giới nghiên cứu vào ngày 3 tháng 6 năm 2026. Điều này xảy ra sau khi mã định danh của mô hình xuất hiện bên trong Anthropic’s Claude Console và được phát hiện thông qua các dịch vụ proxy API trái phép.

Những phát hiện này ngay lập tức làm dấy lên suy đoán rằng Anthropic đang tiến tới việc triển khai rộng rãi phiên bản kế nhiệm của dòng Claude Mythos. Các nhà đánh giá red team đã báo cáo quyền truy cập vào mô hình mới bắt đầu từ cùng ngày.

Cuộc đánh giá có kiểm soát diễn ra rất ngắn ngủi. Chỉ trong vài giờ sau khi mô hình tiếp cận các nhóm red team được xác thực, các báo cáo đã xuất hiện về việc một tác nhân không xác định đã bán lại quyền truy cập API vào claude-oceanus-v1-p.

Kênh Rao Bán API Trái Phép

Dịch vụ proxy được sử dụng để rao bán API này có trụ sở tại Trung Quốc, với mức giá cao cấp là $16 cho mỗi triệu token đầu vào. Con số này cao hơn đáng kể so với các mức giá doanh nghiệp tiêu chuẩn của Anthropic.

Một tài khoản đã đăng tải thông tin:

I found another API that offers claude-oceanus-v1-p

the pricing and tps make a lot more sense to me

Mythos pricing might end up at:
$16 Input, $80 Output https://t.co/F00ovYeDhh pic.twitter.com/qYiCDVTTjo

Việc rò rỉ và rao bán này nêu bật vấn đề kiểm soát quyền truy cập đối với các mô hình AI nhạy cảm. Nó tạo ra một tiền lệ nguy hiểm cho việc khai thác thương mại trái phép các công nghệ tiên tiến.

Lịch Sử Lạm Dụng API Của Anthropic

Lịch sử của Anthropic về việc lạm dụng proxy trái phép đã được ghi nhận rõ ràng. Đầu năm 2026, công ty này đã cáo buộc các phòng thí nghiệm AI của Trung Quốc, bao gồm DeepSeek, Moonshot AI, và MiniMax, sử dụng khoảng 24.000 tài khoản giả mạo.

Các tài khoản này đã thực hiện hơn 16 triệu tương tác với các mô hình Claude thông qua các kênh proxy. Đây là một ví dụ rõ ràng về các thách thức trong việc bảo vệ sở hữu trí tuệ và kiểm soát việc sử dụng công nghệ AI.

Để ứng phó với sự cố bán lại Oceanus, Anthropic đã tạm dừng quyền truy cập mô hình cho toàn bộ nhóm red team, trong khi chờ đợi một cuộc điều tra nội bộ. Quyết định này cho thấy mức độ nghiêm trọng của vi phạm và cam kết của công ty trong việc duy trì tính toàn vẹn của các chương trình thử nghiệm.

Khả Năng Phát Hiện Lỗ Hổng Zero-day Của Claude Mythos

Claude Oceanus-v1-p được cho là xây dựng trực tiếp trên nền tảng của Claude Mythos Preview, ra mắt vào tháng 4 năm 2026. Mô hình này đã chứng minh một khả năng đáng báo động đối với cộng đồng an ninh mạng, đặc biệt là trong việc **phát hiện xâm nhập** và các điểm yếu hệ thống.

Mythos Preview, hoạt động dưới chương trình nghiên cứu hạn chế của Anthropic, đã được nhóm Frontier Red Team của công ty đánh giá là có khả năng xác định và khai thác các lỗ hổng zero-day trên mọi hệ điều hành chính và trình duyệt web.

Hiệu Suất Vượt Trội Trong Phát Hiện Lỗ Hổng

Các đối tác Glasswing đã cùng nhau phát hiện hơn 10.000 lỗ hổng có mức độ nghiêm trọng cao hoặc nghiêm trọng tới rất nghiêm trọng kể từ khi chương trình bắt đầu. Điều này khẳng định sức mạnh chưa từng có của AI trong việc nhận diện các điểm yếu bảo mật tiềm ẩn.

Viện Turing cũng lưu ý rằng nhóm red team của Mythos đã tìm thấy các lỗ hổng zero-day với tỷ lệ phục hồi vượt quá 99% trong các trường hợp thử nghiệm được tiết lộ. Khả năng này đặt ra một tiêu chuẩn mới cho các công cụ phân tích và kiểm thử bảo mật tự động.

Sự xuất hiện của các công cụ AI có khả năng tự động tìm kiếm các lỗ hổng zero-day mang lại cả cơ hội và thách thức lớn. Nó có thể cách mạng hóa quy trình phát hiện xâm nhập và phòng thủ, nhưng cũng tiềm ẩn **rủi ro bảo mật** nếu bị lạm dụng.

Mở Rộng Project GlasswingRủi Ro Bảo Mật

Việc đánh giá red team đối với Oceanus diễn ra ngay sau khi Anthropic mở rộng Project Glasswing vào ngày 2 tháng 6. Đây là sáng kiến phòng thủ không gian mạng bằng AI được hạn chế của họ, mở rộng tới khoảng 150 tổ chức mới trải rộng trên hơn 15 quốc gia.

Các quốc gia tham gia bao gồm Ấn Độ, Pháp, Đức, Hàn Quốc và Úc. Điều này thể hiện sự mở rộng đáng kể về phạm vi và quy mô ảnh hưởng của chương trình.

Nhóm mở rộng này hiện bao gồm các lĩnh vực cơ sở hạ tầng quan trọng như điện, nước, y tế và truyền thông. Các lĩnh vực này không phải là một phần của chương trình khi nó mới ra mắt, vốn chỉ tập trung vào các công ty công nghệ lớn.

Anthropic đã tuyên bố rằng một cuộc tấn công mạng thành công vào hầu hết các tổ chức đối tác mới có thể ảnh hưởng đến hơn 100 triệu người. Điều này nhấn mạnh tầm quan trọng của việc bảo vệ các hệ thống cơ sở hạ tầng thiết yếu khỏi các lỗ hổng zero-day và các mối đe dọa khác.

Liên kết ngoài về chương trình Claude Mythos và khả năng phát hiện zero-day của nó có thể được tìm thấy tại: CybersecurityNews.com và các thông tin chi tiết về các lỗ hổng có thể được tham khảo tại NIST National Vulnerability Database (NVD).

Quan Điểm Của Anthropic Về Việc Công Bố Rộng Rãi

Anthropic đã thẳng thắn tuyên bố rằng các khả năng ở cấp độ Mythos, và do đó cả Oceanus-v1-p, sẽ không được phép phát hành rộng rãi ra công chúng cho đến khi công ty phát triển các biện pháp bảo vệ “cực kỳ mạnh mẽ để ngăn chặn lạm dụng”.

Họ thừa nhận rằng các biện pháp bảo vệ như vậy hiện chưa tồn tại trong ngành. Tuyên bố này cho thấy nhận thức sâu sắc về rủi ro bảo mật tiềm tàng của việc giải phóng một công nghệ mạnh mẽ như vậy mà không có các kiểm soát chặt chẽ.

Việc quản lý và kiểm soát quyền truy cập vào các mô hình AI có khả năng tìm kiếm **lỗ hổng zero-day** đòi hỏi sự cân nhắc kỹ lưỡng từ các nhà phát triển và cộng đồng an ninh mạng. Đây là một vấn đề cấp bách để đảm bảo rằng công nghệ này được sử dụng một cách có trách nhiệm.