Thứ 6, ngày 16 tháng 8, 2019, 8:36:21 Chiều

Anthropic: Chỉ lượng tài liệu nhỏ cũng đủ 'đầu độc' mô hình AI khổng lồ

Admin

12:30 13/10/2025

Nghiên cứu mới của công ty phát triển chatbot Claude cho thấy ngay cả mô hình ngôn ngữ lớn hàng chục tỉ tham số cũng có thể bị 'đầu độc' chỉ với lượng dữ liệu cực nhỏ.

Anthropic: Chỉ lượng tài liệu nhỏ cũng đủ 'đầu độc' mô hình AI khổng lồ - Ảnh 1.

Công ty trí tuệ nhân tạo Anthropic, đơn vị phát triển chatbot Claude, vừa công bố nghiên cứu cho thấy việc "đầu độc" mô hình ngôn ngữ lớn (LLM), tức cài dữ liệu độc hại để làm sai lệch phản hồi của Lừa đảo việc làm ở Mỹ tăng hơn 1.000%, AI giăng 'bẫy tuyển dụng' tinh vi chưa từng có

Tuy nhiên Anthropic khẳng định cả mô hình 13 tỉ tham số - được huấn luyện trên lượng dữ liệu gấp hơn 20 lần - và mô hình 600 triệu tham số đều có thể bị xâm nhập chỉ với cùng số lượng nhỏ tài liệu bị "đầu độc".

"Phát hiện này thách thức giả định rằng kẻ tấn công phải kiểm soát một tỉ lệ dữ liệu huấn luyện nhất định. Thực tế họ có thể chỉ cần một lượng cố định rất nhỏ", Anthropic nhấn mạnh.

Công ty cảnh báo những lỗ hổng này có thể gây rủi ro nghiêm trọng cho an ninh của các hệ thống AI và đe dọa ứng dụng công nghệ trong các lĩnh vực nhạy cảm.

Nguy cơ chatbot AI bị lợi dụng phát tán thông tin sức khỏe sai lệch

Các chatbot AI phổ biến có thể được lập trình để trả lời sai lệch các câu hỏi về sức khỏe với giọng điệu thuyết phục, thậm chí kèm theo trích dẫn giả từ những tạp chí y khoa uy tín.

Theo congnghe.tuoitre.vn Copy link

Link bài gốc Copy link https://congnghe.tuoitre.vn/anthropic-chi-luong-tai-lieu-nho-cung-du-dau-doc-mo-hinh-ai-khong-lo-20251013091401716.htm

Bình luận

Cùng chủ đề

Xe & Công Nghệ

Sếp Viettel vào top 100 phụ nữ quyền lực nhất châu Á

Theo bảng xếp hạng Most Powerful Women Asia 2025 vừa được tạp chí Fortune công bố, bà Nguyễn Thị Hoa...

Xe & Công Nghệ

Kỹ sư công nghệ thông tin thuần túy sắp hết thời

Thị trường gia công phần mềm đang có sự cạnh tranh từ lực lượng nhân sự công nghệ cao giá...

Xe & Công Nghệ

Nghiên cứu phát hiện thuật toán TikTok 'dẫn lối' trẻ em đến video người lớn

Nghiên cứu của Global Witness cho thấy dù bật chế độ hạn chế, tài khoản 13 tuổi vẫn bị TikTok...

Mới cập nhật

Gia hạn việc tạm đình chỉ hiệu trưởng tại Đà Lạt liên quan vụ 'thực phẩm bẩn'

UBND phường Xuân Hương - Đà Lạt gia hạn quyết định tạm đình chỉ với Hiệu trưởng Trường tiểu học Trưng Vương, để tiếp tục xác minh nghi vấn thực phẩm bẩn ảnh hưởng 720 học sinh.

1 giờ trước Giáo dục

The Pearl: Phân khu biệt thự tại Waterpoint Tây Ninh

Click vào để biết vị trí, tiện ích, quy hoạch... của dự án Chọn bán kính 200 m 500 m 1 km 2...

1 giờ trước Địa ốc

FIATA World Congress 2025: “Tấm hộ chiếu” cho doanh nghiệp Việt trong kỷ nguyên hội nhập

Chia sẻ với phóng viên, ông Đào Trọng Khoa, Chủ tịch Hiệp hội Doanh nghiệp dịch vụ Logistics Việt Nam (VLA), Trưởng Ban tổ chức FIATA World Congress 2025 nhấn mạnh, Việt Nam đã tạo nên một kỳ Đại hội lịch sử của 99 năm thành lập Liên đoàn và một dấu mốc lịch sử khẳng định vị thế Việt trên bản đồ logistics Thế giới.

1 giờ trước Kinh Tế

Thủ tướng đồng ý phương án nghỉ Tết Bính Ngọ 9 ngày

Kỳ nghỉ Tết Bính Ngọ kéo dài 9 ngày liên tục, gồm 5 ngày nghỉ Tết theo quy định của Bộ luật Lao động và 4 ngày nghỉ cuối tuần.

1 giờ trước Kinh Tế

Đóng điện thành công dự án chào mừng thành công Đại hội Đảng bộ Chính phủ lần thứ I

Lúc 20h30 phút ngày 13/10, Tổng công ty Truyền tải điện quốc gia (EVNNPT), Ban QLDA các công trình điện miền Bắc (NPMB) phối hợp với các đơn vị liên quan đóng điện thành công Dự án trạm biến áp 220kV Gia Lộc và đường dây đấu nối.

1 giờ trước Kinh Tế

Chứng khoán VPS chốt giá chào bán IPO tối thiểu 60.000 đồng/cổ phiếu

VPS đặt mức định giá gần 3,4 tỷ USD trong đợt IPO, dự kiến huy động hơn 12.000 tỷ đồng để mở rộng vốn, đầu tư công nghệ và củng cố vị thế dẫn đầu thị trường.

1 giờ trước Tài chính

Bộ Tài chính đề xuất dành 0,1% thuế VAT thưởng cho người tiêu dùng

Bộ Tài chính đề xuất trích 0,1% số thuế VAT thu được để triển khai chương trình “hóa đơn may mắn” và khuyến khích tố giác hành vi vi phạm về hóa đơn.

1 giờ trước Tài chính

Bị khởi tố, Ngân 98: 'Em quá tin tưởng vào nhà máy sản xuất sản phẩm giảm cân'

Sau khi bị khởi tố, bắt tạm giam, Ngân 98 gửi lời xin lỗi đến những người mua hàng của mình vì "quá tin tưởng vào nhà máy mà không kiểm tra lại".

1 giờ trước Sức khỏe

Trực thăng hạ cánh trên nóc bệnh viện có 2 bãi đáp đầu tiên ở Việt Nam

Trực thăng đáp xuống bãi đáp thứ 2 của Bệnh viện Quân y 175 (Bộ Quốc phòng), bệnh viện đầu tiên trên cả nước có hai bãi đáp trực thăng hiện đại, phục vụ công tác cấp cứu.

1 giờ trước Sức khỏe