Tìm hiểu về tấn công AI Prompt Injection
Các cuộc tấn công AI Prompt Injection đầu độc đầu ra từ những công cụ AI mà bạn dựa vào, thay đổi và thao túng đầu ra của nó thành thứ gì đó có hại. Nhưng cuộc tấn công AI Prompt Injection hoạt động như thế nào và bạn có thể làm gì để tự bảo vệ mình như thế nào?
Các cuộc tấn công AI Prompt Injection tận dụng những lỗ hổng của mô hình Generative AI để thao túng đầu ra của chúng. Chúng có thể được bạn thực hiện hoặc được người dùng bên ngoài thực hiện thông qua một cuộc tấn công Prompt Injection gián tiếp. Các cuộc tấn công DAN (Do Anything Now) không gây ra bất kỳ rủi ro nào cho bạn, người dùng cuối, nhưng về mặt lý thuyết, những cuộc tấn công khác có khả năng đầu độc đầu ra mà bạn nhận được từ Generative AI.
Các cuộc tấn công Prompt Injection hoạt động như thế nào?
Các cuộc tấn công Prompt Injection hoạt động bằng cách cung cấp những hướng dẫn bổ sung cho AI mà không có sự đồng ý hoặc hiểu biết của người dùng. Tin tặc có thể thực hiện điều này theo một số cách, bao gồm tấn công DAN và tấn công Prompt Injection gián tiếp.
Tấn công DAN (Do Anything Now)
Các cuộc tấn công DAN (Do Anything Now) là một kiểu tấn công Prompt Injection nhanh chóng liên quan đến những mô hình Generative AI "jailbreak" như ChatGPT. Những cuộc tấn công jailbreak này không gây rủi ro cho bạn với tư cách là người dùng cuối - nhưng chúng mở rộng khả năng của AI, khiến nó trở thành công cụ để lạm dụng.
Ví dụ, nhà nghiên cứu bảo mật Alejandro Vidal đã sử dụng lời nhắc DAN để khiến GPT-4 của OpenAI tạo code Python cho keylogger. Được sử dụng với mục đích xấu, AI đã jailbreak làm giảm đáng kể các rào cản dựa trên kỹ năng liên quan đến tội phạm mạng và có thể cho phép những tin tặc mới thực hiện các cuộc tấn công tinh vi hơn.
Tấn công Training Data Poisoning
Các cuộc tấn công Training Data Poisoning chính xác không phải là tấn công Prompt Injection, nhưng chúng có những điểm tương đồng đáng chú ý về cách thức hoạt động và rủi ro mà chúng gây ra cho người dùng. Không giống như các cuộc tấn công Prompt Injection, những cuộc tấn công Training Data Poisoning là một loại tấn công đối nghịch trong Machine Learning, xảy ra khi tin tặc sửa đổi dữ liệu huấn luyện được sử dụng bởi mô hình AI. Kết quả tương tự cũng xảy ra: Đầu ra bị nhiễm độc và hành vi bị sửa đổi.
Những ứng dụng tiềm năng của các cuộc tấn công Training Data Poisoning thực tế là vô hạn. Ví dụ, về mặt lý thuyết, AI được sử dụng để lọc các nỗ lực lừa đảo từ nền tảng trò chuyện hoặc email có thể sửa đổi dữ liệu đào tạo của nó. Nếu tin tặc dạy cho AI moderator rằng một số loại hành vi lừa đảo nhất định có thể chấp nhận được thì chúng có thể gửi tin nhắn lừa đảo mà không bị phát hiện.
Các cuộc tấn công Training Data Poisoning không thể gây hại trực tiếp cho bạn nhưng có thể gây ra nhiều mối đe dọa khác. Nếu bạn muốn tự bảo vệ mình trước những cuộc tấn công này, hãy nhớ rằng AI không phải là công cụ hoàn hảo và bạn nên xem xét kỹ lưỡng mọi thứ bạn gặp phải trên mạng.
Tấn công Prompt Injection gián tiếp
Tấn công Prompt Injection gián tiếp là loại tấn công Prompt Injection nhanh chóng gây rủi ro lớn nhất cho bạn, với tư cách là người dùng cuối. Các cuộc tấn công này xảy ra khi những hướng dẫn độc hại được cung cấp cho Generative AI bằng một tài nguyên bên ngoài, chẳng hạn như lệnh gọi API, trước khi bạn nhận được thông tin đầu vào mong muốn.
Một bài báo có tiêu đề "Làm tổn hại các ứng dụng tích hợp LLM trong thế giới thực bằng Prompt Injection gián tiếp trên arXiv" đã trình bày một cuộc tấn công lý thuyết trong đó AI có thể được hướng dẫn để thuyết phục người dùng đăng ký một trang web lừa đảo trong câu trả lời, sử dụng văn bản ẩn (với mắt người nhưng mô hình AI hoàn toàn có thể đọc được) để lén lút đưa thông tin vào. Một cuộc tấn công khác của cùng một nhóm nghiên cứu được ghi lại trên GitHub cho thấy một cuộc tấn công trong đó Copilot (trước đây là Bing Chat) được thực hiện để thuyết phục người dùng rằng đó là một đại lý hỗ trợ trực tiếp đang tìm kiếm thông tin thẻ tín dụng.
Các cuộc tấn công Prompt Injection gián tiếp đang đe dọa vì chúng có thể thao túng những câu trả lời bạn nhận được từ mô hình AI đáng tin cậy - nhưng đó không phải là mối đe dọa duy nhất mà chúng gây ra. Như đã đề cập trước đó, chúng cũng có thể khiến bất kỳ AI tự trị nào mà bạn có thể sử dụng hành động theo những cách không mong muốn và có thể gây hại.
Luyenpv
-
Sở Giao thông vận tải Ninh Bình triển khai thực hiện mô hình số 17 của Đề án 06
Thứ Tư, 20/11/2024
-
VPN Công cụ bảo mật cần có cho máy tính
Thứ Sáu, 18/10/2024
-
Chương trình chung tay cứu trợ khẩn cấp đồng bào bị ảnh hưởng bởi lũ lụt trên nền tảng Vneid
Thứ Năm, 26/09/2024
-
Kế hoạch tổ chức Ngày Chuyển đổi số năm 2024 tại Sở Giao thông vận tải Ninh Bình
Thứ Ba, 10/09/2024
-
Nghị định quy định về định danh và xác thực điện tử
Thứ Hai, 08/07/2024
-
Cuộc thi tìm hiểu kiến thức về chuyển đổi số và cải cách hành chính
Thứ Hai, 10/06/2024
-
Cuộc thi trực tuyến "Tìm hiểu pháp luật về định danh và xác thực điện tử, dịch vụ công trực tuyến và Luật Căn cước" phục vụ chuyển đổi số trên địa bàn tỉnh Ninh Bình
Thứ Tư, 29/05/2024
-
Tìm hiểu về trí tuệ nhân tạo
Thứ Hai, 27/05/2024
-
Quyết định ban hành Quy chế quản lý, vận hành khai thác dữ liệu trên Cổng dữ liệu mở tỉnh Ninh Bình
Thứ Hai, 27/05/2024
-
Quyết định phê duyệt Kế hoạch hành động của Bộ Thông tin và Truyền thông thực hiện Quyết định 142/QĐ-TTg ngày 02/02/2024 của Thủ tướng Chính phủ về việc phê duyệt Chiến lược dữ liệu Quốc gia đến năm 2030
Thứ Sáu, 24/05/2024
-
Quy chế đảm bảo An toàn thông tin cho các hệ thống thông tin của Sở GTVT Ninh Bình
Ban hành: Thứ Năm, 16/02/2023
-
Quy chế quản lý và sử dụng iOffice
Ban hành: Thứ Năm, 16/02/2023
-
Quyết định quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức Ban QLDA Vốn sự nghiệp kinh tế
Ban hành: Thứ Năm, 22/12/2022
-
Quyết định quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức Cảng vụ đường thủy
Ban hành: Thứ Sáu, 14/10/2022
-
Quyết định quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức Trạm kiểm tra tải trọng và Đăng kiểm thủy
Ban hành: Thứ Tư, 05/10/2022
-
Quyết định quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức Xí nghiệp Bến xe khách Ninh Bình
Ban hành: Thứ Tư, 05/10/2022
-
Quyết định ban hành chức năng quyền hạn, nhiệm vụ quyền hạn và cơ cấu tổ chức của Trung tâm sát hạch lái xe cơ giới Ninh Bình
Ban hành: Thứ Tư, 05/10/2022
-
Thông báo lấy ý kiến nhân dân về trường hợp đề nghị tặng thưởng Huân Chương lao động hạng 3 và Bằng khen của Thủ tướng chính phủ
Thứ Hai, 10/02/2025
-
Quyết định điều chuyển xe ô tô của Cảng vụ đường thuỷ nội địa sang Sở Giao thông vận tải để quản lý
Thứ Tư, 18/12/2024
-
Thông báo mời đơn vị, cá nhân mua tài sản thanh lý
Thứ Tư, 11/12/2024
-
Thông báo kết quả lựa chọn tổ chức đấu giá tài sản
Thứ Tư, 11/12/2024
-
Thông báo lựa chọn tổ chức đấu giá tài sản vật tư thu hồi công trình
Thứ Năm, 28/11/2024
-
Thông báo giấy chứng nhận đăng ký phương tiện thuỷ nội địa không còn giá trị sử dụng
Thứ Sáu, 24/05/2024
-
Thông báo bán thanh lý vật tư thu hồi do tháo dỡ Nhà làm việc số 2 (cấp IV) và tường rào phía Tây, phía Nam thuộc cơ quan Sở Giao thông vận tải
Thứ Sáu, 22/03/2024
Bạn quan tâm mục gì nhất trong Website của chúng tôi?
Tổng số: 2660008
Trực tuyến: 10
Hôm nay: 838
Trong tháng: 838
Trong năm: 31923