TCVN 13903:2023 về tính đáng tin cậy trong trí tuệ nhân tạo
Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đang thay đổi cách vận hành trong mọi mặt từ kinh tế đến xã hội của thế giới. Sự phổ biến của AI trong các lĩnh vực như công nghệ, giao thông vận tải, tài chính, sản xuất đến chăm sóc sức khỏe.
Cho đến thời điểm hiện tại, vẫn chưa có một quy định chính thức nào được ban hành rộng rãi nhằm chắc chắn rằng tất cả các hoạt động phát triển AI đều đảm bảo tính tin cậy. Trí tuệ nhân tạo đáng tin cậy liên quan đến việc phát triển và triển khai các hệ thống trí tuệ nhân tạo minh bạch và an toàn. Quá trình cần tuân thủ các nguyên tắc liên quan đến tính công bằng, trách nhiệm giải trình, tính trung thực, quyền riêng tư và an toàn trong các ứng dụng và quy trình ra quyết định của AI. Những nguyên tắc nền tảng là cơ sở để đảm bảo AI được sử dụng một cách có trách nhiệm và hạn chế những rủi ro tiềm ẩn về bảo mật và đạo đức.
Tuy nhiên gần đây, số lượng cuộc tấn công liên quan đến AI đang leo thang nhanh chóng. Sự bùng nổ của Generative AI trong việc tạo ra các nội dung dạng chữ, hình ảnh, video đã đặt ra những thách thức trong việc kiểm soát thông tin giả và giảm thiểu thiên kiến trong quá trình tạo nên tác phẩm.
Ngoài ra sự ra đời của AI cũng đồng nghĩa mối đe dọa mới nổi là các cuộc tấn công đối kháng (adversarial attacks), trong đó tội phạm mạng thực hiện những thay đổi nhỏ trong tệp để đánh lừa hệ thống AI, khiến chúng phân loại nhầm mã độc thành tệp an toàn.
Một số cuộc tấn công yêu cầu kiến thức chuyên sâu về khoa học dữ liệu, nhưng nhiều cuộc tấn công khác có thể được thực hiện bằng cách sử dụng các công cụ công khai có sẵn. Chúng ta có thể chia các cuộc tấn công này thành hai loại chính. Đầu tiên là tấn công sử dụng AI (offensive AI). Kẻ tấn công sử dụng AI để tự động hóa các hoạt động tấn công hoặc tìm ra các phương thức tấn công mới. Ví dụ điển hình là công nghệ Deepfake. Thứ hai là lợi dụng lỗ hổng của AI (AI vulnerabilities), kẻ tấn công có thể thao túng các mô hình AI để thực hiện các hành động ngoài ý muốn hoặc bị hạn chế. Ví dụ, các cuộc tấn công bằng cách thao túng câu hỏi đầu vào (prompt attack) đối với các mô hình ngôn ngữ lớn đã xuất hiện trong năm vừa qua.
Để hạn chế các cuộc tấn công cũng như đảm bảo tính đáng tinh cậy trong tri tuệ nhân tạo Bộ Khoa học và công nghệ đã ban hành Tiêu chuẩn quốc gia TCVN 13903:2023 Công nghệ thông tin - trí tuệ nhân tạo- tổng quan về tính đáng tin cậy trong trí tuệ nhân tạo nhằm xem xét các vấn đề liên quan đến tính đáng tin cậy trong các hệ thống AI.
Các phương pháp tiếp cận để tạo lập sự tin cậy vào các hệ thống AI thông qua tính minh bạch, tính diễn giải, khả năng điều khiển v.v..; Các bẫy kỹ thuật và các mối đe dọa và rủi ro điển hình liên quan đến các hệ thống AI, các kỹ thuật và phương pháp giảm thiểu có thể; Các phương pháp tiếp cận để đánh giá tính khả dụng, khả năng phục hồi, tính tin cậy, độ chính xác, an toàn, bảo mật và quyền riêng tư của các hệ thống AI.
Tiêu chuẩn này cung cấp một cái nhìn tổng quan về các chủ đề liên quan đến việc xây dựng tính đáng tin cậy của các hệ thống AI. Một trong những mục tiêu của tiêu chuẩn này này là hỗ trợ cộng đồng tiêu chuẩn xác định các lỗ hổng tiêu chuẩn hóa cụ thể trong lĩnh vực AI.
Mục đích quan trọng của tiêu chuẩn này là cung cấp các định nghĩa chấp nhận được về hệ thống trí tuệ nhân tạo (AI) và tính đáng tin cậy. Tiêu chuẩn này coi hệ thống AI là bất kỳ hệ thống nào (cho dù là sản phẩm hay dịch vụ) sử dụng AI. Có nhiều loại hệ thống AI khác nhau. Một số hệ thống được triển khai hoàn toàn bằng phần mềm, trong khi những hệ thống khác phần lớn được triển khai bằng phần cứng (ví dụ như người máy).
Về cách nhận biết các lớp tin cậy, tiêu chuẩn hướng dẫn một hệ thống AI có thể được khái quát hóa là sự hoạt động trong một hệ sinh thái gồm các lớp chức năng. Sự tin cậy được thiết lập và duy trì ở mỗi lớp để hệ thống AI được tin cậy trong môi trường của nó. Xét về lớp tin cậy vật lý, khái niệm này thường đồng nghĩa với sự kết hợp giữa độ tin cậy và độ an toàn vì các số liệu dựa trên phép đo đạc hoặc kiểm tra vật lý.
Ở lớp tin cậy không gian mạng, các mối quan tâm thường là các yêu cầu bảo mật cơ sở hạ tầng công nghệ thông tin, chẳng hạn như kiểm soát truy cập và các biện pháp khác để duy trì tính toàn vẹn của hệ thống AI và giữ an toàn cho dữ liệu của nó. Sự tin tưởng ở lớp ứng dụng đầu cuối của hệ thống AI yêu cầu phần mềm và các thử khác đi cùng với nó là đáng tin cậy và an toàn.
Ngoài ra cũng nên áp dụng các tiêu chuẩn chất lượng phần mềm và dữ liệu. Phần mềm có ảnh hưởng quan trọng đến tính đáng tin cậy của một hệ thống AI điển hình. Do đó, việc xác định và mô tả các thuộc tính chất lượng của phần mềm có thể giúp cải thiện tính đáng tin cậy của toàn bộ hệ thống.
Quản lý rủi ro là một quá trình phòng ngừa nhằm đảm bảo rằng sản phẩm AI hoặc dịch vụ AI “theo thiết kế” có tính đáng tin cậy trong suốt vòng đời của nó. Quy trình chung quản lý rủi ro được định nghĩa trong ISO 31000: 2018 đề cập đến việc xác định các bên liên quan, tài sản và giá trị dễ bị tổn thương, đánh giá rủi ro liên quan đến hậu quả hoặc tác động của chúng, đưa ra quyết định xử lý rủi ro tối ưu dựa trên các mục tiêu cần đạt và khả năng chấp nhận rủi ro của tổ chức.
Tính an toàn là một khía cạnh quan trọng của tinh đáng tin cậy. Do đó việc xem xét các khía cạnh về tính an toàn được ưu tiên cao. Thông thường rủi ro gây hại của hệ thống được nhận thức càng cao thì yêu cầu về tính đáng tin cậy càng cao.
Đối với ứng dụng hệ thống AI, các mục đích sử dụng và lạm dụng việc sử dụng cần phải được nhận lường trước một cách hợp lý; phải xem xét cẩn thận môi trường mà nó được sử dụng cũng như các công nghệ được sử dụng.
Hệ thống AI có khả năng đưa ra rủi ro xuất phát từ các lỗ hổng cụ thể của AI. Điều này sẽ dẫn đến các biện pháp mới để giảm rủi ro xuống mức có thể chấp nhận căn cứ vào các hành vi cụ thể của AI, chẳng hạn như hoạt động ra quyết định không có tính minh bạch hoặc không được xác định trước. Đối với một hệ thống cụ thể, không chỉ xét riêng về thành phần Al mà tất cả các công nghệ được sử dụng cũng như sự tương tác giữa chúng đều phải được xem xét cẩn thận.
Bài viết có bổ sung ảnh đại diện minh họa (Nguồn ảnh:Internet).
https://vietq.vn/tcvn-139032023-ve-tinh-dang-tin-cay-trong-tri-tue-nhan-tao-d228413.html
Ý kiến của bạn