حمله خصمانه به مدل‌های هوش‌مصنوعی

فهرست:

هشدار امنیتی در خصوص لزوم ایجاد آزمایشگاه‌های ارزیابی امنیتی محصولات هوش‌مصنوعی

امروزه شبکه‌های عصبی به‌عنوان یکی از بهترین ابزارهای مطرح در هوش‌مصنوعی و یادگیری ماشین شناخته شده‌اند و در انجام کار‌های متنوع مورد استفاده قرار می‌گیرند. در سال‌های اخیر موارد متعددی از آسیب‌پذیری این شبکه‌ها مطرح شده است [1]–[20]. این آسیب‌پذیری‌ها غالباً با افزودن اختلالات و تغییرات بسیار اندک به‌صورت جمع‌شونده و غیر جمع‌شونده در داده ورودی ایجاد می‌شوند. این اختلالات موجب می‌شوند که با وجود نامحسوس بودن تغییرات اعمال شده در ورودی از دیدگاه عامل انسانی، خروجی مدل‌های آموزش دیده تغییر یابند. ناکارآمد شدن این شبکه‌ها به دلیل شکست در مقابل حملات خصمانه موجب گردیده است که توجه برخی از پژوهشگران فعال در عرصه یادگیری عمیق به بررسی و تحلیل دقیق‌تر این شبکه‌ها و مقاوم‌سازی آن‌ها نسبت به اینگونه حملات معطوف گردد.

به مجموعه‌ای از عملیات خصمانه که موجب شوند تا بدون تغییر محسوس داده از دیدگاه انسانی، مدل هوش‌مصنوعی در تعیین کلاس داده دچار اشتباه شود حمله گفته می‌شود. در روش‌های حمله به دنبال شناسایی راه‌حل‌ها و روش‌های تغییر داده ورودی و فریب مدل‌های هوش‌مصنوعی و در نتیجه تغییر کلاس خروجی مدل می‌باشند [1], [2].

از جنبه‌های مثبت حمله‌ به مدل‌های هوش‌مصنوعی، همانند هدف هکرهای کلاه‌سفید می‌توان جهت ارزیابی و شناسایی آسیب‌پذیری[1] مدل‌های هوش‌مصنوعی استفاده کرد.

نمونه ساده‌ای از حملات در در شکل 1 به تصویر کشیده شده است. همان‌طور که از سمت چپ به راست مشاهده می‌شود تصویر ورودی توسط یک مدل دسته‌بندی هوش‌مصنوعی با دقت 89% «لیوان یا ماگ» تشخیص داده شده است. پس از افزودن میزان بسیار کمی (0.0008) اختلال خصمانه، تصویر حاصل شده سمت راست با اینکه از نگاه عامل انسانی همچنان همان کلاس قبلی (لیوان، ماگ) را خواهد داشت اما این‌بار همان مدل هوش‌مصنوعی قبلی، تصویر حاصل را با دقت %99.3 «اتوموبیل»‌ تشخیص داده ‌است. این تغییر و اختلال ساده که به ظاهر دیده نمی‌شود ولی توانسته خروجی مدل را تغییر دهد می‌تواند آسیب‌پذیری مدل‌های هوش‌مصنوعی را بیش از پیش نشان دهد.

با توجه به آنچه تاکنون بیان شده است، به تغییرات بسیار اندک که در عین نامحسوس بودن از دیدگاه عامل انسانی، از نظر مدل یادگیری ماشینی موجب تغییر کلاس داده شود، اختلال گویند. اغلب پیداکردن یک اختلال مناسب، نیازمند حل مسئله بهینه‌سازی است ولی در برخی مواقع متناسب با شرایط، ممکن است از روش‌های سعی و خطا نیز استفاده شود. اغلب هر اختلال قادر به تغییر کلاس یک داده خاص است و قابلیت عام بودن ندارد. اما می‌توان با روش‌هایی اختلال عام‌منظوره‌ای[2] (همگانی) تولید نمود که پس از اعمال روی مجموعه‌ای از داده‌ها موجب فریب مدل گردد [21], [22]. صورت کلی مسئله حمله به صورت رابطه (1) تبیین می‌شود [1], [2]:

F(x+η)≠F(x) (1

در رابطه (1)، منظور از η همان اختلال و F دسته‌بند یا مدل فراگرفته شده مسئله می‌باشد. هدف از رابطه فوق این است که در زمان ترکیب اختلال با داده اصلی، داده‌ای تولید شود که باعث فریب و به اشتباه ‌افتادن مدل گردد. حال اگر مسئله بهینه‌سازی را با در نظر گرفتن شرایط تبیین نماییم، مسئله پیدا‌کردن یک اختلال به صورت رابطه  تعریف می‌شود:

در رابطه (2)، منظور از ‖∙‖_p نرم lpمی‌باشد. همان‌طور که مشخص است؛ رابطه (2) حالت کلی مسئله بهینه‌سازی پیدا‌کردن کوچکترین اختلال همراه با برقراری شرایط رابطه (1) می‌باشد. حملات با استفاده از ایده‌های مختلف، اختلال‌ها را پیدا می‌کنند.

در مقابل روش‌های حمله، به کلیه فرآیندهایی که به مقابله با آسیب‌پذیری مدل‌های هوش‌مصنوعی نسبت به نمونه‌های خصمانه می‌پردازند دفاع گفته می‌شود. این فرآیند‌ها شامل روش‌های متنوعی هستند که پاسخ مدل را نسبت به ورودی‌ خصمانه کنترل می‌کنند. همچنین در برخی روش‌ها دقت و تعمیم‌پذیری مدل نیز افزایش می‌یابد [4], [5], [12], [16], [23], [24].  روش‌های دفاع و مقابله با حملات و نمونه‌های خصمانه به دو دسته روش‌های کنشی[3] و روش‌های پیش‌کنشی[4] تقسیم‌بندی می‌شوند [4], [25]. در روش‌های کنشی پس از ساخت شبکه عصبی (مدل)، به بررسی آسیب‌پذیری و مقابله با نمونه خصمانه می‌پردازیم. در برخی روش‌ها پس از تشخیص خصمانه‌بودن نمونه ورودی، آن ورودی از ادامه فرآیند خارج شده و پس از طی چند مرحله (مراحل پاک‌سازی) مجدداً به فرآیند عادی برگشت داده می‌شود. در روش‌های پیش‌کنشی بیشتر به ماهیت شبکه عصبی عمیق توجه می‌شود. درواقع سعی می‌شود تا طراحی معماری شبکه، تابع هزینه یا بخش‌بندی‌های مشابه به‌گونه‌ای تغییر یابند که مدل نسبت به حملات و نمونه‌های متنوع خصمانه مقاوم باشد.

باتوجه به اینکه روش‌های مبتنی بر شبکه‌های عصبی عمیق داده زیادی را نیاز دارند، از این‌رو دادگان آموزشی برای هر شرکت و موسسه‌ای که مدل هوش‌مصنوعی را تولید می‌کند مهم است. از همین جهت نوع دیگری از حملات به منظور استخراج داده‌های آموزشی از یک مدل هوش‌مصنوعی از پیش‌تعلیم دیده شده نیز وجود دارد. استخراج داده‌های حساس و محرمانه و یا هویتی نیز یکی از معضلات تسلیم‌شدن نسبت به این رویکردهای حمله است و تحت عنوان نشت حریم‌خصوصی نیز اطلاق می‌شود. لذا نیاز است که مدل‌های هوش‌مصنوعی نسبت به این نوع از حملات نیز مقاوم باشند [26], [27].

باتوجه به اینکه در برخی مدل‌های هوش‌مصنوعی نظیر شبکه‌های عصبی، قابلیت تفسیرپذیری به ندرت و با پیچیدگی زیادی وجود دارد، شناسایی یک راه‌حل مناسب جهت دفاع نسبت به حملات خصمانه و یا تعمیم‌پذیری مدل نیز تاحدی سخت و پیچیده است. این بحث تا حدی مهم است که به یک شاخه تخصصی در هوش‌مصنوعی به نام XAI یا eXplainable AI تبدیل شده است [28]. در تصویر 3 وضعیت تفسیرپذیری مدل‌های پرکاربرد نشان داده شده است. مشاهده می‌شود که شبکه‌های عصبی با اینکه در سال‌های اخیر به دقت‌های بسیارخوبی در وظایف مختلف نظیر دسته‌بندی[5] و بخش‌بندی[6] و … رسیده‌اند، اما از لحاظ تفسیرپذیری در مقام پایینی قرار دارند. از همین‌رو مجموعه‌های بزرگ تحقیقاتی و حتی نظامی پروژه‌های کلانی را روی موضوعات تعریف نموده‌اند.

برای نمونه سازمان پروژه‌های پژوهشی پیشرفته دفاعی DARPA[7] چندین پروژه تحقیقاتی در این خصوص ایجاد کرده و سرمایه‌گذاری قابل توجهی بر روی آن‌ها داشته است [29], [30].

استفاده از مدل‌های آسیب‌پذیر در فعالیت‌های مختلف ارزیابی و به‌خصوص امنیتی نظیر احراز هویت صوتی یا تصویری یا … می‌تواند مخاطرات متعددی را داشته باشد و نیاز است تا واحدهای نظارت و ارزیابی بر مدل‌های هوش‌ مصنوعی نیز در آینده نزدیک کشور ایجاد گردند. درواقع همانند محصولات غذایی، برچسب تاییدیه سطح کیفی بر محصولات هوش‌مصنوعی نیز زده شود.

منابع


پی‌نوشت

[1] Vulnerability

[2] Universal

[3] Reactive

[4] Preactive

[5] Classification

[6] Segmentation

[7] Defense advanced research projects agency

مقالات مشابه

اینترنت اشیاء

دوقلوی دیجیتال؛ بازوی توانمندساز انقلاب صنعتی چهارم

علیرغم پیشرفت‌های شگرفی که در راستای تجزیه و تحلیل داده‌های پیچیده صورت گرفته است، همچنان بسیاری از رویکرد‌ها و برنامه‌ریزی‌های راهبردی سازمان‌ها توسط مدیران ارشد صنعت وابستگی قابل تأملی به

رصد فناوری

آینده اپراتورهای مخابراتی با هوش مصنوعی مولد: از فرصت‌های نوین تا چالش‌های کلیدی

چکیده:ظهور هوش مصنوعی مولد هم فرصت است و هم چالش. مکنزی پیش‌بینی کرده است[1] که هوش مصنوعی مولد Gen-AI[2] ضمن افزایش بهره‌وری کلیه مدل‌های به‌کارگیری هوش‌مصنوعی، بین 2.6 تا 4.4

رصد فناوری

اتوماسیون سیستم‌های پشتیبانی شبکه و عملیات با کمک هوش مصنوعی مولد

چکیده: سیستم‌های پشتیبان عملیات[1] عضوی اساسی در شبکه‌های مخابرات سیار هستند که وظیفه آن‌ها پایش و هماهنگی مشتریان، خدمات، منابع، فرآیندها و فعالیت‌های شبکه است. با توجه به رشد روزافزون

پیمایش به بالا