طور باحثون من Data61 في CSIRO، المتخصصة في البيانات الرقمية في وكالة العلوم الوطنية الأسترالية، مجموعة من التقنيات الأولى على المستوى العالمي لتطعيم الخوارزميات بشكل فعال ضد الهجمات العدائية على الأجهزة الإكترونية، وهو تقدم مهم في أبحاث التعلم الآلي. وفي ورقة بحثية تم قبولها في المؤتمر الدولي للتعلم الآلي (ICML) لعام 2019، أظهر الباحثون أيضًا أن تقنيات "التطعيم" مبنية على أسوأ الأمثلة العدائية الممكنة، وبالتالي يمكنها مقاومة الهجمات القوية جدًا.

نموذج التعلم الآلي

تتعلم الخوارزميات من البيانات التي يتم تدريبهم عليها لإنشاء نموذج للتعلم الآلي يمكن أن يؤدي مهمة معينة بفعالية دون الحاجة إلى تعليمات محددة، مثل عمل تنبؤات أو تصنيف الصور ورسائل البريد الإلكتروني بدقة.


وقال قائد مجموعة التعلم الآلي الدكتور ريتشارد نوك، إنه "من خلال إضافة طبقة من الضوضاء على صورة ما، يمكن للمهاجمين خداع نماذج تعلم الآلة في تصنيف الصورة بشكل خاطئ. وإن التقنيات الجديدة تمنع الهجمات العدائية باستخدام عملية مشابهة للتطعيم. وعندما يتم تدريب الخوارزمية على البيانات التي تتعرض لجرعة صغيرة من التشويه، فإن النتيجة النموذج أقوى وأكثر حصانة لهجمات الخصوم".