الدمام: الوطن

أظهر علماء الكمبيوتر في جامعة جونز هوبكنز كيفية تعليم الروبوتات من خلال استخدام التعزيز الإيجابي، وهو نهج مألوف لأي شخص يستخدم المكافأة لتغيير سلوك الكلب، وقد تمكن الروبوت، المسمى Spot، من التعلم في أيام بدلًا من شهر.

وأوضح الكاتب الرئيسي أندرو هونت: «لدي كلاب لذلك أعرف أن المكافآت نافعة وكان ذلك مصدر إلهام لكيفية تصميم خوارزمية التعلم».

وأضاف: على عكس البشر والحيوانات الذين يولدون بأدمغة بديهية للغاية، فإن أجهزة الكمبيوتر عبارة عن ألواح فارغة ويجب أن تتعلم كل شيء من الصفر. ولكن غالبًا ما يتم تحقيق التعلم الحقيقي عن طريق التجربة والخطأ، وقد حقق الفريق ذلك من خلال ابتكار نظام مكافأة لمعاملة الروبوتات كالكلاب. حيث قد يحصل الكلب على بسكويت لأداء مهمة جيدة، وتحصل الروبوتات على نقاط رقمية.

ويتصور الباحثون أن هذه الطريقة يمكن أن تساعد في تدريب الروبوتات المنزلية على غسل الملابس والأطباق - وهي مهام يمكن أن تكون شائعة في السوق المفتوحة وتساعد كبار السن على العيش بشكل مستقل. قال هيجر: «لا نعرف حاليًا كيفية برمجة مثل هذه المهام - فالعالم شديد التعقيد. ولكن عملًا كهذا يوضح لنا أن هناك وعدًا لفكرة أن الروبوتات يمكنها تعلم كيفية إنجاز مثل هذه المهام الواقعية بطريقة آمنة وفعالة».