يعتمد التقدم الحاصل في أنظمة الذكاء الاصطناعي على أنواع محددة من البيانات بشكل أساسي، أي أن خوارزميات الذكاء الاصطناعي التي تم تدريبها على النصوص فإنه يمكنها التعامل مع النصوص، والخوارزمية التي تم تدريبها على الصور يمكنها التعامل مع الصور، غير أنه وفي الآونة الأخيرة فإن عددا من الباحثين قاموا بدراسة العلاقات بين البيانات المختلفة، وإمكانية دمجها لبناء أنظمة الذكاء الاصطناعي، فقد تم بحث إمكانية تدريب الخوارزميات على النصوص والصور معاً لتقوم لاحقاً بتحليل أحدها، ويطلق على مثل هذه العملية «النماذج المتعددة» (Multi Model)، وهي عملية في غاية التعقيد، حيث تتطلب بناء خوارزميات تدرك العلاقة بين المدخلات المختلفة كالنصوص والصور، ومن ثم تقدم قراراتها بناء على هذه العلاقات المتعددة.

وأحد أهم المجالات التي استفادت من خوارزميات النماذج المتعددة، هو مجال تحليل المشاعر، خصوصاً على منصات التواصل الاجتماعي، إذ إنه من الملاحظ أن كثيرا من مستخدمي تلك المنصات يعمدون إلى مشاركة النصوص والصور في آن واحد، بل والفيديو في بعض الحالات، فحين يريد المستخدمون أن يقوموا بالتعبير عن حالتهم المزاجية، فهم يشاركون صورة تعبر عما يشعرون به، إضافة إلى العبارات التي كانوا يرغبون في كتابتها.

تغير أسلوب المستخدمين في التعبير عن مشاعرهم، يعني الحاجة إلى تغيير أسلوب الخوارزميات أيضاً، وبالتالي فإن استخدام أسلوب النماذج المتعددة لخوارزميات الذكاء الاصطناعي بات مطلباً أساسياً، وهذا ما قام به بالفعل عدد من العلماء حول العالم، ففي 2017 قام الدكتور نان زو (Nan Xu) من جامعة الأكاديمية الصينية للعلوم (University of Chinese Academy of Sciences) ببناء نظام متعدد النماذج لتحيل المشاعر في التغريدات.

وقد شكل الدكتور نان في 2018 فريق بحث ليواصل أبحاثه في الموضوع ذاته، وفي 2020 أجرى عدد من الباحثين في جامعة الشمال الغربي الصينية (Northeastern University) تجارب لهم على تحليل المشاعر أيضاً باستخدام أسلوب النماذج المتعددة بفريق بحث تكون من الدكتورة شاوشوي يانج (Xiaocui Yang) وباحثين آخرين.

غير أنه وفي عام 2021، ابتكرت الدكتورة شاوشوي مع فريق من جامعة الشمال الشرقي الصينية ذاتها طريقة مختلفة لخوارزمية نماذج متعددة، تقوم طريقتهم المبتكرة على تحليل التغريدات والصور المصاحبة لها، كسابقاتها، ولكن المختلف هذه المرة أن خوارزمية الدكتورة شاوشوي، تبني نموذجا مشتركا لجميع الصور في قاعدة البيانات، وبالتالي تستخرج خواصا تتشارك فيها الصور، وتستخدم تلك الخواص في اتخاذ قرارتها.

على سبيل المثال يمكن ملاحظة أن المستخدمين في الغالب يشاركون صور الشاطئ حين يريدون التعبير عن مشاعرهم الإيجابية، وبالتالي، فإن خوارزمية يمكنها زيادة كفاءة قراراتها ليس فقط بالتعرف على النص المصاحب للصورة، ولكن بمعرفة أن الصور المنشورة هي للشاطئ مثلا.