تعتمد خوارزميات الذكاء الاصطناعي على المدخلات، لتقوم بعمليات المعالجة المعقدة، التي تنتج عنها المخرجات، والتي يستفيد منها المستخدم، بحسب مجال تلك الخوارزمية، وبشكل عام، فإن نوعية المخرجات تعتمد على نوعية المدخلات، فجودة البيانات التي تحصل عليها الخوارزمية تلعب دوراً كبيراً في جودة المخرجات، ليس ذلك فحسب، بل إن نوع البيانات التي يحصل عليها المستخدم بعد عملية المعالجة قد يتم تحديدها بناء على البيانات المدخلة، فالخوارزمية التي مخرجاتها عبارة عن نصوص، فإن مدخلاتها في الغالب عبارة عن نصوص أيضاً، والخوارزمية التي مخرجاتها عبارة عن رسمة أو صورة، فإن مدخلاتها صورة أو رسمة.

التطور في خوارزميات الذكاء الاصطناعي، في السنوات الماضية، نتجت عنه خوارزميات يمكنها استقبال نوع من البيانات، وبعد المعالجة، تكون المخرجات عبارة عن نوع مختلف من البيانات، فمثلا يمكن لخوارزمية أن تستقبل مدخلات نصية، ومن ثم تكون مخرجاتها صورة مثلاً.

الخوارزميات التي بإمكانها العمل على أكثر من نوع من البيانات، يطلق عليها خوارزميات النماذج المتعددة (Multimodel)، وهي خوارزميات مصممة أساساً لتعطي مخرجات من نوع معين، مختلف عن طبيعة المدخلات، وهذه الخوارزميات وعلى الرغم من اختلاف مخرجاتها عن مدخلاتها، إلا أن هناك علاقة كبيرة بين المدخلات والمخرجات، فمثلاً في العام 2015 قام الدكتور ستانيسلو أنتول مع فريق بحث من معهد فيرجينيا للتكنولوجيا بتطوير نظام ذكاء اصطناعي، يمكنه استقبال مدخلات على شكل صورة، ومن ثم يقوم النظام باستقبال أسئلة من المستخدم عن هذه الصورة، وبالتالي يمكنه الإجابة عن أي استفسارات بخصوص تلك المدخلات.

العمل على خوارزميات النماذج المتعددة ما زال مستمراً بين مراكز الأبحاث، والتي بدورها تسعى للربط بين أكثر من نوع من أنواع البيات، وجعل أنظمة الذكاء الاصطناعي تتعامل معها، غير أن هناك محاولة جديرة بالاهتمام، نشرها الباحث ييران تشنج في العام 2021 مع عدد من الباحثين في جامعات ألمانية، المميز في مثل هذا البحث، أن النماذج المتعددة تم استخدامها ليس فقط لأنواع البيانات المدخلة (كصورة أو نص)، بل إنها نماذج متعددة لطبيعة المخرجات.

يذكر البحث آلية استطاع بها الباحثون؛ جعل خوارزمية الذكاء الاصطناعي لا تقوم فقط باستقبال أنواع متعددة من المدخلات، بل إن المخرجات يمكنها أن تحاكي المعارف الأساسية للإنسان، بمعنى أن مخرجات الخوارزمية يتم وزنها لتتوافق مع منطق عموم البشر.

وبالتالي فمخرجات النظام ليست عبارة عن نص ارتجالي أو صورة أو رسمة، بل إن مكونات المخرجات ذاتها تم التحقق من أنها على اتساق مع الكم المعرفي الذي يمتلكه البشر.