خلال السنوات الأخيرة، تقدمت أنظمة الذكاء الاصطناعي بخطى سريعة، متجاوزة في كثير من المهام الخطوط المرجعية التي حُددت مسبقًا على أساس الأداء البشري. التقرير الصادر ضمن «أسبوع الذكاء الاصطناعي» على منصة Visual Capitalist، والمبني على بيانات «مؤشر الذكاء الاصطناعي» لجامعة ستانفورد 2025، يكشف كيف أصبحت النماذج الذكية قادرة على التفوق في تصنيف الصور، فهم اللغة، التفكير البصري، وحتى الأسئلة العلمية بدرجة الدكتوراه.

تصنيف الصور

تصنيف الصور كان دائمًا مؤشرًا متقدمًا، إذ بدأ من 89.15% عام 2012، وارتفع تدريجيًا حتى بلغ 104.36% في 2022، مما يشير إلى أن النماذج باتت قادرة على التفوق بشكل ثابت في هذا النوع من المهام.


في التفكير البصري، بدأت النماذج من نسبة 80.09% في 2016، وواصلت التحسن حتى بلغت 102.48% في 2021، ثم 104.36% في 2022، متجاوزة بدقة الخط البشري المرجعي.

أما في فهم اللغة الإنجليزية، فقد تطورت من 94.21% في 2019 إلى 99.44% في 2020، ثم إلى 101.56% في 2021، وبلغت 101.67% في 2022، قبل أن تصل إلى 101.78% في عام 2024.

فهم القراءة

في فهم القراءة بمستوى متوسط، حققت النماذج تطورات واضحة، من 82.35% في 2017 إلى 104.15% في 2021، مما يعكس تحسنًا مستمرًا في قدرات المعالجة اللغوية المعمقة.

فهم اللغة

أما فهم اللغة متعددة المهام، وهو أحد الاختبارات الصعبة، فقد تطور من 36.08% عام 2019 إلى 60.02% في 2020، ثم 66.82% في 2021، ثم 83.74% في 2022، ووصل إلى96.21% في 2023، ليبلغ 102.78% في 2024.

مجال الرياضيات

في مجال الرياضيات على مستوى المنافسة، كانت الانطلاقة بطيئة عند 7.67% فقط في 2021، ثم 57.56% في 2022، لكنها تحسنت بشكل مذهل إلى 93.67% عام 2023، وإلى 108.78% في 2024.

أما الأسئلة العلمية بدرجة الدكتوراه، فقد بدأت تظهر في القياس عام 2023 بنتيجة 47.78%، ثم قفزت في 2024 إلى 108.00%، ما يعكس قفزة مفاجأة في قدرة النماذج على المعالجة العلمية عالية المستوى.

الفهم والاستدلال

في الفهم والاستدلال متعدد الوسائط، وهو المجال الذي طالما تخلفت فيه النماذج عن الإنسان، تظهر البيانات كيف أن الفجوة تضيق بشكل سريع. في 2023، بلغت النماذج 71.91% فقط، ثم تحسنت في 2024 إلى 94.67%، مقتربة من الخط البشري المرجعي البالغ 100%.

هذا التقدم النوعي يعكس تحولًا جذريًا في قدرات الذكاء الاصطناعي، الذي بات لا يكتفي بمحاكاة الأداء البشري، بل تجاوزه في عدد من المجالات التقنية، بينما يستعد لسد الفجوة في المجالات المعرفية متعددة التخصصات. وإذا استمرت هذه الوتيرة، فإن السنوات القليلة المقبلة قد تشهد تفوقًا كليًا للذكاء الاصطناعي في كل اختبار معرفي وذهني خُصص أصلاً لقياس الإنسان.

2012

• تصنيف الصور: 89.15%

2013

• تصنيف الصور: 91.42%

2014

• تصنيف الصور: 96.94%

2015

• تصنيف الصور: 99.47%

2016

• تصنيف الصور: 100.74%

• التفكير البصري: 80.09%

2017

• تصنيف الصور: 101.37%

• فهم القراءة (متوسط المستوى): 82.35%

• التفكير البصري: 86.49%

2018

• تصنيف الصور: 102.85%

• فهم القراءة (متوسط المستوى): 96.23%

• التفكير البصري: 86.70%

2019

• تصنيف الصور: 103.75%

• فهم اللغة متعددة المهام: 36.08%

• فهم القراءة (متوسط المستوى): 103.27%

• فهم اللغة الإنجليزية: 94.21%

• التفكير البصري: 90.67%

2020

• تصنيف الصور: 104.11%

• فهم اللغة متعددة المهام: 60.02%

• فهم القراءة (متوسط المستوى): 103.92%

• فهم اللغة الإنجليزية: 99.44%

• التفكير البصري: 91.38%

2021

• تصنيف الصور: 104.34%

• الرياضيات (مستوى المنافسة): 7.67%

• فهم اللغة متعددة المهام: 66.82%

• فهم القراءة (متوسط المستوى): 104.15%

• فهم اللغة الإنجليزية: 101.56%

• التفكير البصري: 102.48%

2022

• تصنيف الصور: 103.98%

• الرياضيات (مستوى المنافسة): 57.56%

• فهم اللغة متعددة المهام: 83.74%

• فهم اللغة الإنجليزية: 101.67%

• التفكير البصري: 104.36%

2023

• أسئلة علمية (مستوى الدكتوراه): 47.78%

• الرياضيات (مستوى المنافسة): 93.67%

• فهم اللغة متعددة المهام: 96.21%

• الفهم والاستدلال متعدد الوسائط: 71.91%

2024

• أسئلة علمية (مستوى الدكتوراه): 108.00%

• الرياضيات (مستوى المنافسة): 108.78%

• فهم اللغة متعددة المهام: 102.78%

• الفهم والاستدلال متعدد الوسائط: 94.67%

• فهم اللغة الإنجليزية: 101.78%