احتلت المنتديات والموسوعات التعاونية موقع الصدارة بين المصادر التي تميل النماذج اللغوية الكبيرة (LLMs) مثل ChatGPT عليها عند تقديم معلومات للمستخدمين، وذلك حسب دراسة صادرة عن Semrush (نشرت في يونيو 2025)، متكئة على تحليل أكثر من 150.000 استشهاد وردت في ردود النماذج اللغوية الكبيرة (LLMs) مثل ChatGPT.

وهدفت الدراسة من هذا التحليل إلى فهم طبيعة المصادر التي تميل هذه النماذج إلى الاعتماد عليها عند تقديم المعلومات للمستخدمين، وكشف أنماط الاستشهاد وتوزيعها بين مواقع المحتوى الذي ينشئه المستخدمون والمواقع المرجعية الأخرى.

وأظهرت النتائج بوضوح أن المنتديات والموسوعات التعاونية تحتل موقع الصدارة، وهو ما يثير نقاشًا واسعًا حول دقة المحتوى المقدم، وحدود الاعتماد على المعرفة الجماعية في مجالات حساسة مثل الصحة والقانون والاقتصاد.


هيمنة المحتوى

أبرز ما تكشفه بيانات Semrush هو تصدر موقع Reddit بنسبة استشهاد بلغت 40.1%، متقدمًا على ويكيبيديا التي حلت ثانية بنسبة 26.3%. وهذا يعكس أن النماذج الذكية تميل إلى استقاء المعرفة من النقاشات المفتوحة التي يشارك فيها المستخدمون، ومن المقالات التعاونية التي يحررها المجتمع الرقمي.

في المرتبة الثالثة ظهر يوتيوب بنسبة 23.5%، متبوعًا بمحرك البحث جوجل بنسبة قريبة بلغت 23.3%.

أما المنصات الأخرى فجاءت بتوزيع متفاوت: يلب (21%)، فيسبوك (20%)، أمازون (18.7%)، تريب أدفايزر (12.5%)، وما بين 11 و12% لمواقع متخصصة بالخرائط مثل Mapbox وOpenStreetMap.

هذه الهيمنة للمحتوى غير الخاضع لتحرير مؤسسي أو أكاديمي مباشر تثير سؤالًا محوريًا: هل تسهم النماذج الذكية في تضخيم ما يتناقله الأفراد على الإنترنت، أم أنها تنجح في تصفية هذه المعرفة الخام وتحويلها إلى استنتاجات دقيقة؟ مخاطر الاعتماد

توضح الدراسة أن الاعتماد المكثف على مواقع مثل Reddit وويكيبيديا يطرح 3 مخاطر رئيسة:

1. المعلومات المضللة: بما أن هذه المواقع لا تخضع لمراجعة خبراء دائمين، فإنها قد تحمل بيانات مغلوطة يعيد الذكاء الاصطناعي إنتاجها بشكل واسع.

2. تضخيم الروايات الشائعة: حين تتكرر بعض الآراء أو القصص في المنتديات، فإن النماذج قد تتعامل معها وكأنها حقائق مستقرة، مما يؤدي إلى طمس معلومات أقل انتشاراً لكنها أكثر دقة.

3. غياب السلطة المرجعية: في مجالات دقيقة مثل الطب والقانون والاقتصاد، تفتقر المصادر الشعبية إلى المعايير التحريرية المطلوبة لتقديم إرشادات موثوقة.

ولعل أكثر الأمثلة إثارة للقلق ما ورد في تقارير عن قيام بعض النماذج باقتراح استخدام مواد كيميائية خطيرة مثل خلط الكلور بالخل لتنقية المياه، وهو ما يؤدي إلى إنتاج غاز سام. مثل هذه الأخطاء ليست هامشية، بل قد تؤثر مباشرة في سلامة المستخدمين. التوزيع والبيانات المكانية

جانب آخر كشفت عنه الدراسة هو اعتماد النماذج على منصات الخرائط الرقمية، حيث سجل Mapbox وOpenStreetMap معدلات استشهاد بلغت 11.3 % لكل منهما. هذه النسبة المرتفعة نسبيًا تشير إلى أن النماذج تعتمد على مصادر مفتوحة لتقديم بيانات جغرافية ومكانية، بدلا من الاعتماد حصريًا على منصات تجارية مغلقة.

لكن هذه المواقع بدورها تعتمد بشكل كبير على مساهمات المستخدمين، ما يفتح الباب أمام احتمالية وجود أخطاء أو بيانات غير مكتملة في بعض المناطق، خاصة تلك الأقل تغطية أو ذات النشاط التطوعي المحدود.

موازنة بين الشعبية والموثوقية

أبرز إشكالية تظهر في نتائج التحليل هي التوتر القائم بين «الشعبية» و«الموثوقية». فالذكاء الاصطناعي يجد نفسه أمام محتوى واسع الانتشار وسهل الوصول، لكنه ليس بالضرورة أكثر دقة.

ويصبح السؤال: هل على المطورين تعديل خوارزمياتهم لإعطاء وزن أكبر للمصادر الأكاديمية والرسمية؟ أم أن الاعتماد على المعرفة التفاعلية يعكس ميزة في إظهار الاتجاهات والرؤى العامة للمجتمع الرقمي؟

تؤكد الدراسة أن هذا التوازن ضروري، خاصة أن المستخدمين لا يميزون دائمًا بين ما هو «شائع» وما هو «صحيح». لذا فإن أي خطأ في الاستشهاد قد يقود إلى مضاعفة أثر المعلومات المغلوطة على نطاق واسع.

استنتاجات ختامية

تشير نتائج تحليل Semrush إلى أن نماذج الذكاء الاصطناعي تعتمد بدرجة كبيرة على محتوى ينشئه المستخدمون، مع هيمنة واضحة لـ Reddit وويكيبيديا. وبالرغم من أن هذه المواقع توفر ثروة معرفية يصعب تجاهلها، فإن طبيعتها التحريرية المفتوحة تجعلها عرضة للتشويه والتحيز.

يتطلب مستقبل الذكاء الاصطناعي تعزيز آليات التحقق من المصادر، وموازنة الاعتماد بين المعرفة التفاعلية والمصادر الأكاديمية أو المؤسسية. وإلا فإن النماذج قد تستمر في إعادة إنتاج «حكمة الحشود»، حتى عندما تكون هذه الحكمة مضللة أو ناقصة.

الترتيب العام لأكثر المواقع استشهادا

(القائمة لا تعكس فقط المواقع التي ينتج عنها أكبر كم من البيانات، بل تشير أيضًا إلى طبيعة التوجهات الثقافية والمعرفية التي تتشكل حولها المحادثات الرقمية)

• Reddit (40.1%)

• Wikipedia (26.3%)

• YouTube (23.5%)

• Google (23.3%)

• Yelp (21.0%)

• Facebook (20.0%)

• Amazon (18.7%)

• Tripadvisor (12.5%)

• Mapbox (11.3%)

• OpenStreetMap (11.3%)

• Instagram (10.9%)

• Mapquest (9.8%)

• Walmart (9.3%)

• eBay (7.7%)

• LinkedIn (5.9%)

• Quora (4.6%)

• HomeDepot (4.6%)

• Yahoo (4.4%)

• Target (4.3%)

• Pinterest (4.2%)