من غير المُمكن النّظر إلى الثورة الرّاهنة في مجال الذكاء الاصطناعيّ بوصفها مجرَّد طفرة تقنيّة في مُعالَجة البيانات، بل هي في جوهرها «انعطافةٌ لسانيّة» كبرى تُعيد تعريف علاقة الإنسان باللّغة، وبناءً عليه، علاقة الأُمم بهويّتها الحضاريّة. فمنذ «ميلاد الأنموذج» (أنموذج اللّغة الكبير Large Language Model) في أواخر نوفمبر من العام 2022، وما تلاه من تسارعٍ محموم أوصلنا بحلول مطلع العام 2026 إلى وكلاء أذكياء (AI Agents) تتجاوز قدراتها مجرَّد المُحاكاة إلى التنفيذ الفعليّ نيابةً عن المُستخدِمين، وَجدتِ اللّغةُ العربيّة نفسَها أمام تحدٍّ وجوديّ مزدوج؛ فإمَّا الانخراط الفاعل في هذه الصيرورة الرقميّة، أو الركون إلى هامش الاغتراب الخوارزميّ.

إنَّ الإشكاليّة هنا لا تتعلّق بكفاءة الترجمة الآليّة أو دقَّة التدقيق اللّغوي، بل تمتدُّ لتُلامِس عَصَبَ السيادة المعرفيّة؛ فبينما تُهيْمِن اللّغةُ الإنكليزيّة على أكثر من 90 % من بيانات التدريب في النماذج اللّغوية العالميّة، تظلُّ العربيّة، على الرّغم من ثرائها التاريخي وعُمقها البلاغي، مصنَّفة من ضمن «اللّغات محدودة المَوارِد» في الفضاء الرقمي. هذا التفاوُت ليس تقنيًّا فحسب، بل هو تفاوُتٌ في القدرة على صَوْغِ المستقبل؛ إذ إنَّ اللّغة ليست مجرَّد وعاءٍ للمعلومات، بل هي، كما تُشير نظريّة النسبيّة اللّغوية، «قالبٌ للفكر» ذاته. فكيف يُمكن للغةِ الضّاد أن تُحافِظ على كينونتها في نظامٍ دوليّ باتت تُصاغ فيه المعرفة عبْر خوارزميّاتٍ نَشأت في بيئاتٍ ثقافيّة مُغايرة، وتَحمل في بنيتها العميقة تحيُّزاتٍ قيميّةً قد لا تتوافق مع منظومتنا الحضاريّة؟

يَتجاوز تأثيرُ الذكاء الاصطناعي حدودَ الأدوات المكتبيّة ليَضربَ في عُمق البنية اللّسانيّة للمُجتمعات. ففي خِضَمِّ الاعتماد المفرط على نماذج لغويّة مُستورَدة، نُواجِه خطرَ ما يُمكن تسميته بـ«التسطيح اللّغوي»؛ حيث تفقد اللّغة قدرتَها على التعبير عن الخصوصيّات الثقافيّة والجماليّة، وتتحوَّل إلى مجرَّد أداةٍ نفعيّة مسطَّحة. ومن ناحيةٍ أخرى، تسودُ حالةٌ من «السَّيْرِ نومًا رقميًّا» مع استخدام هذه النماذج، التي تُنتج تارةً صيَغًا يُمكن ملاحظتها تتضمَّن، مثلًا، تنوين الفتح على الحرف الأخير، وتارةً أخرى على الحرف الذي يَسبقه. وليست الإشكاليّة هنا في وجود هذا التنوُّع الهائل للمعلومات التي ما انفكَّت تملأ منشورات وتغريدات منصَّتَيْ الفيسبوك وإكس (تويتر سابقًا) من قِبل مُستخدِمين عرب، فهو في واقع الأمر انعكاسٌ لخلافٍ إملائي قديم بين مدرسة الخليل وسيبويه التي تَضع التنوين على الحَرف قَبل الألف، ومدرسة أبي عمرو الداني التي تُجيز وضعَه على الألف نفسها، وكلاهما معتبَر في تاريخ النحو العربي.. إنّما تكمن المشكلة الحقيقيّة في المُستخدِم الذي يتلقَّى هذه المُخرجات بوصفها قالبًا جاهزًا لا يَستدعي فَهمًا أو تمييزًا؛ وهو ما يُجسِّد أحد أخطر مظاهر الاغتراب الخوارزمي، أي تعطيل الوعي اللّغوي لمصلحة الامتثال الآلي، بما يُحوِّل اللّغةَ من قالبٍ للفكر إلى مُنتَجٍ استهلاكيٍّ خاضعٍ لمنطق الخوارزميّة.


والأخطر من ذلك أنَّ النماذج اللّغويّة الكبرى ليست كياناتٍ مُحايِدة؛ فهي «مستودعات قيميّة» تَعكس تحيُّزاتِ بياناتِ تدريبها. عندما تتعلَّم الآلةُ العربيّة من خلال ترجماتٍ ركيكة أو محتوىً رقميّ ضعيف الجودة، فإنَّها تُعيد إنتاج لغة «هجينة» تَفتقر إلى الجزالة والعُمق البلاغي الذي يُميِّز التراث اللّغوي العربي. الخطورة هنا تكمن في أنَّ هذه اللّغة الهجينة قد تُصبح هي «المعيار» الجديد لدى الأجيال الرقميّة؛ ما يؤدِّي إلى تآكُل الذائقة اللّغوية وانفصال الوعي الجماعي عن الجذور التراثيّة التي شكَّلت الهويّةَ الثقافيّة للأمَّة عبر القرون. وتتضاعف هذه المعضلة حين نُدرِك أنَّ ما يُطرح اليوم من نماذج ذكاء اصطناعي، وإن كان مُذهلًا في قدراته الظاهرة، لا يزال بعيدًا عن الوصول إلى فهمٍ حقيقي لـروح اللّغة وسياقاتها التاريخيّة والاجتماعيّة والوجدانيّة.

إشكالية الازدواج اللغوي

تُشير التقديرات التقنيّة للعام 2025 إلى أنَّ المحتوى العربي عالي الجودة لا يتجاوز 1 % من المحتوى العالَمي على الإنترنت، على الرّغم من أنَّ المُتحدِّثين بالعربيّة يُمثِّلون نحو 5 % من سكّان العالَم. هذه الفجوة تَخلق ما يُشبه «الأنيميا المعرفيّة» في النماذج الذكيّة العاملة باللّغة العربيّة. فالآلة التي تُدرَّب على بياناتٍ هزيلة أو ملوَّثة بالركاكة اللّغوية لن تُنتِج إلَّا مُخرجاتٍ باهتة تعكس هذا الفقر. ومن هنا، يُصبح السؤال الجوهري: كيف يُمكن استعادة السيادة على لغتنا في فضاءٍ رقميّ يتحكَّم فيه آخرون؟ الإجابة تبدأ من بناء «مستودعات بيانات سياديّة» تضمُّ أمَّهات الكُتب العربيّة، والأبحاث العلميّة الرصينة، والنّتاج الثقافي المُعاصِر الجادّ، لتكونَ هي الوقود الحقيقي لذكاءٍ اصطناعي عربيّ المنشأ والروح والهدف.

غير أنَّ مسألةَ استعادة السيادة لا يُمكن أن تكون مجرَّد عمليّة تقنيّة؛ فهي تتطلَّب فَهْمًا عميقًا للتحدِّيات البنيويّة التي تَطرحها اللّغة العربيّة أمام المنطق الخوارزمي. أولى هذه التحدِّيات هي إشكاليّة «الازدواجيّة اللّغويّة» (Diglossia)؛ حيث يَعيش العقلُ العربي حالةً من التراوُح المُستمرّ بين الفصحى (لغة البيان والتدوين والخطاب الرسمي) والدّارجات المحلِّيّة (لغة الوجدان والحياة اليوميّة والتواصُل الحميمي). النماذج الحاليّة، على الرّغم من تطوُّرِها الملحوظ، لا تزال تعاني في جسر هذه الفجوة، ما يولِّد نوعًا من «الانفصام الرقمي» بين ما تُنتجه الآلةُ وما يحتاجه المُستخدِم فعلًا. فالآلة قد تنجح في صَوْغِ بيانٍ رسمي ببرودٍ تقني، لكنَّها تَفشل في استيعاب التلميحات الثقافيّة أو الأمثال الشعبيّة أو التعابير الاصطلاحيّة التي تشكِّل جوهر التواصُل الإنساني العربي في سياقاته المُختلفة. هذا يعني أنَّ التحدّي الحقيقي يكمن في تطوير نماذج «متعدِّدة المستويات» قادرة على فهْم التداخُل بين الفصحى والعامِّيّة، وعلى التنقُّل بسلاسةٍ بينهما من دون أن تُضحِّي بجماليّاتِ أيٍّ منهما أو تَفرض تراتبيّةً قيميّةً بينهما.

وإلى جانب الازدواجيّة، تَطرح البنية المورفولوجيّة للعربيّة تحدِّيًا خوارزميًّا من نوعٍ آخر؛ فاللّغة العربيّة تتميَّز بنظامٍ اشتقاقيّ جذريّ يختلف جوهريًّا عن اللّغات الهندوأوروبيّة التي صُمِّمَت على أساسها معظم الخوارزميّات الحاليّة. فعمليّة الترميز (Tokenization) التي تَعتمدها هذه النماذج غالبًا ما تُفتِّت الكلمة العربيّة مُفقِدةً إيّاها ميزتها الصرفيّة والدلاليّة؛ وهذا ما يؤدّي إلى استهلاك طاقةٍ حوسبيّة أكبر بمُخرجاتٍ أقلّ دقّةً وفهْمًا للسياق. إنّنا بحاجة، إذن، إلى هندسةٍ لغويّة عربيّة تُعيد بناء الخوارزميّات وفْقَ مفهومَيْ الجذر والوزن كقاعدة للذكاء، لا مجرَّد مُعالَجة الكلمات ككُتلٍ إحصائيّة صمّاء. هذا بدوره يتطلَّب تعاونًا وثيقًا بين اللّسانيّين العرب ومُهندسي البيانات، بحيث تُترجَم معرفة القرون بالنحو والصرف العربي إلى بنىً خوارزميّة قادرة على مُحاكاة هذا الثراء الاشتقاقي. وهذا التحدّي اللّساني يَكتسبُ بُعدًا أمنيًّا يُجسّده مثالُ السياسي الهندي «مانوج تيواري Manoj Tiwari»؛ حيث يُشير مصطفى سليمان ومايكل باسكار في كتابهما «الموجة القادمة: التكنولوجيا والقوّة وأعظم معضلة في القرن الحادي والعشرين» (ص161) إلى خطورة توظيف التزييف العميق في خِطابات مانوج تيواري المُتمثّل باستخدامه، من خلال خوارزميّات الذكاء الاصطناعي، لهجاتٍ هنديّة مُختلفة لا يتقنها أساسًا، لأهدافٍ انتخابيّة في الهند سنة 2020، ما يَستوجِب سيادةً لغويّة تَحمي وجدانَنا من الاختراق الخوارزمي.

مبادرات عربية رائدة

وإذا كانت اللّغةُ في العصر الرقمي قد تحوَّلت من مجرَّد وسيلة تواصُل إلى «أصل إستراتيجي» في صراع القوى الكبرى، فإنَّ السؤال الذي يَطرح نفسَه بإلحاح هو: مَن يَملك القدرة على صَوْغِ السرديّات في عالَمٍ تتحكَّم فيه الخوارزميّات؟ الجواب يبدو بديهيًا: من يَمتلك الأنموذج اللّغوي الأقوى، يَمتلك القدرةَ على توجيه الرأي العامّ العالَمي، وعلى فرْض رؤيته للعالَم بوصفها «الحقيقة الموضوعيّة». إنَّ الاعتماد الكلِّي على نماذج لغويّة تطوِّرها شركاتٌ تكنولوجيّةٌ كبرى أو ناشئة في وادي السيليكون أو بكين يَضَع الأمنَ الثقافي العربي في مهبّ الريح؛ لأنَّ هذه النماذج تعمل «كمرشِّحات معرفيّة» تُحدِّد ما هو مقبول أو مرفوض، ما هو صحيح أو خاطئ، ما هو جدير بالظهور أو بالإخفاء، وكلّ ذلك وفقًا لمعايير المُجتمعات التي أَنتجتها، لا وفقًا لقيَمِنا أو احتياجاتِنا. ومن ثمَّ، فإنَّ الحديث عن «السيادة الرقميّة» يظلُّ ناقصًا ومبتورًا ما لم يَشمل «السيادة اللّغوية»؛ تلك التي تَضمن لنا إنتاجَ معرفةٍ تُعبِّر عن هويّتِنا وقيَمِنا ورؤيتِنا للعالَم من دون وصاية خارجيّة أو هيْمنة ثقافيّة مُقنَّعة بالتقنيّة.

لذلك، ليس من قبيل المصادفة أن نشهد في العامَيْن الأخيرَيْن بروزَ مُبادَراتٍ عربيّة واعِدة تَهدف إلى بناء نماذج لغويّة عملاقة باللّغة العربيّة، مثل نموذج «جيس» في الإمارات، ونموذج «هيوماين تشات» في السعوديّة، إلى جانب نموذج «فنار» في قطر. هذه الخطوات ليست مجرَّد مُحاكاةٍ للغرب أو للصين، بل هي «فعل مقاوَمة رقمي» يسعى إلى توطين التكنولوجيا وجعْلِها تتحدَّث بلسانِنا، وتفكِّر، قدر الإمكان، بعقولِنا، وتَستجيب لاحتياجاتنا الحقيقيّة. غير أنَّ نجاحَ هذه المُبادرات يتوقَّف على قدرتِها على التكامُل من ضمن منظومة معرفيّة وتعليميّة شاملة. وفي غمرة هذا السعي نحو التوطين التقني، يتطلَّب التعاملُ الرشيد مع الذكاء الاصطناعي في سياق اللّغة العربيّة تَجاوُزَ عقليّة «المُستهلِك السلبي» والتحوُّل نحو «المُنتِج المعرفي» الذي يَمتلك أدواتَ صناعةِ مُستقبله. فنحن أمام فرصةٍ تاريخيّة نادرة لإعادة بعْث التراث العربي الضخم من خلال الرقْمَنة الذكيّة، وتحويل المكتبة العربيّة، بكلّ ما تحتويه من كنوزٍ معرفيّة تمتدّ عبر أربعة عشر قَرنًا، إلى مادَّةٍ حيّة تُثري الحوارَ الحضاري العالَمي. هذا يَستدعي ثورةً حقيقيّة في مناهجنا التعليميّة؛ حيث يلتقي عالِمُ اللّغة مع مهندس البيانات، ويُصبح التكوين في «اللّسانيّات الحاسوبيّة» أولويّةً قصوى. فتكوينُ جيلٍ من «اللّسانيّين الحاسوبيّين» هو وحده الضمانة لترويضِ الآلة وجعْلِها تَفهم بلاغةَ الجرجاني وعُمق ابن خلدون ودقَّةَ سيبويه.

في المحصّلة، إنَّ مصير اللّغة العربيّة في عصر الذكاء الاصطناعي ليس حتميّةً تقنيّة مفروضة، بل هو خيارٌ سياسيّ وإستراتيجيّ يتوقَّف على قدرة الأنظمة العربيّة على إرساء «السيادة اللّغوية» كركيزةٍ أساسيّة للسيادة المَعرفيّة والثقافيّة. فإمَّا أن تَنخرطَ لغةُ الضّاد فاعلةً ومُبدِعةً في صنْعِ الخوارزميّات وتشكيلِ المُستقبل الرقمي، أو سَتَجِدُ نفسَها محصورةً في هامش «الاغتراب الرقمي»، حيث تُصبح لغةُ الأمَّة مجرَّدَ بياناتٍ خامّ تُوظَّف لخدمة أجنداتٍ حضاريّة مُغايِرة، وحيث يتآكل الوعيُ اللّغوي جيلًا بَعد جيل لمصلحة الامتثال الآلي والاستهلاك السلبي.

*باحث من مصر

* ينشر بالتزامن مع دورية أفق الصادرة عن مؤسسة الفكر العربي.