ولم يمض بعدها إلا بضعة أشهر حتى أطلقت شركة OpenAI المنافس الشهير وخوارزمية اللغة التوليدية المعروفة (GPT-2) . توالت بعدها الإنجازات في تسخير خوارزميات اللغة حتى ظهر روبوت الدردشة (ChatGPT) والذي تستند عليه اليوم كثير من التطبيقات الذكية ومن ضمنها تلك التي تولّد بيانات صوتية أو صورية. فيظهر لنا أنه عندما هُندست هذة الخوارزميات لترقى بفهم تعقيد اللغة البشرية الطبيعية، أصبحت قادرة على التوليد بشكل يحاكي الطريقة التي يولّد بها الإنسان أفكاره ويعبر عنها بأشكال مختلفة؛ فولّدت لنا الخوارزميات مختلف المنتجات التقنية.
حيث أن عملية هندسة البيانات اللغوية وتحويلها إلى بيانات رقمية تُغذى بها خلايا الشبكات العصبية الإصطناعية من أجل معالجتها رياضياً وحساب أوزانها بمعادلات رياضية؛ مع الأخذ بعين الإعتبار العلاقة الترابطية النحوية بين مفرداتها هي عملية معقدة جداً شغلت المجتمع التقني وبُذلت الجهود الحثيثة من أجل تفكيك هذا التعقيد والخروج بحلول رقمية لفهم اللغات على إختلاف أشكالها وتفسير العلاقات اللغوية "المُرقمنة". فأصبحت النصوص التوليدية كأنها تصدر من كاتب بشري "خبير" ممسكاً بقلمه السحري ويجيب عما يُسأل عنه، حتى أصبح كثير من المستخدمين يثق ثقة عمياء بهذا الكاتب الآلي - في الأصل - لإنجاز كثير من مهامهم خاصةً الكتابية منها ومن ثم نسبتها إليهم. ومن هنا أصبحنا نواجه قضية جدلية وهي قضية تحديد هوية الكاتب.
هذه القضية في الواقع أزلية آثارت ضجة في عدد من الحُقب الزمنية كان أشهرها قضية التحقق من كتابات المؤلف الشهير وِلْيَمْ شكسبير. ونستطيع القول بأن هذه الفترة كانت بداية ظهور ملامح علم معالجة اللغات الطبيعية، أهمها قياس النهج الأسلوبي في الكتابة. فقد أثار بعض الفلاسفة شكوكا حول هوية الكاتب الحقيقي خلف مؤلفات شكسبير حيث كانت الفرضية المطروحة وقتها أنه لا يمكن أن تكون هذة الكوكبة من الإبداعات والخيالات الأدبية هي نتاج عبقرية رجل واحد فقط. وتم جمع الدلائل اللغوية لكن كانت تتأرجح هذه الدلائل ما بين كفتي الإثبات والنفي؛ خاصة عند إعتبار طبيعية أدوات التحليل والمعالجة اللغوية آنذاك.
وهنا اليوم يتكرر ظهور القضية بإختلاف الشخصيات وإختلاف المشهد المسرحي ككل.
فاليوم يعتمد الإنسان على مؤلفات الآلة التوليدية بشكل يتم فيه دفن الأفكار والإبداع البشري، فأصبح لزاماً دراسة هذة الممارسات الجديدة وتطوير الحلول الرقمية التي تحّد منها.
وبالفعل إنشغلت المجتمعات البحثية في تسخير الخورازميات الذكية، والتعمق في الدلائل اللغوية الرقمية من أجل قضية تحديد هوية كاتب النص. هذه القضية لها أبعاد إجتماعية وتعليمية وفكرية، بل وأيضاً لها أبعاد أمنية خاصة فيما يتعلق بالبحث الجنائي الرقمي في بيانات شبكة الويب العالمية والتي غالباً ماتكون مجهولة الهوية أو المصدر.
فما بين دراسات الأسلوبية الإحصائية في الكتابة وما بين دراسات تحليل المفردات اللغوية النحوية، وإمتداداً إلى خوارزميات الآلة وقدرتها على فهم الأنماط والتراكيب اللغوية في النصوص المختلفة، يتم تسخيركل ذلك من أجل إكتشاف أوالتنبؤ بهوية كاتب النص أو سماته الشخصية.
فالنصوص المُولّدة آلياً - حالياً - تحاكي فقط السمات السطحية في الكتابة البشرية ما يجعلها تفتقر إلى العمق الفكري الذي يستطع البشر التعبير عنه والذي يكون ممزوج بالعاطفة والتجربة الشخصية التي تنعكس على الأسلوب الكتابي المميز لكل مؤلف. بينما النصوص التوليدية مستوحاة من التجربة فقط، أوما تسمي بعملية التدريب في الشبكات العصبية الإصطناعية، فتتولد نصوص منطقية "رقمية " متجردةً من العمق الفكري والعاطفي. كما أن النصوص المُولّدة آلياً تفتقر إلى الأصالة والتي هي من أهم سمات الإبداع البشري، وكأنها كتابات ذات قوالب تملأ بها محتوياتها التوليدية أو نصوص تفرط في إستخدام الكليشيهات. ناهيك عن قضية التحيز الفكري الذي يصاحب النصوص المُولّدة آلياً بسبب ماقد تحمله بيانات التدريب الآلي من توجّه ديني أوثقافي، أو حتى السرد التاريخي المغلوط فيها.
فهل تظافر الجهود البحثية والتقنية في تطوير خوارزميات معالجة اللغات الطبيعية سيُمكن قطارالذكاء الإصطناعي من الوصول إلى محطة السمات الإبداعية الحقيقية ويحمل معه النضج الأدبي البشري على متن حمولته لينطلق بها الى محطات المجهول العلمي؟ وهل سنرى كتابات مولّدة ألياً تنافس كتابات مثل كتابات وِلْيَمْ شكسبير الشهيرة في إبداعاتها وخيالاتها؟
فالكثير من القضايا الجدليه الأخرى اليوم تُناقش هذا التطورالحاصل في مجال الذكاء الإصطناعي التوليدي، وتحتاج إلى تظافر الجهود للخروج بتوصيات مدروسة في آليات الإستفادة من الذكاء الإصطناعي التوليدي؛ بما يتناغم مع تجنيد الخوارزميات اللغوية والإستشراف البشري للتنبؤ بمستقبل الذكاء الإصطناعي التوليدي.