المجال الإعلامي يحتاج إلى متابعة وتنسيق كبيرين بين عدد من الأعمال، ففي المجال الإخباري مثلا هناك فريق متخصص لمتابعة ما يستجد من أحداث، وهناك فريق لإعداد المواد الإعلامية أو الإخبارية التي سيتم طرحها على المشاهدين، وفي نهاية المطاف هناك المذيع الذي سيقرأ تلك الموضوعات الإخبارية.

داخل كل فريق من فرق العمل الإخباري، يوجد عدد من المراحل، التي يتم تنفيذها، للوصول للصورة النهائية من المادة الإعلامية، فمثلا هناك من يجمع كل ما يدور حول الموضوع محل البحث، وهناك من يقوم بتحديد المواد الأكثر أهمية، وهناك من يقوم بإعداد المسودات الابتدائية، ناهيك عن التدقيق اللغوي والموضوعي، وغيرها من المراحل، التي يمر بها الخبر، ليصل للمتلقي بالصورة التي تعكس هوية تلك الجهة الإعلامية.

هذا العمل المضني لربما في طريقه ليكون أكثر سهولة مما هو عليه، وذلك باستخدام التقنيات الحديثة، كتقنيات الذكاء الاصطناعي.

فعلى سبيل المثال، قام فريق بحث كبير من الشركة الصينية «bytedance» وهي الشركة المالكة للتطبيق الشهير «TikTok»، بتصميم نظام متكامل لروبوت افتراضي يعمل كمراسل ومعد ومذيع إخباري، ليس ذلك فحسب، بل إن النظام يمكنه تقديم الأخبار بعدد من اللغات وليس الصينية فقط.

يتكون نظام شركة «bytedance» من أربع مراحل: في المرحلة الأول يقوم النظام بتحديد المادة الإخبارية بحسب المجال الإعلامي، مثلاً في المجال الرياضي، إذا كان هناك عدد من الفعاليات الرياضية، أو المجال الاقتصادي، بمتابعة تحركات أسعار الأسهم، يقوم النظام في هذه المرحلة بجمع المعلومات الإخبارية، هذا الجزء من النظام يقوم بدوره أيضاً بتحليل وتلخيص جميع المعلومات، التي حصل عليها، ومن ثم إعداد نص لمادة إعلامية، جاهزة للقراءة.

في المرحلة الثانية من النظام، تقوم خوارزمية ذكاء اصطناعي بترجمة المادة الإعلامية، وذلك إلى عدد من اللغات منها الإنجليزية واليابانية، بالاعتماد على بنوك لغوية تحوي أكثر من 100 مليون نص مترجم.

وبعد ذلك وفي المرحلة الثالثة من النظام، تعمل برمجية متخصصة في الرسم، حيث تقوم بتصميم نموذج افتراضي لمذيع، ويتم باستخدام هذه البرمجية، تحديد لغة الجسد، التي تتناسب مع المادة الإعلامية التي سيتم طرحها.

وفي المرحلة الرابعة، يقوم المذيع الافتراضي بقراءة تلك الأخبار، ويمكن جعل ذلك الروبوت الافتراضي يقرأ ذات الأخبار بمختلف اللغات، حيث يتم استخدام خوارزمية تحول النص المكتوب إلى صوت، هذه الخوارزمية تراعي نقاط تشديد الصوت أوالتخفيف في الحديث، بما يتناسب مع النص، ليظهر في نهاية المطاف وكأن المذيع (أو الروبوت الافتراضي) هو من يتحدث فعلا.