يعد جمع وتصنيف البيانات أمرًا مهمًا، خصوصًا لدراسة الظواهر غير المسبوقة، كفيروس كورونا (كوفيد19) والذي لعبت البيانات فيه دورًا أساسيًا للوصول للقاحات فعالة، غيرت مسار حياة كثيرين على الكرة الأرضية.

إن البيانات التي يتم جمعها حول موضوع ما، خصوصًا الحساسة منها، كالتي تدور حول فيروس كورونا على سبيل المثال، لها أثر في عمليات اتخاذ القرار، بل إنها تشكل في بعض الحالات الركن الرئيس الذي تعتمد عليه تلك القرارات.

هناك عدد من العلوم المترابطة التي ساهمت في التقدم العلمي في مختلف مجالات الحياة، غير أن لكل مجال علمي بعض التحديات التي يواجهها، خصوصًا فيما يتعلق بالنشر العلمي الفعال، فكما تذكر البروفيسورة أريانا قورفيتش (Iryna Gurevych)، هذه التحديات قد تشكل عائقًا أمام سرعة نشر البيانات، التي قد يكون لها أثر كبير في عملية اتخاذ القرار، إذ إن توفر المعلومات في الوقت المناسب يساهم في الحفاظ على حياة كثير من البشر.

تذكر البروفيسورة أريانا أن أحد أهم تحديات النشر العلمي، هو عملية ترميز البيانات التي يتم جمعها، ضمن دراسة ما، فالبيانات الموجودة على الإنترنت كالشبكات الاجتماعية، تعد بيانات خام، تحتاج إلى عملية ترميز وتصنيف وتحليل، وهو ما يتم بشكل يدوي في كثير من الحالات، مما يتطلب كثيرًا من الوقت والجهد والمال.

البروفيسورة أريانا مع فريق بحث بجامعة درامستاد التقنية (Technical University of Darmstadt) اقترحت الاستفادة من التقنيات الحديثة الآلية، لترميز وتصنيف البيانات، وذلك ببناء أنظمة آلية تساعد جامع البيانات، وقد اقترح الفريق البحثي تصميم نظام يعتمد على خوارزميات الذكاء الاصطناعي.

النظام الذي تم تطويره يقوم على التحليل المبدئي للبيانات الخام، وذلك بعد أن يتم تدريبه يدويًا على ترميز البيانات، والهدف من هذه العملية أن تقوم الخوارزمية بمساعدة العاملين الآخرين على البيانات، إذ إن عملية تدريب الخوارزمية المبدئية ليست كافية لتقوم الخوارزمية بذاتها بترميز البيانات الأخرى بشكل آلي، ولكنها كافية لتقوم الخوارزمية باقتراح الرموز المحتملة لكل جزء من البيانات، إذ تقوم بعرض مقترحاتها على الباحثين الآخرين الذين يقومون بالترميز اليدوي للبيانات. عملية اقتراح الترميز الصحيح لكل جزء من البيانات، تساهم في تقليل الجهد والوقت اللازم لتصنيف البيانات، وهذا ما يعني الاستخدام الأمثل للموارد، وبالتالي فإن هذه العملية شبه الآلية تسرع في عملية تجهيز البيانات، مما ينعكس على سرعة النشر العلمي للبيانات، خصوصًا تلك المرتبطة بفيروس كورونا كوفيد19.