هناك كم كبير من المعلومات التي يتم نشرها على عدد من الوسائط الإلكترونية، وخصوصاً منها ما ينشر على صفحات الإنترنت، والتي بتصفحها قد تحتوي على كثير من الفائدة للمستخدم.

الكم الكبير من المعلومات، التي تنشر على مواقع الإنترنت، دعت إلى ابتكار التقنيات، التي تساهم في تسهيل الوصول للمعلومات المطلوبة، في وقت وجيز، إذ تنوعت هذه التقنيات بين محركات البحث المجانية، إلى الخدمات الخاصة، التي تقدمها بعض مواقع المعلومات لعملائها بمقابل مادي.

من التقنيات التي تستخدم للوصول للمعلومات، ما يطلق عليها تقنيات استخراج العلاقات النصية، وهي عدد من الخوارزميات، التي يمكنها البحث داخل النص، واستخراج ليس فقط المعلومات، بل حتى العلاقات، التي تربط تلك المعلومات مع بعضها بعضا، فمثلا يمكن استخراج معلومة عن شخص بأنه يعمل في مجال التسويق، ولكن استخراج العلاقات يعني أنه بالإمكان استخراج اسم الشركة التي يعمل بها ذلك الشخص.


تقنيات استخراج المعلومات تتنوع، بين تلك التي توظف البحث المباشر في النص عن العلاقات، إلى تلك التي تستخدم خوارزميات الذكاء الاصطناعي، والتي يمكنها اكتشاف العلاقات بين المعلومات في كم ضخم من البيانات.

ولكن أنظمة استخراج المعلومات من البيانات، ليست بمنأى عن التحديات التي تواجه التقنية عموما، فقد وجد فريق بحثي كبير من جامعة كاليفورنيا (University of California) ومعهد جورجيا للتكنولوجيا (Georgia Institute of Technology) أن خوارزميات استخراج المعلومات قد تواجه عددا من التحديات، والتي من أحدها مشكلة التحيز أثناء العمل.

وجد الباحثون أن بعض خوارزميات الذكاء الاصطناعي، تكون متحيزة لجنس دون الآخر، حين استخراج المعلومات، فقد لوحظ أن تلك الخوارزميات، يمكنها استخراج العلاقات بين المعلومات، إذا كانت العنصر محل البحث مذكراً، بينما تقل كفاءة الخوارزمية، حين يكون البحث عن علاقة مؤنث داخل النص.

التحيز لجنس دون الآخر، تعد مشكلة تواجه العديد من الأنظمة، التي توظف تقنيات الذكاء الاصطناعي بداخلها للعمل، ولكن هذا التحيز كان البعض يعتقد أنه يقتصر على تلك الحالات التي يُطلب فيها من الخوارزمية اتخاذ القرار، كخوارزميات التعرف على الوجه، ولكن الباحثين وجدوا أن مشكلة التحيز قد تمتد لتشمل حتى الخوارزميات التي تبحث داخل النصوص، وهو ما يدعو إلى الحاجة لتضافر جهود الباحثين لمواجهة هذا التحدي.