وطوّر باحثون نظاماً يعتمد على النماذج اللغوية الكبيرة لتحليل منشورات المستخدمين على منصات مثل Reddit وHacker News، من خلال دراسة أسلوب الكتابة والتعليقات والنكات والإشارات التعليمية.
ويحوّل النظام هذه البيانات إلى نموذج رياضي للملف الشخصي، ثم يقارنها بملايين الملفات الشخصية الأخرى، مثل الحسابات الموجودة على منصة LinkedIn، للبحث عن تطابقات محتملة.
وأظهرت الاختبارات أن النظام نجح في ربط الحسابات المجهولة بهويات حقيقية بدقة بلغت 67 %، مع مستوى ثقة يصل إلى 90 %.
كما تبين أن تكلفة العملية منخفضة نسبياً، إذ تتراوح بين دولار واحد وأربعة دولارات لكل حساب يتم كشف هويته.