البيانات التي يتم جمعها من منصات الوسائط الاجتماعية تلتقط مجموعة متنوعة من المعلومات وتأتي في عدة تنسيقات مختلفة مع طرق وصول ومستويات مختلفة من التوفر، ويمكن أن تكون بيانات الوسائط الاجتماعية نصية بحتة أو تتضمن مكونات صوتية أو مرئية.

يمكن الوصول إلى البيانات من مواقع التواصل الاجتماعي مباشرة من خلال النظام الأساسي نفسه أو من خلال مجموعة من الطرق المؤتمتة جزئيًا إلى بالكامل، ويمكن أيضًا أن تتغير أنواع المعلومات المحددة المتاحة بسرعة في عالم وسائل التواصل الاجتماعي. وتُصدر الأنظمة الأساسية أحيانًا تغييرات كبيرة في كل من الميزات والوصول مع القليل من التحذير أو دونه، فما هي المحددات والعمر الزمني لبيانات المنصات الرقمية التي تستخدم في تصنيفها.

لا يتم تعريف وسائل التواصل الاجتماعي بنوع واحد تبعًا للنظام الأساسي أو البيانات وإنما هناك قائمة من المنصات الشعبية الطويلة التي يمكن أن تتغير بسرعة، وتشمل أنواع الوسائط أو المنصات الاجتماعية الشائعة المعترف بها على نطاق واسع، وذلك بناء على محددات نوع البيانات التالية:

المدونات (مثل Blogger وWordPress وTumblr).

المدونات الصغيرة (مثل Twitter).

خدمات الشبكات الاجتماعية (مثل Facebook).

مواقع مشاركة المحتوى والمناقشة (مثل YouTube وReddit وWhats App).

عوالم افتراضية (مثل Second Life).

عادةً ما يتم تنظيم بيانات الوسائط الاجتماعية باستخدام بعض العناصر المشتركة:

• اسم المستخدم: من؟ يقول ماذا؟.

• المحتوى: ما يقال أو يشارك، أحيانًا يصنفه المستخدم مسبقًا برمز «هاشتاج» أو «#» (على سبيل المثال، يشير #survey على الأرجح إلى أن المشاركة مرتبطة باستطلاعات الرأي).

• الوقت والتاريخ: وقت نشر المنشور.

• الموقع: معلومات تم الإبلاغ عنها ذاتيًا حول مكان إقامة المستخدم أو مكان نشر المنشور.

• المراجع: تشير إلى مستخدمين أو مواقع أخرى.

• شبكة المستخدم: من يرتبط به مستخدم آخر أو الاهتمامات والمحتوى الذي يتابعه (أي الشبكة الشخصية).

غالبًا ما يتم اشتقاق عناصر البيانات الأخرى، مثل مشاعر العبارات (إيجابية أو سلبية أو محايدة) وموضوع المحتوى المستنتج والصلات بين المستخدمين والعناصر والمعلومات الديموغرافية للمستخدمين الفرديين.