تحديد الجنس على أساس الدلالات من خلال المحتويات التي ينشئها المستخدمون
الكلمات المفتاحية:
تحديد الجنس، تحديد ملف تعريف المستخدم، المحتوى الدلالي، المحتوى الذي ينشئه المستخدمالملخص
إن جنس المستخدم هو معلومات بالغة الأهمية للخدمات والتطبيقات المخصصة في الشبكات الاجتماعية عبر الإنترنت. وهو يؤثر على مجالات مثل أنظمة التوصية والإعلان واكتشاف الاتصال. ومع ذلك، قد تكون معلومات جنس المستخدم مخفية أو غير محددة في الشبكات الاجتماعية عبر الإنترنت، مما يؤدي إلى عدم الدقة أو القيود في تطبيقات مختلفة. تساهم التفاعلات اليومية لمليارات المستخدمين على الشبكات الاجتماعية عبر الإنترنت مثل Flickr في إنشاء كميات هائلة من المحتوى الذي ينشئه المستخدم. يتضمن هذا المحتوى وسائط متعددة مثل الصور ومقاطع الفيديو والمعلومات النصية. الهدف الأساسي من هذه الورقة البحثية هو معالجة تحدي تحديد جنس المستخدمين متضمناً نهجن تقنية بيانات قائمة على الدلالات. إن استخدام نظام وسم الصور شبه التلقائي يعني عملية يتم فيها تصنيف الصور باستخدام الأتمتة، مما قد يحسن الكفاءة والدقة. نستخدم خوارزميتين للتصنيف لتحديد الجنس: Naive Bayes وSVM، حيث يتم تمثيل البيانات عادةً كمتجهات مميزة. تظهر نتائجنا التجريبية على أكثر من 149700 مستخدم لـ Flickr دقة تزيد عن 84٪ لتحديد الجنس. ويشير هذا إلى أن الجمع بين خوارزميات Naive Bayes وSVM، مع تمثيل البيانات كمتجهات مميزة، أثبت فعاليته في تصنيف الجنس بناءً على المحتوى الذي ينشئه المستخدم.