ذكاء العملاء وتحليل النصوص 25 مايو 2025 مشروع منشور
Android Galaxy Sentiment Analysis

سير عمل لذكاء مشاعر العملاء

يحلل هذا المشروع تعليقات Reddit المرتبطة بمنتجات Android Galaxy كسير عمل لذكاء العملاء. يقارن اختيارات المعالجة المسبقة وتمثيلات النصوص ونماذج التصنيف لفهم إشارات المشاعر ومفاضلات النمذجة في نقاشات المنتجات.

PythonScikit-learnNLTKTF-IDFWord2VecBiLSTM
شارك المشروع X LinkedIn Email

التحدي

  • آراء المنتجات في النقاشات المفتوحة تكون غير منظمة وغير متوازنة وقصيرة أو غير رسمية أحيانًا.
  • تحليل المشاعر يحتاج معالجة دقيقة للنصوص والتصنيفات والتقييم، وليس الاعتماد على نتيجة نموذج واحدة.
  • مقارنة النماذج التقليدية والعصبية تساعد على فهم الاختيارات الأفضل للبيانات المتاحة.

تصميم النظام

تعليقاتنقاشات منتجات
معالجة النصتنظيف وموازنة
مقارنة نماذجتقليدية وعصبية
تقييمدقة وF1

البيانات والمدخلات

  • 1,000 تعليق Reddit خام مرتبط بنقاشات Android Galaxy / Samsung Galaxy S25.
  • التصنيفات الأصلية تشمل تعليقات إيجابية وسلبية ومحايدة.
  • أزيلت التعليقات المحايدة لمهمة ثنائية، ثم وازن المشروع الفئة الإيجابية ليصل إلى 752 إيجابيًا و752 سلبيًا.

المنهجية التقنية

  • تنظيف النص عبر إزالة HTML، تحويل الحروف، tokenization، إزالة stopwords، وlemmatization.
  • مقارنة Bag of Words وTF-IDF وWord2Vec وتمثيل عصبي داخل نموذج LSTM.
  • تدريب Logistic Regression وSupport Vector Classifier وRandom Forest وBidirectional LSTM.
  • مراجعة مصفوفات الالتباس ومقاييس الفئات لفهم سلوك النماذج.

التقييم والنتائج

مؤشرات رئيسية

1,000 تعليق Reddit خام

مؤشرات رئيسية

752 إيجابي / 752 سلبي بعد الموازنة

مؤشرات رئيسية

F1-score = 97.07% لنموذج SVC + TF-IDF

  • حقق SVC مع TF-IDF أقوى نتيجة تقليدية معلنة بدقة 97.12% وF1-score = 97.07%.
  • قدم Random Forest مع Word2Vec أداءً قويًا بقيمة F1-score = 94.92%.
  • كان نموذج BiLSTM منافسًا لكنه لم يتفوق على أفضل نهج تقليدي في هذه البيانات.

التنفيذ والكود

محور التنفيذ

يربط التنفيذ بين تجهيز البيانات، النمذجة، التقييم، وتفسير النتائج ضمن سير عمل منظم يوضح القرارات التقنية.

الكود المصدري

الكود متاح لاستكشاف تفاصيل التنفيذ وتوسيع التجربة عند الحاجة.

فتح الكود المصدري

نطاق المشروع والاستخدام المسؤول

يركز المشروع على نمذجة اللغة وتقييمها. أي استخدام أوسع يتطلب تحققًا خاصًا بالمجال، تقييمًا للحالات الطرفية، مراقبة، واختبارًا على بيانات حديثة.

التطوير القادم

  • تقييم نماذج مشاعر مبنية على Transformers.
  • توسيع سير العمل إلى تحليل مشاعر متعدد اللغات أو عبر فئات منتجات مختلفة.
  • إضافة أدوات تفسير لمراجعة إشارات النص المؤثرة.

القيمة التقنية

يوضح المشروع نمذجة ذكاء العملاء: تحويل التعليقات غير المنظمة إلى إشارات مشاعر، مقارنة تمثيلات النصوص، وتقييم مفاضلات الأداء بين عائلات نماذج مختلفة.