Android Galaxy Sentiment Analysis

ذكاء العملاء وتحليل النصوص 25 مايو 2025 مشروع منشور

سير عمل لذكاء مشاعر العملاء

يحلل هذا المشروع تعليقات Reddit المرتبطة بمنتجات Android Galaxy كسير عمل لذكاء العملاء. يقارن اختيارات المعالجة المسبقة وتمثيلات النصوص ونماذج التصنيف لفهم إشارات المشاعر ومفاضلات النمذجة في نقاشات المنتجات.

عرض الكود العودة للمشاريع

PythonScikit-learnNLTKTF-IDFWord2VecBiLSTM

شارك المشروع

التحدي

آراء المنتجات في النقاشات المفتوحة تكون غير منظمة وغير متوازنة وقصيرة أو غير رسمية أحيانًا.
تحليل المشاعر يحتاج معالجة دقيقة للنصوص والتصنيفات والتقييم، وليس الاعتماد على نتيجة نموذج واحدة.
مقارنة النماذج التقليدية والعصبية تساعد على فهم الاختيارات الأفضل للبيانات المتاحة.

تصميم النظام

تعليقاتنقاشات منتجات

معالجة النصتنظيف وموازنة

مقارنة نماذجتقليدية وعصبية

تقييمدقة وF1

البيانات والمدخلات

1,000 تعليق Reddit خام مرتبط بنقاشات Android Galaxy / Samsung Galaxy S25.
التصنيفات الأصلية تشمل تعليقات إيجابية وسلبية ومحايدة.
أزيلت التعليقات المحايدة لمهمة ثنائية، ثم وازن المشروع الفئة الإيجابية ليصل إلى 752 إيجابيًا و752 سلبيًا.

المنهجية التقنية

تنظيف النص عبر إزالة HTML، تحويل الحروف، tokenization، إزالة stopwords، وlemmatization.
مقارنة Bag of Words وTF-IDF وWord2Vec وتمثيل عصبي داخل نموذج LSTM.
تدريب Logistic Regression وSupport Vector Classifier وRandom Forest وBidirectional LSTM.
مراجعة مصفوفات الالتباس ومقاييس الفئات لفهم سلوك النماذج.

التقييم والنتائج

مؤشرات رئيسية

1,000 تعليق Reddit خام

مؤشرات رئيسية

752 إيجابي / 752 سلبي بعد الموازنة

مؤشرات رئيسية

F1-score = 97.07% لنموذج SVC + TF-IDF

حقق SVC مع TF-IDF أقوى نتيجة تقليدية معلنة بدقة 97.12% وF1-score = 97.07%.
قدم Random Forest مع Word2Vec أداءً قويًا بقيمة F1-score = 94.92%.
كان نموذج BiLSTM منافسًا لكنه لم يتفوق على أفضل نهج تقليدي في هذه البيانات.

التنفيذ والكود

محور التنفيذ

يربط التنفيذ بين تجهيز البيانات، النمذجة، التقييم، وتفسير النتائج ضمن سير عمل منظم يوضح القرارات التقنية.

الكود المصدري

الكود متاح لاستكشاف تفاصيل التنفيذ وتوسيع التجربة عند الحاجة.

فتح الكود المصدري

نطاق المشروع والاستخدام المسؤول

يركز المشروع على نمذجة اللغة وتقييمها. أي استخدام أوسع يتطلب تحققًا خاصًا بالمجال، تقييمًا للحالات الطرفية، مراقبة، واختبارًا على بيانات حديثة.

التطوير القادم

تقييم نماذج مشاعر مبنية على Transformers.
توسيع سير العمل إلى تحليل مشاعر متعدد اللغات أو عبر فئات منتجات مختلفة.
إضافة أدوات تفسير لمراجعة إشارات النص المؤثرة.

القيمة التقنية

يوضح المشروع نمذجة ذكاء العملاء: تحويل التعليقات غير المنظمة إلى إشارات مشاعر، مقارنة تمثيلات النصوص، وتقييم مفاضلات الأداء بين عائلات نماذج مختلفة.