Retail Segmentation & Market Basket Analysis
تقسيم عملاء وتحليل قواعد ارتباط
يجمع هذا المشروع بين تقسيم العملاء باستخدام RFM وتحليل سلة المشتريات لربط مخرجات التعلم غير المراقب بقرارات عملية حول العملاء والمنتجات.
PythonPandasScikit-learnK-MeansAprioriAssociation Rules
التحدي
- تحتاج بيانات التجزئة إلى تنظيف قبل أن يصبح سلوك العملاء قابلًا للتحليل.
- تقسيم العملاء وتحليل السلة يجيبان عن أسئلة تجارية مختلفة.
- مخرجات التحليل تحتاج تفسيرًا يربط الشرائح والقواعد بإجراءات عملية.
تصميم النظام
المعاملات
خصائص RFM
شرائح العملاء
قواعد ارتباط
البيانات والمدخلات
بيانات UCI Online Retail تشمل 541,909 صفًا خامًا، 25,900 فاتورة، 4,372 عميلًا، و4,070 منتجًا فريدًا.
المنهجية التقنية
- تنظيف معرفات العملاء المفقودة، الفواتير الملغاة، والكميات والأسعار غير الصالحة.
- بناء خصائص Recency وFrequency وMonetary ومقارنة طرق التجميع.
- بناء مصفوفة معاملات لفرنسا وتشغيل Apriori لاستخراج قواعد الارتباط.
- تفسير الشرائح والقواعد كفرص للاحتفاظ والتنشيط والبيع المتقاطع والولاء.
التقييم والنتائج
مؤشرات رئيسية
541,909 صفًا خامًا
مؤشرات رئيسية
3 شرائح عملاء
مؤشرات رئيسية
23 قاعدة ارتباط نهائية
- أنتج K-Means ثلاث شرائح عملاء بقيمة silhouette 0.4599.
- حددت النتيجة شرائح عملاء منتظمين، خامدين/معرضين للفقد، وعملاء ذوي قيمة عالية.
- أنتج تحليل السلة 23 قاعدة نهائية بعد التصفية بالدعم والثقة والرفع.
التنفيذ والكود
محور التنفيذ
يربط التنفيذ بين تجهيز البيانات، النمذجة، التقييم، وتفسير النتائج ضمن سير عمل منظم يوضح القرارات التقنية.
نطاق المشروع والاستخدام المسؤول
هذا مشروع نمذجة وتقييم مركز. أي استخدام أوسع يحتاج تحققًا على بيانات إضافية، اختبارات متانة، مراقبة، وتقييمًا خاصًا بالسياق المقصود.
التطوير القادم
- مقارنة طرق تجميع إضافية واختبارات استقرار.
- إضافة تحليل cohorts وخصائص قيمة عمر العميل.
- تحويل القواعد إلى مرشحات توصية مرتبة مع قيود تجارية أوضح.
القيمة التقنية
يربط المشروع التعلم غير المراقب بالتفسير التجاري عبر سلوك العملاء وعلاقات المنتجات.