Asthma RAG Diagnostic Assistant
تجربة تفكير تشخيصي قائمة على الأدلة
يدرس هذا المشروع أثر الاسترجاع وتصميم الأوامر على التفكير المرتبط بالربو في بيئة مضبوطة. يقارن بين أوامر مباشرة، سلسلة تفكير، وسلسلة تفكير محايدة على حالات مرضية اصطناعية مع استرجاع محلي ومقاييس تقييم.
PythonLangChainFAISSHuggingFaceQwen2.5RAG
التحدي
- قد تتأثر الاستجابات ذات الطابع التشخيصي بالأوامر الموجهة.
- الأعراض المشابهة للربو تحتاج مقارنة مع تفسيرات بديلة مثل الحالات القريبة من COPD.
- التجربة المضبوطة تحتاج حالات اصطناعية، سياقًا مسترجعًا، ومقاييس تكشف الطلاقة والتكرار.
تصميم النظام
حالة اصطناعية
استرجاع FAISS
نمط الأمر
استجابة Qwen محلية
البيانات والمدخلات
قاعدة معرفة مخصصة عن الربو، تقسيم نصي متدرج، تضمينات sentence-transformers، مخزن FAISS، و10 حالات مرضية اصطناعية موجبة وسالبة.
المنهجية التقنية
- بناء فهرس استرجاع محلي للسياق المرتبط بالربو.
- مقارنة الأوامر المباشرة، سلسلة التفكير، وسلسلة التفكير المحايدة.
- تقييم الاستجابات باستخدام BLEU وROUGE-L وMETEOR وDistinct-2 وPerplexity وSelf-BLEU.
التقييم والنتائج
مؤشرات رئيسية
10 حالات مرضية اصطناعية
مؤشرات رئيسية
3 أساليب للأوامر
مؤشرات رئيسية
BLEU / ROUGE-L / METEOR / Self-BLEU
- ساعدت سلسلة التفكير المحايدة على تحسين الموضوعية في حالة سالبة قريبة من COPD.
- أضافت Perplexity وSelf-BLEU وDistinct-2 إشارات مفيدة تتجاوز مقاييس التطابق اللفظي.
- يوضح المشروع أن المقاييس اللفظية وحدها لا تكفي للحكم على جودة التفكير.
التنفيذ والكود
محور التنفيذ
يربط التنفيذ بين تجهيز البيانات، النمذجة، التقييم، وتفسير النتائج ضمن سير عمل منظم يوضح القرارات التقنية.
نطاق المشروع والاستخدام المسؤول
يوضح المشروع النمذجة والتقييم على بيانات ذات طابع صحي، ولا يُستخدم لاتخاذ قرارات سريرية. أي استخدام طبي فعلي يتطلب تحققًا خارجيًا، مراجعة مختصين، معايرة، وضوابط تنظيمية.
التطوير القادم
- إضافة معايير تقييم أقوى للتفكير السريري.
- مقارنة استراتيجيات استرجاع ونماذج محلية أكبر.
- فصل دعم الاستشهادات عن طلاقة الإجابة النهائية.
القيمة التقنية
يربط المشروع بين RAG وتصميم الأوامر والتفكير التشخيصي ومنهجية التقييم في سياق حساس للسلامة.