📄 النص الكامل للصفحة
ستُستخدم الآن شجرة القرار للتنبؤ بالتشخيص الأكثر احتمالاً للمرضى في مجموعة الاختبار. تُستخدم مجموعة الاختبار لتقييم أداء النموذج. تستند طريقة التقييم الدقيقة على ما إذا كان المقصود من المهمة الانحدار (Regression) أم التصنيف (Classification). في مثل مشكلات التصنيف المعروضة هنا، تُستخدم طرائق التقييم الشهيرة مثل: حساب دقة النموذج (Model's Accuracy) ومصفوفة الدقة (Confusion Matrix).• الدقة هي نسبة التنبؤات الصحيحة التي يقوم بها المصنف. تحقق دقة عالية قريبة من 100% يعني أن معظم التنبؤات التي يقوم بها المصنف صحيحة.• مصفوفة الدقة هي جدول يقارن بين القيم الحقيقية (الفعلية) وبين التنبؤات التي يقوم بها المصنف في مجموعة البيانات. يحتوي الجدول على صف واحد لكل قيمة صحيحة وعمود واحد لكل قيمة متوقعة. كل مدخل في المصفوفة يمثل عدد الحالات التي لها قيم فعلية ومتوقعة.# functions used to evaluate a classifier from sklearn.metrics import accuracy_score,confusion_matrix# drop the diagnosis column to get only the symptoms test_patient_symptoms=test_data.drop(columns=['diagnosis'])# get the diagnosis column, to be used as the classification target test_diagnoses=test_data['diagnosis']# guess the most likely diagnoses pred=my_tree.predict(test_patient_symptoms)# print the achieved accuracy score accuracy_score(test_diagnoses,pred)0.8166666666666667ستلاحظ أن شجرة القرار تُحقق دقة تصل إلى 81.6%. وهذا يعني أنه من بين 600 حالة تم اختبارها، شخصت الشجرة 490 منها بشكل صحيح. يمكنك كذلك طباعة مصفوفة الدقة للنموذج لتستعرض بشكل أفضل الأمثلة المصنفة بشكل خاطئ.confusion_matrix(test_diagnoses,pred)array([[143, 3, 0, 0],
[ 48, 98, 5, 4],
[ 2, 1, 127, 12],
[ 1, 3, 31, 122]])2025 - 1447--- VISUAL CONTEXT ---
**TABLE**: مصفوفة الدقة
Description: A 4x4 numerical array representing the confusion matrix, showing the counts of actual versus predicted classifications for a decision tree model.
Table Structure:
Headers: N/A Rows:
Row 1: 143 | 3 | 0 | 0
Row 2: 48 | 98 | 5 | 4
Row 3: 2 | 1 | 127 | 12
Row 4: 1 | 3 | 31 | 122
Calculation needed: Each cell (i, j) represents the number of samples that belong to actual class 'i' and were predicted as class 'j'. Diagonal elements are correct predictions, off-diagonal are incorrect.
Data: The matrix shows the distribution of predictions against actual values. For example, 143 instances of the first class were correctly predicted, while 48 instances of the second class were incorrectly predicted as the first class.
Key Values: 143 (true positive for class 1), 98 (true positive for class 2), 127 (true positive for class 3), 122 (true positive for class 4), 3 (false positive for class 1, actual class 2), 48 (false negative for class 1, actual class 2)
Context: This confusion matrix is used to evaluate the performance of the decision tree classifier, providing a detailed breakdown of correct and incorrect predictions for each class, which helps in understanding where the model performs well and where it struggles.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هو الهدف الرئيسي من استخدام مجموعة الاختبار (test set) عند تقييم نماذج الذكاء الاصطناعي؟
الإجابة: الهدف الرئيسي هو تقييم أداء النموذج على بيانات جديدة لم يرها من قبل، وذلك للحصول على تقدير واقعي لكيفية تعامله مع البيانات المستقبلية وتجنب مشكلة "التعلم الزائد" (Overfitting).
الشرح: مجموعة الاختبار تمثل السيناريو الحقيقي الذي سيتعامل معه النموذج. إذا كان النموذج جيدًا فقط على البيانات التي تدرب عليها، فلن يكون مفيدًا في الواقع. لذلك، تقييم أدائه على بيانات جديدة أمر حاسم.
تلميح: فكر في الغرض من اختبار أي نظام أو برنامج قبل نشره للاستخدام العام.
في سياق مشكلات التصنيف (Classification)، ما هي الطريقتان الشائعتان لتقييم أداء النموذج المذكورتان في النص؟
الإجابة: الطريقتان الشائعتان لتقييم أداء نموذج التصنيف هما: حساب دقة النموذج (Model's Accuracy) ومصفوفة الدقة (Confusion Matrix).
الشرح: الدقة تعطي فكرة عامة عن عدد التنبؤات الصحيحة، بينما مصفوفة الدقة توفر تفصيلاً أعمق عن أنواع الأخطاء التي يرتكبها النموذج لكل فئة.
تلميح: ابحث عن المصطلحات التي تقارن بين التنبؤات والقيم الفعلية.
كيف تُعرّف "دقة النموذج" (Model's Accuracy) في سياق مهام التصنيف؟
الإجابة: دقة النموذج هي نسبة التنبؤات الصحيحة التي يقوم بها المصنف (النموذج) مقارنةً بإجمالي عدد التنبؤات التي قام بها على مجموعة البيانات.
الشرح: الدقة تقيس مدى فعالية النموذج في التنبؤ بالفئة الصحيحة. دقة قريبة من 100% تعني أن النموذج يتنبأ بمعظم الحالات بشكل صحيح.
تلميح: فكر في نسبة النجاح الإجمالية.
ماذا تمثل مصفوفة الدقة (Confusion Matrix) في تقييم نماذج التصنيف؟
الإجابة: مصفوفة الدقة هي جدول يقارن بين القيم الحقيقية (الفعلية) للفئات وبين التنبؤات التي يقوم بها المصنف. كل مدخل في المصفوفة يمثل عدد الحالات التي لها قيم فعلية ومتوقعة، مما يسمح بفهم دقيق لمواطن القوة والضعف في أداء النموذج لكل فئة على حدة.
الشرح: تتكون مصفوفة الدقة من صف واحد لكل قيمة حقيقية وعمود واحد لكل قيمة متوقعة. الأرقام على القطر الرئيسي تمثل التنبؤات الصحيحة، بينما الأرقام خارج القطر تمثل الأخطاء (التنبؤ الخاطئ).
تلميح: تخيل جدولا يلخص أين أخطأ النموذج وأين أصاب، لكل فئة.
وفقًا للنص، إذا كان نموذج شجرة القرار يحقق دقة 81.6% على 600 حالة اختبار، فكم عدد الحالات التي شخصها النموذج بشكل صحيح؟
الإجابة: شخص النموذج 490 حالة بشكل صحيح. (81.6% من 600 = 0.816 * 600 = 489.6، والتي تقرب إلى 490).
الشرح: الدقة تمثل نسبة التنبؤات الصحيحة. بضرب هذه النسبة في إجمالي عدد الحالات، نحصل على عدد الحالات التي تم تشخيصها بشكل صحيح.
تلميح: استخدم النسبة المئوية المعطاة لحساب العدد الفعلي من إجمالي الحالات.