تحليل أداء نموذج التصنيف باستخدام مصفوفة الدقة - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: example

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تقدم هذه الصفحة شرحًا تفصيليًا لمصفوفة الدقة (Confusion Matrix) كأداة أساسية لتقييم أداء نماذج التصنيف الثنائي في التعلم الآلي. تبدأ الصفحة بكود برمجي بلغة Python يستخدم مكتبة scikit-plot لرسم مصفوفة الدقة، حيث يتم تصنيف البيانات إلى فئتين: 'neg' (سالبة) و'pos' (موجبة).

يتم شرح مكونات مصفوفة الدقة 2×2 التي تحتوي على أربع خلايا تمثل: التنبؤات السالبة الصحيحة (True Negatives)، التنبؤات السالبة الخاطئة (False Positives)، التنبؤات الموجبة الخاطئة (False Negatives)، والتنبؤات الموجبة الصحيحة (True Positives). توفر الصفحة مثالًا عمليًا بقيم محددة: 2164 للتنبؤات السالبة الصحيحة، 331 للتنبؤات السالبة الخاطئة، 435 للتنبؤات الموجبة الخاطئة، و2070 للتنبؤات الموجبة الصحيحة.

يتم شرح كيفية حساب الدقة (Accuracy) كنسبة التنبؤات الصحيحة إلى إجمالي التنبؤات، مع تطبيق عملي يظهر أن النموذج يحقق دقة 84.68% مع وجود 766 تنبؤًا خاطئًا. تشير الصفحة إلى أهمية تحليل سلوك خط أنابيب التنبؤ لفهم كيفية معالجة النص وتحسين الأداء.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

%%capture
!pip install scikit-plot; # install the scikit-plot library, if it is missing.
import scikitplot; # import the library

class_names=['neg', 'pos'] # pick intuitive names for the 0 and 1 labels.

# plot the confusion matrix.
scikitplot.metrics.plot_confusion_matrix(
    [class_names[i] for i in Y_test],
    [class_names[i] for i in predictions_v1],
    title="Confusion Matrix", # title to use
    cmap="Purples", # color palette to use
    figsize=(5,5) # figure size
);

نوع: FIGURE_REFERENCE

القيم الحقيقية.

نوع: FIGURE_REFERENCE

القيم المتوقعة.

نوع: محتوى تعليمي

تحتوي مصفوفة الدقة على عدد التصنيفات الحقيقية مقابل المتوقعة. في مهمة التصنيف الثنائية (مثل: مسألة احتواء قيمتين، الموجودة في مهمة IMDb)، ستحتوي مصفوفة الدقة على أربع خلايا:

نوع: محتوى تعليمي

التنبؤات السالبة الصحيحة (أعلى اليسار):
عدد المرات التي تنبأ فيها المصنف بالحالات السالبة بشكل صحيح.

نوع: محتوى تعليمي

التنبؤات السالبة الخاطئة (أعلى اليمين):
عدد المرات التي تنبأ فيها المصنف بالحالات السالبة بشكل خاطئ.

نوع: محتوى تعليمي

التنبؤات الموجبة الخاطئة (أسفل اليسار):
عدد المرات التي تنبأ فيها المصنف بالحالات الموجبة بشكل خاطئ.

نوع: محتوى تعليمي

التنبؤات الموجبة الصحيحة (أسفل اليمين):
عدد المرات التي تنبأ فيها المصنف بالحالات الموجبة بشكل صحيح.

شكل 3.8: نتائج مصفوفة الدقة بتطبيق مصنف بايز الساذج على بيانات الاختبار باستخدام مجموعة بيانات IMDb

نوع: FIGURE_REFERENCE

الدقة (Accuracy)

نوع: محتوى تعليمي

الدقة هي نسبة التنبؤات الصحيحة إلى إجمالي عدد التنبؤات.

نوع: محتوى تعليمي

الدقة = (التنبؤات الموجبة الصحيحة + التنبؤات السالبة الصحيحة) / (التنبؤات الموجبة الصحيحة + التنبؤات السالبة الصحيحة + التنبؤات الموجبة الخاطئة + التنبؤات السالبة الخاطئة)

نوع: محتوى تعليمي

تُظهر النتائج أنه على الرغم من أن خط الأنابيب الأول يحقق دقة تنافسية تصل إلى 84.68%، إلا أنه لا يزال يُخطئ في تصنيف مئات التقييمات. فهناك 331 تنبؤًا غير صحيح في الربع الأيمن العلوي و 435 تنبؤًا غير صحيح في الربع الأيسر السفلي، بإجمالي 766 تنبؤًا غير صحيح. الخطوة الأولى نحو تحسين الأداء هي دراسة سلوك خط أنابيب التنبؤ، لمعرفة كيف يقوم بمعالجة النص وفهمه.

نوع: METADATA

وزارة التعليم
Ministry of Education
141
2025 - 1447

🔍 عناصر مرئية

Confusion Matrix

A 2x2 matrix visualizing the performance of a classification algorithm. It shows the counts of correct and incorrect predictions compared to the true labels. The x-axis represents the 'Predicted label' (neg, pos) and the y-axis represents the 'True label' (neg, pos).

📄 النص الكامل للصفحة

%%capture
!pip install scikit-plot; # install the scikit-plot library, if it is missing.
import scikitplot; # import the library class_names=['neg', 'pos'] # pick intuitive names for the 0 and 1 labels.# plot the confusion matrix.
scikitplot.metrics.plot_confusion_matrix(
[class_names[i] for i in Y_test],
[class_names[i] for i in predictions_v1],
title="Confusion Matrix", # title to use cmap="Purples", # color palette to use figsize=(5,5) # figure size
);القيم الحقيقية.القيم المتوقعة.تحتوي مصفوفة الدقة على عدد التصنيفات الحقيقية مقابل المتوقعة. في مهمة التصنيف الثنائية (مثل: مسألة احتواء قيمتين، الموجودة في مهمة IMDb)، ستحتوي مصفوفة الدقة على أربع خلايا:التنبؤات السالبة الصحيحة (أعلى اليسار):
عدد المرات التي تنبأ فيها المصنف بالحالات السالبة بشكل صحيح.التنبؤات السالبة الخاطئة (أعلى اليمين):
عدد المرات التي تنبأ فيها المصنف بالحالات السالبة بشكل خاطئ.التنبؤات الموجبة الخاطئة (أسفل اليسار):
عدد المرات التي تنبأ فيها المصنف بالحالات الموجبة بشكل خاطئ.التنبؤات الموجبة الصحيحة (أسفل اليمين):
عدد المرات التي تنبأ فيها المصنف بالحالات الموجبة بشكل صحيح.الدقة هي نسبة التنبؤات الصحيحة إلى إجمالي عدد التنبؤات.الدقة = (التنبؤات الموجبة الصحيحة + التنبؤات السالبة الصحيحة) / (التنبؤات الموجبة الصحيحة + التنبؤات السالبة الصحيحة + التنبؤات الموجبة الخاطئة + التنبؤات السالبة الخاطئة)تُظهر النتائج أنه على الرغم من أن خط الأنابيب الأول يحقق دقة تنافسية تصل إلى 84.68%، إلا أنه لا يزال يُخطئ في تصنيف مئات التقييمات. فهناك 331 تنبؤًا غير صحيح في الربع الأيمن العلوي و 435 تنبؤًا غير صحيح في الربع الأيسر السفلي، بإجمالي 766 تنبؤًا غير صحيح. الخطوة الأولى نحو تحسين الأداء هي دراسة سلوك خط أنابيب التنبؤ، لمعرفة كيف يقوم بمعالجة النص وفهمه.2025 - 1447--- VISUAL CONTEXT ---
**DIAGRAM**: Confusion Matrix Description: A 2x2 matrix visualizing the performance of a classification algorithm. It shows the counts of correct and incorrect predictions compared to the true labels. The x-axis represents the 'Predicted label' (neg, pos) and the y-axis represents the 'True label' (neg, pos).
X-axis: Predicted label Y-axis: True label Data: The matrix contains four cells with numerical values:
- Top-Left (True Negatives): 2164, representing instances where the true label was 'neg' and the predicted label was 'neg'.
- Top-Right (False Positives): 331, representing instances where the true label was 'neg' but the predicted label was 'pos'.
- Bottom-Left (False Negatives): 435, representing instances where the true label was 'pos' but the predicted label was 'neg'.
- Bottom-Right (True Positives): 2070, representing instances where the true label was 'pos' and the predicted label was 'pos'.A vertical color bar on the right indicates the intensity of the counts, ranging from approximately 400 (light blue) to 2000 (dark blue), with major ticks at 500, 750, 1000, 1250, 1500, 1750, and 2000.
Key Values: True Negatives: 2164, False Positives: 331, False Negatives: 435, True Positives: 2070
Context: This confusion matrix is a fundamental tool in machine learning for evaluating the performance of a binary classification model. It visually represents the counts of true positive, true negative, false positive, and false negative predictions, which are then used to calculate metrics like accuracy, precision, recall, and F1-score. The surrounding text explains each component of the matrix and its relevance to the overall accuracy calculation.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هو الغرض الرئيسي من مصفوفة الدقة (Confusion Matrix) في مهام التصنيف الثنائي؟

الإجابة: الغرض الرئيسي لمصفوفة الدقة هو تقييم أداء نموذج التصنيف بشكل مفصل من خلال عرض عدد التنبؤات الصحيحة والخاطئة لكل فئة.

الشرح: توضح مصفوفة الدقة بشكل صريح أنواع الأخطاء التي يرتكبها النموذج (مثل الإيجابيات الخاطئة والسلبيات الخاطئة)، مما يساعد في تشخيص نقاط الضعف وتحسين الأداء.

تلميح: فكر في كيف تساعدنا هذه المصفوفة على فهم أداء النموذج بشكل يتجاوز مجرد نسبة النجاح الإجمالية.

في سياق مصفوفة الدقة، ماذا تمثل القيم الموجودة في الزاوية العلوية اليسرى (True Negatives)؟

الإجابة: تمثل القيم في الزاوية العلوية اليسرى عدد الحالات التي تنبأ فيها النموذج بأنها سالبة (neg) وكانت بالفعل سالبة.

الشرح: يشير هذا الجزء من المصفوفة إلى قدرة النموذج على التعرف الصحيح على الحالات التي لا تنتمي إلى الفئة الموجبة.

تلميح: ماذا يعني أن يكون التنبؤ صحيحاً للفئة السالبة؟

ماذا تعني 'التنبؤات الموجبة الخاطئة' (False Positives) في مصفوفة الدقة، وكيف يتم حسابها؟

الإجابة: التنبؤات الموجبة الخاطئة (False Positives) هي الحالات التي تنبأ فيها النموذج بأنها موجبة (pos) بينما كانت في الواقع سالبة (neg). يتمثل هذا في الخلية الموجودة أسفل اليسار في مصفوفة الدقة.

الشرح: هذا النوع من الأخطاء مهم في سيناريوهات مثل اكتشاف الإنذارات الكاذبة، حيث يكون الخطر في إطلاق إنذار خاطئ.

تلميح: فكر في الموقف الذي يعتقد فيه النموذج وجود شيء ما، ولكنه في الواقع غير موجود.

كيف تُحسب نسبة الدقة (Accuracy) الإجمالية لنموذج التصنيف باستخدام مكونات مصفوفة الدقة؟

الإجابة: الدقة تُحسب بقسمة مجموع التنبؤات الموجبة الصحيحة (True Positives) والتنبؤات السالبة الصحيحة (True Negatives) على إجمالي عدد التنبؤات.

الشرح: الدقة هي مقياس عام لعدد التنبؤات الصحيحة التي قام بها النموذج من إجمالي عدد التنبؤات. الدقة = (TP + TN) / (TP + TN + FP + FN).

تلميح: ما هي جميع الحالات التي نجح فيها النموذج في التنبؤ بشكل صحيح؟

وفقًا للنتائج المذكورة، ما هو إجمالي عدد التنبؤات غير الصحيحة التي قام بها الخط الأنابيب الأول، وكيف تم التوصل إلى هذا الرقم؟

الإجابة: بلغ إجمالي عدد التنبؤات غير الصحيحة 766 تنبؤًا. تم التوصل إلى هذا الرقم بجمع عدد التنبؤات السالبة الخاطئة (False Positives) وعدد التنبؤات الموجبة الخاطئة (False Negatives)، وهما 331 و 435 على التوالي.

الشرح: يشير هذا العدد الكبير من الأخطاء إلى أن هناك مجالًا للتحسين في أداء النموذج، وأن الخطوة التالية يجب أن تركز على فهم آلية معالجة النص وفهمه.

تلميح: ما هي مكونات مصفوفة الدقة التي تمثل الأخطاء؟