تقييم أداء خط أنابيب التصنيف النصي - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: example

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تتناول هذه الصفحة تقييم أداء خط أنابيب تصنيف النصوص باستخدام مجموعة بيانات IMDb. يبدأ المحتوى بشرح كيفية استخدام الدالة `predict_proba()` للحصول على احتمالات التصنيف لتقييمين نصيين، حيث يُظهر التقييم الأول احتمال 91.7% للإيجابية و8.3% للسلبية، بينما يُظهر التقييم الثاني احتمال 83.1% للسلبية و16.8% للإيجابية.

يتم توضيح هذه النتائج بشكل مرئي من خلال مخططين دائريين يوضحان النسب المئوية للتقييمين، مما يساعد في فهم توزيع الاحتمالات بشكل بديهي. ثم ينتقل المحتوى إلى اختبار دقة خط الأنابيب على مجموعة بيانات الاختبار الكاملة باستخدام الدالة `predict()` للحصول على توقعات التصنيف.

يختتم المحتوى بمناقشة أدوات تقييم أداء التصنيف المتاحة في بايثون، بما في ذلك دقة التصنيف (`accuracy_score`) ومصفوفة الدقة (Confusion Matrix)، مع ذكر مقاييس التقييم الأخرى مثل الدقة والاستدعاء والنوعية والحساسية ومقياس F1-score. يتم تقديم مثال عملي لحساب دقة التنبؤ التي تبلغ حوالي 84.68% لمجموعة البيانات المختبرة.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

يتنبأ خط الأنابيب بشكل صحيح بالقيمة الإيجابية للتقييم الأول والقيمة السلبية للتقييم الثاني. يمكن استخدام الدالة المضمنة ()predict_proba لتحديد جميع الاحتمالات التي يقوم خط الأنابيب بتخصيصها لكل واحدة من القيمتين المحتملتين. العنصر الأول هو احتمال تعيين 0 والعنصر الثاني هو احتمال تعيين 1:

نوع: محتوى تعليمي

prediction_pipeline_v1.predict_proba(['One of the best movies of the year. Excellent cast and very interesting plot.', 'I was very disappointed with his film. I lost all interest after 30 minutes'])

نوع: محتوى تعليمي

array([[0.08310769, 0.91689231], [0.83173475, 0.16826525]])

نوع: محتوى تعليمي

النموذج يؤكد بنسبة 8.3% أن التقييم الأول سلبي، بينما يؤكد بنسبة 91.7% أنه إيجابي. وبالمثل، يؤكد النموذج بنسبة 83.1% أن التقييم الثاني سلبي، بينما يؤكد بنسبة 16.8% أنه إيجابي.

نوع: FIGURE_REFERENCE

شكل 3.7: مخططات دائريان يوضحان النسب المئوية للتقييمين

نوع: محتوى تعليمي

الخطوة التالية هي اختبار دقة خط الأنابيب الجديد في تصنيف التقييمات في مجموعة بيانات اختبار IMDb. المخرج هو مصفوفة تشمل جميع قيم نتائج تصنيف التقييمات الواردة في بيانات الاختبار:

نوع: محتوى تعليمي

# use the pipeline to predict the labels of the testing data.
predictions_v1 = prediction_pipeline_v1.predict(X_test_text) # vectorize the text data, then predict.
predictions_v1

نوع: محتوى تعليمي

array([[0, 0, 0, ..., 0, 0, 0]], dtype=int64)

نوع: محتوى تعليمي

توفر لغة البايثون العديد من الأدوات لتحليل وتصوير نتائج خطوط أنابيب التصنيف. تشمل الأمثلة دالة ()accuracy_score من مكتبة سكيليرن وتمثيل مصفوفة الدقة (Confusion Matrix) من مكتبة سايكيت بلوت (Scikit-Plot). وهناك مقاييس تقييم أخرى مثل: الدقة، والاستدعاء، والنوعية، والحساسية، ومقياس درجة F1. وفقًا لحالة الاستخدام التي يمكن حسابها من مصفوفة الدقة. المخرج التالي هو تقريب دقيق لدرجة التنبؤ:

نوع: محتوى تعليمي

from sklearn.metrics import accuracy_score
accuracy_score(Y_test, predictions_v1) # get the achieved accuracy.

نوع: محتوى تعليمي

0.8468

نوع: METADATA

وزارة التعليم
Ministry of Education
2025 - 1447

نوع: METADATA

140

🔍 عناصر مرئية

شكل 3.7: مخططات دائريان يوضحان النسب المئوية للتقييمين

Two pie charts illustrating the percentage distribution of positive and negative sentiments for two different evaluations (reviews). The right chart is for the 'First Evaluation' and the left chart is for the 'Second Evaluation'.

📄 النص الكامل للصفحة

يتنبأ خط الأنابيب بشكل صحيح بالقيمة الإيجابية للتقييم الأول والقيمة السلبية للتقييم الثاني. يمكن استخدام الدالة المضمنة ()predict_proba لتحديد جميع الاحتمالات التي يقوم خط الأنابيب بتخصيصها لكل واحدة من القيمتين المحتملتين. العنصر الأول هو احتمال تعيين 0 والعنصر الثاني هو احتمال تعيين 1:prediction_pipeline_v1.predict_proba(['One of the best movies of the year. Excellent cast and very interesting plot.', 'I was very disappointed with his film. I lost all interest after 30 minutes'])array([[0.08310769, 0.91689231], [0.83173475, 0.16826525]])النموذج يؤكد بنسبة 8.3% أن التقييم الأول سلبي، بينما يؤكد بنسبة 91.7% أنه إيجابي. وبالمثل، يؤكد النموذج بنسبة 83.1% أن التقييم الثاني سلبي، بينما يؤكد بنسبة 16.8% أنه إيجابي.شكل 3.7: مخططات دائريان يوضحان النسب المئوية للتقييمين الخطوة التالية هي اختبار دقة خط الأنابيب الجديد في تصنيف التقييمات في مجموعة بيانات اختبار IMDb. المخرج هو مصفوفة تشمل جميع قيم نتائج تصنيف التقييمات الواردة في بيانات الاختبار:# use the pipeline to predict the labels of the testing data.
predictions_v1 = prediction_pipeline_v1.predict(X_test_text) # vectorize the text data, then predict.
predictions_v1array([[0, 0, 0, ..., 0, 0, 0]], dtype=int64)توفر لغة البايثون العديد من الأدوات لتحليل وتصوير نتائج خطوط أنابيب التصنيف. تشمل الأمثلة دالة ()accuracy_score من مكتبة سكيليرن وتمثيل مصفوفة الدقة (Confusion Matrix) من مكتبة سايكيت بلوت (Scikit-Plot). وهناك مقاييس تقييم أخرى مثل: الدقة، والاستدعاء، والنوعية، والحساسية، ومقياس درجة F1. وفقًا لحالة الاستخدام التي يمكن حسابها من مصفوفة الدقة. المخرج التالي هو تقريب دقيق لدرجة التنبؤ:from sklearn.metrics import accuracy_score accuracy_score(Y_test, predictions_v1) # get the achieved accuracy.0.84682025 - 1447--- VISUAL CONTEXT ---
**PIE_CHART**: شكل 3.7: مخططات دائريان يوضحان النسب المئوية للتقييمين
Description: Two pie charts illustrating the percentage distribution of positive and negative sentiments for two different evaluations (reviews). The right chart is for the 'First Evaluation' and the left chart is for the 'Second Evaluation'.
Data: The right pie chart, labeled 'التقييم الأول' (First Evaluation), shows 91.6% as 'إيجابي' (positive, green sector) and 8.3% as 'سلبي' (negative, pink sector). The left pie chart, labeled 'التقييم الثاني' (Second Evaluation), shows 16.8% as 'إيجابي' (positive, green sector) and 83.1% as 'سلبي' (negative, pink sector).
Key Values: التقييم الأول: إيجابي 91.6%, التقييم الأول: سلبي 8.3%, التقييم الثاني: إيجابي 16.8%, التقييم الثاني: سلبي 83.1%
Context: These charts visually represent the predicted probabilities of two text reviews being classified as positive or negative, as discussed in the preceding text and code output, demonstrating the output of a classification pipeline.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ماذا تُستخدم الدالة predict_proba في خطوط أنابيب التصنيف؟

الإجابة: تُستخدم الدالة predict_proba لتحديد جميع الاحتمالات التي يقوم خط الأنابيب بتخصيصها لكل قيمة محتملة للتصنيف (مثل احتمالية أن يكون التقييم إيجابياً أو سلبياً).

الشرح: تسمح predict_proba للمستخدم بفهم توزيع الاحتمالات وراء تنبؤات النموذج، مما يوفر رؤية أعمق من مجرد التنبؤ النهائي.

تلميح: فكر في الغرض من معرفة مدى ثقة النموذج في تصنيفاته.

عند استخدام predict_proba، ما الذي يمثله العنصر الأول في المصفوفة الناتجة؟

الإجابة: يمثل العنصر الأول في المصفوفة الناتجة عن predict_proba احتمالية تعيين الفئة الأولى (عادةً ما تكون الفئة السلبية، ممثلة بالرقم 0).

الشرح: في معظم نماذج التصنيف، يتم ترتيب الفئات بترتيب معين. الرقم 0 يمثل عادةً الفئة الأولى (سلبية)، والرقم 1 يمثل الفئة الثانية (إيجابية).

تلميح: تذكر ترتيب الفئات في مخرجات نماذج التصنيف القياسية.

ما هو الغرض من استخدام الدالة accuracy_score من مكتبة scikit-learn؟

الإجابة: تُستخدم الدالة accuracy_score لحساب دقة نموذج التصنيف، وهي نسبة التنبؤات الصحيحة من إجمالي عدد التنبؤات.

الشرح: الدقة هي مقياس رئيسي يقيم مدى جودة أداء النموذج في تصنيف البيانات بشكل صحيح.

تلميح: فكر في المقياس الأكثر شيوعًا لتقييم نماذج التصنيف.

ما هي مصفوفة الدقة (Confusion Matrix)؟

الإجابة: مصفوفة الدقة هي جدول يلخص أداء نموذج التصنيف، حيث توضح عدد التنبؤات الصحيحة والخاطئة لكل فئة.

الشرح: توفر مصفوفة الدقة رؤية شاملة لنتائج التصنيف، بما في ذلك الإيجابيات الحقيقية، السلبيات الحقيقية، الإيجابيات الكاذبة، والسلبيات الكاذبة.

تلميح: فكر في جدول يوضح نتائج التصنيف بالتفصيل مقارنة بالقيم الحقيقية.

اذكر بعض مقاييس التقييم الأخرى التي يمكن حسابها من مصفوفة الدقة، بخلاف الدقة (Accuracy).

الإجابة: من مقاييس التقييم الأخرى: الدقة (Precision)، الاستدعاء (Recall)، النوعية (Specificity)، الحساسية (Sensitivity)، ومقياس درجة F1.

الشرح: هذه المقاييس توفر رؤى أعمق حول أداء النموذج، خاصة عند التعامل مع مجموعات بيانات غير متوازنة، حيث قد لا تكون الدقة وحدها كافية.

تلميح: فكر في الجوانب المختلفة التي يمكن أن تقيّم أداء نموذج التصنيف، والتي لا تقتصر على الدقة الكلية.