مشروع تصنيف النص باستخدام مكتبة سكيليرن - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: project

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

يقدم هذا المشروع عملية تصنيف النص باستخدام تقنيات التعلم الآلي في لغة البرمجة بايثون. تتكون العملية من خطوتين رئيسيتين: أولاً تدريب نموذج تصنيف باستخدام مجموعة بيانات تدريبية مع تصنيفات معروفة، ثم استخدام النموذج المدرب للتنبؤ بتصنيفات نصوص في مجموعة بيانات اختبار.

يتم تمثيل النصوص في كل من مجموعات التدريب والاختبار كمتجهات باستخدام أدوات مثل TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن. تقدم المكتبة عدة نماذج تصنيف متاحة للاستخدام مثل GradientBoostingClassifier وDecisionTreeClassifier وRandomForestClassifier.

يتضمن المشروع تطبيق عملي باستخدام مجموعة بيانات IMDb، حيث يتم تدريب نماذج مختلفة ومقارنة دقتها على مجموعة بيانات الاختبار. يتطلب المشروع استبدال نموذج MultinomialNB بنماذج أخرى، وإعادة تشغيل الكود لحساب دقة كل نموذج، وإنشاء تقرير مقارنة لتحديد النموذج الأكثر دقة.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

المشروع

نوع: محتوى تعليمي

المشروع

نوع: محتوى تعليمي

تصنيف النص هو عملية مكونة من خطوتين تشمل:
الخطوة الأولى: استخدام مجموعة من نصوص التدريب ذات القيم (التصنيفات) المعروفة لتدريب نموذج التصنيف.
الخطوة الثانية: استخدام نموذج التدريب للتنبؤ بالقيم لكل نص في مجموعة بيانات الاختبار. القيم في مجموعة بيانات الاختبار إما غير معروفة أو مخبأة وتستخدم لاحقًا في عملية التحقق.

نوع: محتوى تعليمي

يجب تمثيل النصوص في كل من مجموعات بيانات التدريب والاختبار بالمتجهات قبل استخدامها. تُستخدم أدوات TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن (Sklearn) في البرمجة الاتجاهية.

نوع: محتوى تعليمي

تقدم مكتبة سكيليرن (Sklearn) في لغة البايثون قائمة طويلة من نماذج التصنيف، مثل:
GradientBoostingClassifier()
DecisionTreeClassifier()
RandomForestClassifier()

نوع: محتوى تعليمي

مهمتك هي استخدام مجموعة بيانات التدريب IMDb المستخدمة في هذا الدرس لتدريب النموذج الذي يحقق أعلى درجة من الدقة على مجموعة بيانات الاختبار (imdb_data/imdb_test.csv). يمكنك تحقيق ذلك عبر:

1

نوع: QUESTION

1 استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن الموضحة بالأعلى.

2

نوع: QUESTION

2 إعادة تشغيل المفكرة التفاعلية لديك بعد الاستبدال، لحساب دقة كل نموذج جديد بعد تجربته.

3

نوع: QUESTION

3 إنشاء تقرير للمقارنة بين دقة كل النماذج التي جربتها وتحديد النموذج الذي حقق نتائج دقيقة.

نوع: METADATA

192

🔍 عناصر مرئية

Project Icon

A stylized black and white icon resembling a camera or projector, positioned above and to the right of the 'المشروع' title, visually representing the concept of a project or presentation.

📄 النص الكامل للصفحة

المشروع تصنيف النص هو عملية مكونة من خطوتين تشمل:
الخطوة الأولى: استخدام مجموعة من نصوص التدريب ذات القيم (التصنيفات) المعروفة لتدريب نموذج التصنيف.
الخطوة الثانية: استخدام نموذج التدريب للتنبؤ بالقيم لكل نص في مجموعة بيانات الاختبار. القيم في مجموعة بيانات الاختبار إما غير معروفة أو مخبأة وتستخدم لاحقًا في عملية التحقق.يجب تمثيل النصوص في كل من مجموعات بيانات التدريب والاختبار بالمتجهات قبل استخدامها. تُستخدم أدوات TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن (Sklearn) في البرمجة الاتجاهية.تقدم مكتبة سكيليرن (Sklearn) في لغة البايثون قائمة طويلة من نماذج التصنيف، مثل:
GradientBoostingClassifier()
DecisionTreeClassifier()
RandomForestClassifier()مهمتك هي استخدام مجموعة بيانات التدريب IMDb المستخدمة في هذا الدرس لتدريب النموذج الذي يحقق أعلى درجة من الدقة على مجموعة بيانات الاختبار (imdb_data/imdb_test.csv). يمكنك تحقيق ذلك عبر:--- SECTION: 1 --- 1 استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن الموضحة بالأعلى.--- SECTION: 2 --- 2 إعادة تشغيل المفكرة التفاعلية لديك بعد الاستبدال، لحساب دقة كل نموذج جديد بعد تجربته.--- SECTION: 3 --- 3 إنشاء تقرير للمقارنة بين دقة كل النماذج التي جربتها وتحديد النموذج الذي حقق نتائج دقيقة.--- VISUAL CONTEXT ---
**IMAGE**: Project Icon Description: A stylized black and white icon resembling a camera or projector, positioned above and to the right of the 'المشروع' title, visually representing the concept of a project or presentation.
Context: Serves as a visual identifier for the 'Project' section.

📝 أسئلة اختبارية

عدد الأسئلة: 3

سؤال 1: استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن الموضحة بالأعلى.

أ) استخدام GradientBoostingClassifier()
ب) استخدام DecisionTreeClassifier()
ج) استخدام RandomForestClassifier()
د) الاحتفاظ بـ MultinomialNB

الإجابة الصحيحة: يجب استبدال MultinomialNB بنماذج مثل GradientBoostingClassifier() أو DecisionTreeClassifier() أو RandomForestClassifier() من مكتبة sklearn

الشرح: المطلوب هو تغيير نموذج التصنيف في الكود من MultinomialNB إلى أحد النماذج الأخرى المذكورة في النص لتحسين الدقة.

تلميح: راجع قائمة نماذج التصنيف المذكورة في النص واختر واحدًا منها.

سؤال 2: إعادة تشغيل المفكرة التفاعلية لديك بعد الاستبدال، لحساب دقة كل نموذج جديد بعد تجربته.

أ) تشغيل الكود مرة واحدة فقط
ب) تشغيل الكود وتسجيل الدقة لكل نموذج
ج) تخطي حساب الدقة
د) استخدام مجموعة التدريب فقط

الإجابة الصحيحة: تشغيل الكود بعد استبدال النموذج وتسجيل دقة التصنيف على مجموعة الاختبار imdb_test.csv

الشرح: بعد تغيير النموذج في الكود، يجب تشغيله لحساب الدقة باستخدام دالة مثل accuracy_score من sklearn.

تلميح: تأكد من تحميل مجموعة بيانات الاختبار وحساب الدقة بشكل صحيح.

سؤال 3: إنشاء تقرير للمقارنة بين دقة كل النماذج التي جربتها وتحديد النموذج الذي حقق نتائج دقيقة.

أ) تجاهل المقارنة
ب) مقارنة الدقة وتحديد الأفضل
ج) اختيار نموذج عشوائيًا
د) استخدام متوسط الدقة فقط

الإجابة الصحيحة: إنشاء جدول أو قائمة بمقارنة دقة النماذج المختبرة وتحديد النموذج ذو أعلى دقة

الشرح: يجب تجميع نتائج الدقة من الخطوة السابقة ومقارنتها لتحديد أفضل نموذج بناءً على أعلى دقة.

تلميح: استخدم وسيلة عرض مناسبة مثل جدول أو رسم بياني للمقارنة.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي الخطوات الأساسية في عملية المشروع لتصنيف النصوص؟

الإجابة: الخطوة الأولى: تدريب نموذج التصنيف باستخدام مجموعة من نصوص التدريب ذات التصنيفات المعروفة. الخطوة الثانية: استخدام نموذج التدريب للتنبؤ بتصنيفات نصوص مجموعة بيانات الاختبار.

الشرح: يشرح هذا السؤال عملية المشروع بالتفصيل، حيث يتم تقسيمها إلى مرحلة تدريب النموذج وتحديد تصنيفاته، ثم مرحلة تقييم أداء النموذج على بيانات جديدة.

تلميح: فكر في المراحل التي يمر بها أي نموذج تعلم آلي قبل استخدامه للتنبؤ.

ما هي الأدوات المستخدمة لتمثيل النصوص في مجموعات بيانات التدريب والاختبار بالمتجهات؟

الإجابة: تُستخدم أدوات TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن (Sklearn) في البرمجة الاتجاهية.

الشرح: توضح هذه البطاقة أهمية تحويل النصوص إلى متجهات رقمية لتتمكن خوارزميات التعلم الآلي من معالجتها، وتقدم الأدوات الشائعة لتحقيق ذلك.

تلميح: ما هي التقنيات التي تحول النصوص إلى صيغة رقمية يمكن للنماذج فهمها؟

اذكر ثلاثة نماذج تصنيف متاحة في مكتبة سكيليرن (Sklearn) يمكن استخدامها في المشروع.

الإجابة: GradientBoostingClassifier(), DecisionTreeClassifier(), RandomForestClassifier().

الشرح: هذه البطاقة تستعرض بعض نماذج التصنيف الشائعة والمتوفرة في مكتبة Sklearn، والتي يمكن للطالب استخدامها لتجربة أداء مختلف في المشروع.

تلميح: ابحث عن أنواع الخوارزميات التي تستخدم لاتخاذ القرارات بناءً على البيانات.

ما هو الهدف الرئيسي من المشروع المذكور في الصفحة؟

الإجابة: استخدام مجموعة بيانات التدريب IMDb لتدريب نموذج يحقق أعلى درجة من الدقة على مجموعة بيانات الاختبار (imdb_data/imdb_test.csv)، وذلك عبر استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن.

الشرح: تحدد هذه البطاقة الهدف العام للمشروع، والذي يتمثل في مقارنة أداء نماذج تصنيف مختلفة على مجموعة بيانات محددة للوصول إلى النموذج الأكثر دقة.

تلميح: فكر في ما يُطلب من الطالب إنجازه كناتج نهائي لهذا المشروع.

ما هي الخطوات الثلاث التي يجب على الطالب اتباعها لإكمال المشروع؟

الإجابة: 1. استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن. 2. إعادة تشغيل المفكرة التفاعلية لحساب دقة كل نموذج جديد. 3. إنشاء تقرير للمقارنة بين دقة النماذج وتحديد الأفضل.

الشرح: تقدم هذه البطاقة الخطوات العملية والتوجيهات المباشرة للطالب لتنفيذ المشروع بنجاح، بدءًا من تعديل الكود وحتى تقديم النتائج.

تلميح: ما هي التعليمات الإجرائية التي توجه الطالب خلال تنفيذ المشروع؟